search
尋找貓咪~QQ 地點 桃園市桃園區 Taoyuan , Taoyuan

中學生科學素質讀本(二十九)

什麼是大數據做不了的?

你相信谷歌搜索引擎可以預測流感爆發嗎?2008年11月,谷歌的科研團隊發現,在流感高發期,以「流感」為關鍵詞的在線檢索量會大大增加。因此,通過計算在線檢索行為的頻率,就可以預測世界上不同國家和地區的流感爆發程度,於是谷歌科研團隊在2009年2月的科學雜誌《自然》中發表了《使用搜索引擎查詢數據監測流感疫情》的研究成果。

用搜索引擎預測流感少不了大數據的功勞,那麼大數據是萬能的嗎?答案是否定的,大數據也有做不了的事情。

首先,雖然大數據可以處理龐大的數據源,但是它的精確性卻大打折扣,混雜性和模糊性佔了上風。例如,谷歌翻譯是利用大數據的語義相關性進行自動翻譯的工具,可是翻譯結果有時卻令人哭笑不得。

其次,大數據的預測功能並不是完全可靠的,我們並不能用大數據預測明天哪一隻股票會飄紅。有句老話叫做「天有不測風雲」,任何一項因素都可能會影響結果,甚至會出現「差之毫釐,謬以千里」的情況。

第三,大數據的優勢在於分析兩組數據的相關性,卻很難分析其因果性。例如,一家超市經過數據分析發現,生鮮食品的銷量與時間周期是有相關性的,但究竟是什麼原因導致這種結果,卻很難找到答案。

大數據研究現在還處於起步階段,我們可以藉助它進行初步的統計與預測工作,卻不能完全依賴它做出決策。但大數據的確是一個有效的工具,如果利用好它,我們就可以達到事半功倍的效果。

科學媒介中心(Science Media Center)秉承著全球視野,時代高度,歷史縱深,科技前沿的理念,致力於傳播科學共同體權威,理性,及時,準確的聲音,並為廣大科技工作者搭建科學傳播的平台。



熱門推薦

本文由 yidianzixun 提供 原文連結

寵物協尋 相信 終究能找到回家的路
寫了7763篇文章,獲得2次喜歡
留言回覆
回覆
精彩推薦