search
尋找貓咪~QQ 地點 桃園市桃園區 Taoyuan , Taoyuan

對於大數據,這些認識上的bug你必須要知道

雖然大數據的發展(包括新型的非結構化數據和數據分析工具)正影響著各行各業,但關於大數據也有一些誤解。

我把這個誤解稱為神奇的演算法。有關大數據的早期報道造成了一種假象:要想打造智能城市和企業,只要將功能最強大的電腦湊在一起,讓它們去分析手頭上的非結構化數據,找出規律,其中的商業洞見自然會浮現出來。但事實上,數據分析並不是這樣完成的。

除了機器的運算,要使大數據發生效用還需要許多人力專家的參與,這是因為:數據的質量和準確性相當重要。數據是怎樣收集的?誤差率如何?樣本是否有代表性?如果進行比對,不同的資料庫中數據格式是否相同?因此,數據處理中的許多工作還需要人工操作,其中的尺度計算機很難拿捏。

受編程人員的主觀影響,數據分析的演算法也會出現各種偏差。比如,某個程序可以幫助企業篩選出最佳應聘者的簡歷,但是基於過去招聘經歷的篩選結果並不一定能滿足公司未來所需要的技能。

更重要的是,管理者需要提出關於數據的對的問題。公司現階段最關心的結果是什麼?數據呈現的哪些模式可以直接為公司所用?演算法在尋找答案方面越來越遊刃有餘,但關鍵還要知道尋找什麼問題的答案,這需要人來提出恰當的問題。凱撒娛樂的首席商務官塔里克·肖卡特曾這樣說:「如果僅關注數據,那你可能將一無所獲。我總是提醒我的團隊去思考,你想要回答什麼問題。」

誤解二:相關分析至上

發現一種模式往往是不夠的。許多評論家一再指出,有了大數據,數據科學再也不需要考慮因果關係,只關注相關關係即可。這種觀點的潛在邏輯在於,通過大數據分析得到的規律近乎事實,無須再依賴人們所認知的因果判斷。

顯然這種觀點是不可取的。管理者需要分清簡單的相關分析和因果分析之間的差異,以及這種差異什麼時候重要,什麼時候不重要,這一點非常關鍵。簡而言之,如果僅僅是為了做預測,看數據之間的相關關係便已足夠;但如果你想改變前提條件,就必須考慮因果關係。

回到斯特林格的例子——就是發現降低城市樹木修剪預算會引發訴訟數量增加的那個檢察官。如果樹木修剪預算不是引發訴訟數量變化的真正原因,那麼提高樹木修剪預算的方案就不會奏效。在這個例子里,搞清因果關係是很重要的。

還有一個例子,試想你的廣告策劃團隊發現,俄亥俄州的已婚女性對你們的頭髮護理產品廣告更感興趣,但是你顯然不能通過鼓勵俄亥俄州的女性結婚來增加產品銷量(這將影響前提條件)。相反,發現這一規律后,你可能會考慮將產品定位於俄亥俄州的已婚女性群體。在這種情形下,僅需要知道相關關係就可以了。

誤解三:大數據是萬金油

有時候人們將大數據與數據戰略混為一談。在很多情況下,企業完全可以建立寶貴的資料庫,將之應用到戰略中,而不一定非要使用大數據。

數據並不一定非要「大」(非結構化)才有用。從結構化的數據中(如顧客的點擊行為——顧客一般會點擊網頁的什麼位置、什麼時候下拉屏幕、停留了多長時間、是否將商品放入購物車等)照樣可以得到許多有價值的信息。即使在像臉書這樣為許多世界大型伺服器集群提供大數據的企業,其工程師每天處理的大多數問題也可以在一台運轉良好的電腦上完成。數據戰略的關鍵在於為企業提供價值,有時候需要大數據,有時候並不需要。

本文摘自《智慧轉型》,點擊閱讀原文可購買



熱門推薦

本文由 yidianzixun 提供 原文連結

寵物協尋 相信 終究能找到回家的路
寫了7763篇文章,獲得2次喜歡
留言回覆
回覆
精彩推薦