search
尋找貓咪~QQ 地點 桃園市桃園區 Taoyuan , Taoyuan

課程分享第4期|呂本富:大數據及大數據分析

北京大學公共傳播與社會發展研究中心(Centerfor Public Communication and Social Development)成立於2012年,秉持北大學術精神和人文關懷,在社會發展的大視野下致力於公共傳播領域的學術研究、國際交流、媒體培訓和公益合作,旨在搭建政界、學界、企業界、媒體同仁、公益同仁跨界交流、融通合作的平台,以公共傳播推動社會發展,以社會發展豐富公共傳播。編者按

如果說互聯網是一座寶藏,那麼大數據就是打開這座寶藏的鑰匙。新事物出現所帶來的實現更美好事物的可能性,不僅需要我們的歡呼,更需要我們細緻的思考,還有超乎想象力地運用。北大公共傳播研修班 2017年春季課程 ,特邀請科學院大學經管學院教授、博士生導師呂本富為大家講授5期《大數據分析》課程,梳理大數據相關技術及其原理,啟迪大家把握歷史未來發展脈絡,更為深刻地去認識「媒介與社會變遷」這一命題。本期為大家推送的是呂本富老師北大公共傳播班第一課的精華。

名師簡介

國家創新與發展戰略研究會副理事長

科學院大學經管學院教授 博士生導師

主要研究領域:網路經濟和網路空間戰略、創新創業管理、管理智慧與謀略。在網路空間和創新創業研究方面,主要承擔國家創新與發展研究會的政策研究工作;在智慧與謀略方面,主要研究傳統智慧與博弈論結合。

相關與因果

大數據的局限

學術的相關性研究

大數據的發展存在一個節點,及互聯網同步現實世界信息的佔比,是否達到較為全面反映現實世界的運行規律。

信號雜訊增大

當審視數據當中的某個表象的時候,常常需要考慮這種表象是否是偶然產生的。如果這種表象看起來不太可能是隨機產生的時候,就稱「統計上顯著的」。

如果做足夠多不同的相關性測試,偶然產生的結果就會淹沒真實的發現有很多辦法可以解決上述的問題,然而在大數據中這種問題會更加嚴重。

和一個小規模的數據集合相比,大數據的情況下有太多可以用作比較的標準。如果不做仔細的分析,那麼真實的表象與虛假表象之比——相當於信號雜訊比——很快就會趨近於0

納西姆.塔勒布(Nassim Taleb,著名商業思想家,著有《黑天鵝:如何應對不可知的未來》等書作)提出:隨著我們掌握的數據越來越多,可以發現的統計上顯著的相關關係也就越來越多。直覺的價值如果真是這樣的話,那麼需要專門為人為因素辟出一席之地——即為直覺、常識、運氣留出空間,以確保它們不會被數據和機器生成的答案擠走。數據不懂社交大腦在數學方面很差勁(請迅速心算一下437的平方根是多少),但是大腦懂得社會認知。人們擅長反射彼此的情緒狀態,擅長偵測出不合作的行為,擅長用情緒為事物賦予價值。在社交關係的決策中,情感大於數據

數據不懂背景數據偏愛潮流一些重要的(也是有收益的)產品在一開始就被數據擯棄了,僅僅因為它們的特異之處不為人所熟知。褒貶分析的局限理解為主,解釋為輔宜預測,不宜總結

小決策和大決策而對於小批量的大決策,因果性依然重要。「用」和「養」名師薦書

《思考,快與慢》

有意識的「系統2」通過調動注意力來分析和解決問題,並作出決定,它比較慢,不容易出錯,但它很懶惰,經常走捷徑,直接採納系統1的直覺型判斷結果。

學術的相關性研究

問題1:

我們傳統理解的大數據的觀點並不是完全準確的。比如說大數據研究應該既要全體,又要抽樣,這種說法就有問題,大數據中說的全體,也不是真正的全體,而且也不可能用全體數據去做預測。大數據應從相關關係中把握因果關係與必然關係,這種說法不科學,數據因素多了,關聯多了,並不一定能找到因果關係,這是不必然的.解決方式:

大數據是一種具有隱藏法則的人造自然,尋找大數據的科學模式將帶來對研究大數據之美的一般性方法的探究,儘管這樣的探索十分困難,但是如果我們找到了將非結構化、半結構化數據轉化成結構化數據的方法,已知的數據挖掘方法將成為大數據挖掘的工具。

推薦與預測

關聯挖掘技術

時間關聯挖掘技術較窄而高的峰值。

大數據的核心就是預測,預測體現在很多方面。大數據是把數學演算法運用到海量的數據上來預測事情發生的可能性。在大數據規律面前,每個人的行為都跟別人一樣,沒有本質變化,所以商家會比消費者更了消費者的行為。

北京大學公共傳播研究中心



熱門推薦

本文由 yidianzixun 提供 原文連結

寵物協尋 相信 終究能找到回家的路
寫了7763篇文章,獲得2次喜歡
留言回覆
回覆
精彩推薦