search
高慶一博士TEDxTHU演講:以人民的名義審視社交網路

高慶一博士TEDxTHU演講:以人民的名義審視社交網路

高慶一 博士

君傑資本創始合伙人,投資圈有范兒的學者型投資人。

擁有北京航空航天大學博士后研究經歷,關注的研究領域包括複雜網路,社會網路分析,機器學習與數據挖掘等等。

2017年5月28日,清華大學TEDxTHU 2017 春季大會,高慶一博士進行「以人民的名義審視社交網路——AI複雜網路理論帶來的生活啟示」主題演講:

關於複雜網路,我認為它是人工智慧領域皇冠上的鑽石。

今天我將嘗試用最近非常火爆的反腐題材電視連續劇《人民的名義》,給大家揭開一點點複雜網路這門學科的面紗。嘗試使大家換一個角度來重新思考一下自己的社交行為以及如何評價自己在社交網路中的重要程度,以期能夠給大家帶來些許的生活啟示

一、複雜網路與六度分割試驗

2016年3月,AlphaGo(阿爾法圍棋)打敗了當時的圍棋世界冠軍李世石,就在前兩天又打敗了圍棋九段棋手柯潔。從2016年3月開始,大量跟深度學習、數據挖掘、人工智慧相關的辭彙在我們生活中出現。

人工智慧、複雜網路是一種什麼樣的邏輯框架?深度學習、數據挖掘、監督學習、非監督學習以及相關關鍵詞在人工智慧領域處於一個什麼樣的位置?今天主題所講的複雜網路又在人工智慧這個領域裡面處於一個什麼樣的階段?

我將從下圖開始展開。

人工智慧分為強人工智慧和弱人工智慧。

強人工智慧需要機器具有推理能力、解決問題的能力,還需要機器具有自我意識,但是對於弱人工智慧不強調機器具有自我意志。

人工智慧有一系列的相關技術和理論,同時還包括一個非常重要的部分叫做複雜系統,也叫複雜網路

在已經結束了的工業革命時代,機器替代了人類的體力;在正在進行的弱人工智慧革命時代,機器正在替代人類的腦力;在未來我認為必然到來的強人工智慧時代,也許機器替代的是人類本身。

那麼複雜網路又是一個什麼樣的概念呢?何為複雜?什麼是網路?

我們定義節點數量達到10的12次方規模體量以上,我們可以稱為複雜;由節點和邊的關係所組成的結構叫做網路。因此當我們討論在10的12次方以上的規模體量及由節點和邊的關係組成結構的時候,我們就在討論複雜網路。

根據節點和邊的關係不同可以得到不同類型的複雜網路

如果每一個節點是一個作者,作者與作者之間至少合作發過一篇論文,就得到一個Collaboration Network(合作網路);每一個節點是一篇論文,論文與人之間至少擁有一個共同的作者,就有了一個 Coauthor Network(合著網路)。這兩種類型的網路都屬於 Bibliographic Network(文檔網路)

人與人之間通過各種關係相連接,比如電話聯絡、微信好友、Facebook、推特的相互關注、父子關係、親朋關係,各種各樣的人際之間可以建立的關係,把人們連接在一起,就有了一個社交網路

如果節點是捷運站,捷運站之間有列車通過,就得到一個 Tube Network(捷運網路);如果節點是機場,機場之間每一次航線連接,就得到一個航線網路

如果節點是生物,生物之間具有捕食與被捕食關係,就得到一個捕食者網路

以上是人工智慧、複雜網路等相關辭彙的邏輯概念的簡單介紹。

根據節點和邊的關係不同,我們定義了不同類型的複雜網路。那麼複雜網路的研究和發展始於什麼時候呢?

1736年,在俄羅斯有一個小鎮叫做哥尼斯堡,有兩條河穿過整個小鎮,河上有兩個小島,有七座橋將兩個島與河岸聯繫起來。那麼,一個郵差如何在不走回頭路的情況下不重複、不遺漏地一次走完七座橋,最後回到出發點?

這就是複雜網路以及圖論的研究的始點問題——哥尼斯堡七橋問題。

著名數學家歐拉,證明哥尼斯堡七橋問題是不存在解的。

那麼在這幾百年的研究歷程裡面複雜網路的高潮問題是什麼

可能大家都知道,叫做小世界實驗又叫做六度分割實驗

在1967年耶魯大學學者 Stanley Milgram 設計了一個連鎖信件實驗。

他將一系列連鎖信件隨機發送給居住在內布拉斯加州奧馬哈的160個人,信中放了一個波士頓股票經紀人的名字,信中要求每個收信人將這套信寄給自己認為比較接近那個股票經紀人的朋友。最終只有20%的信件到達了收件人手中,但其中有超過80%的信件都在六個步驟以內送達了。這就是著名的六度分割實驗。

如果你的微信的聯繫人有一百個人(102的話,那算及你朋友的朋友,你能觸及到多少人?

我們的前提假設是,你的熟人與熟人之間沒有交集,10的四次方也就是1萬,那麼在六度以內能夠觸及到多少人?1026次方是10121萬億人,遠遠超過我們地球已有的人口數量。

我們生活在一個移動互聯網的時代,實際上這個是1967年的研究結果。最新的研究結果證明人與人在移動互聯網時代的距離只有3.7步。

二、典型複雜網路之社交網路

剛才介紹了人工智慧複雜網路以及各種類型的複雜網路,包括哥尼斯堡七橋問題以及六度分割實驗。人是最複雜的動物,由人與人之間錯綜複雜的結構所構成的網路,叫做社交網路

社交網路是非常典型的一種複雜網路。接下來我想通過《人民的名義》這部充滿了人與人之間複雜關係情感的電視連續劇來討論:

如何評價一個人在社交網路中的重要程度

我們用 HITS Centrality、Degree Centrality、Eigenvector Centrality、PageRank Centrality 四個維度來衡量評價。

HITS,即 Hubs and Authorities(權威和樞紐)。

筆記俠註:PageRank (網頁級別)是 Google 演算法的重要內容,取自 Google 的創始人 LarryPage。它是 Google 排名運演算法則(排名公式)的一部分,是Google用於用來標識網頁的等級/重要性的一種方法,是 Google 用來衡量一個網站的好壞的唯一標準。

在揉合了諸如 Title 標識和 Keywords 標識等所有其它因素之後,Google 通過 PageRank 來調整結果,使那些更具「等級/重要性」的網頁在搜索結果中另網站排名獲得提升,從而提高搜索結果的相關性和質量。

舉個例子,在網路中有兩種類型的節點:

一種叫做 Hubs(樞紐)。Hub 在網路中指向了很多節點,出度非常高,換句話說,Hub 們在網路中認識很多人,但是他本身的重要程度也許並不高。

另一種人,我們叫做 Authorities(權威),在網上很多節點傾向於向他連接,入度非常高。

後面三種方法也都是評價一個節點的重要程度的方法。

Degree centrality(度中心度)是指一個節點,在網路上程度是看有多少節點與我所要研究的節點相連接,以量來取勝。

Eigenvector centrality特徵向量中心度):不僅從量來評價,還需探究之間的節點本身的重要程度,從質上去考量。

PageRank centrality(PageRank 中心度)需要衡量這個節點之間的關係強弱,即它對你有多強的忠誠度。

提起忠誠度,我想用這個例子來說明。

如果一個網紅在社交媒體上說我和王思聰戀愛了,大家的反應是:可以,你與網路中一個比較重要的節點建立了連接,你的 Eigenvector Centrality 不低。

清華大學著名校友章澤天跟劉強東結婚了。她與網路中非常重要的一個人相連接了,在 Eigenvector Centrality 這個層面上也很不錯。

但是 PageRank Centrality 呢?鐵打的思聰,流水的網紅,江山代有網紅出,各領風騷數百天;而澤天妹妹的 PageRank Centrality 呢?對於強東而言,人間縱有百媚千紅,他只愛澤天妹妹這一種。由此,一段時間過去后,網紅還是網紅,而澤天妹妹已經是國際名媛。

接下來,我將用一個更合適的例子來說明。

人民的名義里有個陳岩石,他曾經是漢中省檢察院常務副檢察長,從大風廠最早期改革就一直在裡邊工作,並且後面一直在協助大風廠來進行推廣各項問題的解決落實。

在後期大風廠遇到股權、拆遷等問題時,陳老一直站在員工的角度去思考問題以及支持大部分的員工進行利益的訴求,所以大風廠的員工都是支持陳老的,他的Degree Centrality 非常高,但是為什麼大風廠問題拖了好多年一直解決不了?

其主要問題就是雖然在網路中支持你的人數量很多,但是它的重要程度並不足以推進這件事情往前發展。

情況在什麼時候發生變化

在沙瑞金來到漢中升任省委書記的時候,情況發生了變化。因為沙瑞金和陳岩石曾經是養父子的關係,同時沙來到漢中又是為了反腐和推進改革的,所以他需要解決大工廠的員工的股權安全問題。

這時在網路中支持你的人情況變化了,你的 Eigenvector Centrality 升高了,所以後續陳老推動這些事情的發展的步伐加快。

我想用這樣一張雷達圖來給大家換一個角度,用 HITS、Degree、Eigenvector、PageRank 四個維度進行講解。

首先我們可以看到沙瑞金記被中央派到漢中執行反腐是深得民心,所以老百姓非常支持沙書記,書記的 Degree Centrality 是滿分。

因為中央完全支持沙書記去清查漢中省趙立春這個派系的所有問題,所以他的 Eigenvector Centrality 也是滿分。

此外,中央在漢中沒有第二個聲音,只有沙瑞金,他的 PageRank Centrality 也是滿分。

因此沙瑞金三項都是滿分。

那麼此處的沙書記一定是 Authorities(權威),而不是 Hubs(樞紐)。我們再看兩個不那麼完美的人。

第一個是漢中大學政法系教授高育良書記,他被趙立春從漢中大學政法系提拔到了省委,然後一步一步升遷,最終任省委副書記、省政法委書記。

趙立春離開漢中省之後還推薦他成為漢中省委書記,但他的 Degree Centrality 並不是滿分,因為在美食城以及大風廠的問題上高書記有私心,他並沒有得到全部人民群眾的支持。

但是他的 Eigenvector Centrality 在沙瑞金進來之前是滿分。因為趙立春完全支持他,甚至最後還要推薦他來接替自己成為漢中省委書記。

那麼高育良的 PageRank Centrality 為什麼不是滿分?因為趙立春在漢中省除了高育良以外還有其他人選。比如趙立春原來的秘書漢中油汽集團的總裁劉新建,另外還有達康書記,所以他的背後靠山是需要與人分享的,他的關係忠誠度並不高。

再看看漢東省公安廳廳長祁同偉,一直想當副省長,最後也沒當上。祁廳長的夫人有一句非常著名的話:祁同偉,你是不是想把你們村裡的野狗都安排到公安局來當警犬,也吃上一份皇糧?

對於祁同偉來講,他的主要的訴求是攀上:就是攀附一切能夠讓他提拔為副省長的人,不去管基層百姓的疾苦,但是為什麼他的 Degree Centrality 竟不是0?是因為還有他們村的人和狗支持他。

在趙立春調走之前或者說高育良還沒有出事之前,其 Eigenvector Centrality 是滿分,因為高書記完全支持他,想讓他繼任政法委書記。

祁同偉的 PageRank Centrality 為什麼也是滿分?

因為實際上在這個情勢下,高育良在副省長以及未來的政法委書記這兩個位置上沒有其他的選擇,只能支持他,所以他的強弱程度中心度也是滿分,但是所有這些情況都是會發生變化的。

當沙瑞金來了之後,高育良的 Eigenvector Centrality 立馬歸零,因為趙立春倒台了,他背後的大樹失去了。

劇中後期趙立春家族對高育良寄託了很大希望,因為此時達康書記已經不屬於同一派,而劉新建已被抓,此時高育良沒有別人來分享趙立春的支持,但是因為趙倒台,其 PageRank Centrality 也歸零了。

而祁廳長在沙書記到來之後,因為高育良的位置變化,其 Eigenvector Centrality PageRank Centrality 也歸零了。

以上採用《人民的名義》講述了如何評價一個節點在網路中的重要程度。也就是用了四個維度方式來評價一個節點的重要程度。

我想給從下面幾方面給大家一點啟發。

首先,社交關係的數量並不起決定作用我們絕大多數的時間都是無效社交,應該把主要時間放在有效社交上面。

第二,背靠大樹固然好,但是風險同樣存在大樹倒了,也許被庇護的人並不僅僅是失去了庇護,還有可能會被砸死。

第三,重量級人物建立了關係只是第一步,能夠加深關係,提升他對你的關注度才是關鍵

第四,做 Hub(樞紐)永遠沒有做 Authority(權威)穩妥,打鐵還需自身硬。

Hub的問題是能不能成為 Authority。 Authority的問題是願不願意成為 Hub 。

今天和大家分享的關於複雜網路的一些基本概念,以及如何評價一個人在社交網路中的重要程度的方法,並不是想讓大家在術的層面提升,去想盡辦法與強勢節點建立鏈接,如何去使自己的 PageRank Centralitypagerank 中心度變高,增加強勢節點對自己的忠誠度。

而是希望大家能夠在道的層面精進,增強自己的內在能力,把自己做大做強。最後,我想以清華大學的校訓結束我的演講:天行健,君子以自強不息;地勢坤,君子以厚德載物!

鳴 謝:

筆記俠(27萬 -1~6歲CEO都在看的第一手新商業認知筆記)

筆記俠客 | 鄧麗君 責編 | 清野

熱門推薦

本文由 一點資訊 提供 原文連結

一點資訊
寫了5860316篇文章,獲得23305次喜歡
留言回覆
回覆
精彩推薦