未來人工智慧：從AlphaGo到BeltaGo

作者按：2016年，人工智慧60周年。

1956年夏，麥卡錫、明斯基等正式確立了人工智慧（ArtificialIntelligence）這一術語，標誌著人工智慧學科的誕生。

60年後，AlphaGo戰勝李世石，確立了人工智慧新的里程碑。智能時代正在到來，站在人工智慧的歷史性關口，斯蒂芬·霍金、雷·庫茲韋爾、尤瓦爾·赫拉利等一大批國際學者對人工智慧的未來做過大膽預測。人工智慧已上升為國家戰略，國家「科技創新2030 重大項目」將新增「人工智慧2.0」。最近，一批院士以及專家學者對未來人工智慧和人工智慧2.0進行了深刻闡述。

近年來，本人承擔了人工智慧相關的課程和項目，也一直在苦苦思考。本文根據本人在計算機學會計算機視覺分會「CCF-CV走進高校系列報告會（第二十九期）」中的報告整理而成，分享對未來人工智慧的若干初淺思考。若有不當之處，敬請指正和諒解。

一、從AlphaGo看人工智慧現狀

1、AlphaGo是誰？

根據世界圍棋排行榜，AlphaGo的工作單位是Google DeepMind，性別：無，國籍：英國。它的戰績為，2016年一月份勝了歐洲冠軍，兩個月後勝了世界冠軍，當時，有同學問我，如果AlphaGo和柯傑下，誰贏?當時，我說，我猜AlphaGo贏，因為AlphaGo是在科學原理上贏了李世石。很不幸，我猜中了。2017年1月份對決柯潔等，60勝1和，聶衛平隨後在微博上讚歎：「它是圍棋上帝派來給人類引路的」。

*來源：www.goratings.org，2016.7.1

2、AlphaGo為什麼能贏？

圍棋是棋類遊戲的皇冠上的明珠，最複雜的棋類遊戲，最能體現人類智慧。在這麼一個19*19的棋譜上，它的搜索複雜度高達250^150。

這有多複雜？

這是宇宙級別的複雜度，根據天體物理，整個宇宙粒子數量在10^80級別。由此可見，圍棋有多複雜，這也是AlphaGo震撼人類的原因。我們知道人類高手下圍棋主要靠宏觀的直覺，加上局部的計算。AlphaGo能夠贏在於利用最新的深度學習技術，模仿高手，並通過自我學習超越高手。

AlphaGo的第一招：模仿高手，學習高手的棋形。

要模仿高手棋形，AlphaGo需要一個分類器來判斷棋形象不象高手的棋形。圍棋盤可以看成是19*19的圖像，雖然這個圖像很小很小，但是有250^150種變化，要對這些變化分成高手棋形、非高手棋形，是一個挺難的機器學習問題。難就難在高手棋形的特徵不好定義、不好提取。在人臉識別、車牌識別中，我們可以定義顏色、邊緣、關鍵點等特徵，顯然圍棋棋形的特徵不能這樣定義。深度學習是一種最新的特徵學習方法，能夠自動學出好的特徵。

AlphaGo用了最新的圖像分類器，叫深度卷積神經網路（DCNN）。不同於傳統的人工神經網路，他層數特別多，學習和分類的能力特彆強。神經網路1943年就提出來了，50年代末和80年代中興起過兩波研究熱潮，以前的人工神經網路層數很淺，一般只能訓練兩個隱層，只能解決一些簡單識別問題。2000年左右，G. Hinton等提出了一套預訓練後向傳播的方法，當時就能訓練10幾層，現在的深度學習能夠學習100多層。DCNN是專門針對圖像識別的深度學習方法，對局部圖像進行卷積計算，效率很高。

*來源：圖片來自於互聯網

Nature上有一篇介紹深度學習的綜述，G. Hinton、Y. Lecan、Y. Bengio等深度學習三巨頭是共同作者[1]。Hinton、Lecun相繼去了Google、Facebook，而Bengio繼續留在學術界。這是一個非常有意思的現象。一方面，深度學習跟以前的學術熱點不太一樣，之前，學術界曾經有過很多的熱點，但工業界很少跟進，更談不上花巨資去學術界挖著名科學家。Hinton、Lecun到工業界兼職，說明深度學習是真正有用的，有可能改變產業格局。另一方面，深度學習的成功更多是在應用層面的，很多理論問題還不清楚。兩人去工業界，一人留在學術界，是一種很健康的現象。

深度學習能夠發揮巨大威力的前提是，要有大量的數據用來訓練深度結構，深度學習會涉及到到上百萬、甚至上億的參數，如果數據不夠，很容易過擬合、降低性能。而要進行這樣大規模的訓練，就要有超強的計算能力。其實DCNN 1998年就提出來了，當時只能解決NIST符號識別問題，現在能夠解決ImageNet問題，其使用的深度學習結構基本沒變，主要是用了更強的CPU和以前沒有的GPU，並且用了千萬倍的訓練圖像。據說，AlphaGo存有15萬職業棋手、百萬業餘高手的棋譜，訓練的時候會用到1202個CPU，176個GPU。現在GPU伺服器在深度學習研究中已經是基本配置。

*來源：Fei-Fei LI，ICME2016大會報告

AlphaGo的第二招：自我學習，自我進化。

模仿高手還不足以超越高手，要超越頂尖高手，AlphaGo用了一個自我學習的方法，就像金庸小說《射鵰英雄傳》中的老頑童周伯通，左右互博，自己跟自己學。AlphaGo可以開出兩個程序，自己跟自己下。高手也會自己跟自己擺棋譜，高手擺棋譜擺得慢，需要吃飯、休息。而阿爾法狗只要有電，就一直可以左右互博下去，這就使得阿爾法狗有可能超越高手。

為了達到左右互博的效果，AlphaGo用了一個叫深度強化學習的技術，Google 2014年收購DeepMind后, 申請了深度強化學習的專利。強化學習很符合智能體的學習規律，小孩在不斷跌倒中學會走路，猴子在胡蘿蔔加大棒下學會做馬戲。強化學習的特點，一方面是Agent通過環境交互中學習，另一方是，訓練標註稀少，獎賞在現實世界中，通常是不輕易使用的，並且通常是有一定延時的。比如，孩子考試考得好，我們會給點獎勵，但是考試不是經常考，考完要有一段時間才能知道結果。

強化學習主要包括感知、行動、獎賞三個環節，構成一個狀態轉移空間。學習過程可以用馬可夫決策過程來表示。以前的強化學習的演算法訓練只能解決很小的狀態轉移空間。AlphaGo面臨的是一個超大轉移空間的問題，同時還是一個帶有超長延時訓練標註的問題，一開始的棋，不太好量化好壞，直到很後面才能夠數出各自大概的目數，判斷輸贏，這就可以歸結成為一個深度強化學習問題。這個問題恰恰可以用深度的遞歸神經網路（DRNN）解決。DRNN的訓練和前面的卷積神經網路沒有太多的區別。

在左右互博中，AlphaGo 局部會採用一種叫蒙特卡洛搜索樹的隨機策略進行搜索，先用前面提到的CNN的簡化版本，快速定位比較好的落子方案，同時通過隨機策略，給了其他位置一定的概率。隨機策略使得整個系統能夠自我進化，簡化的CNN兼顧了速度和效率。

把兩招合在一起就是：深度卷積網路，模仿高手，尋找好的落點；深度強化學習，形成左右互博，自我進化。深度強化學習另外一個副產品就是產生了海量的對局，用來充實深度卷積網路的訓練數據，兩招完美結合在一起。

3、再論AlphaGo是誰？

AlphaGo是最新深度學習方法、棋譜大數據以及最新超算體系的總和，它還以現代科學技術指數發展原理繼續進化，並且沒有任何情緒波動。既然AlphaGo是這樣的一個人工智慧系統，是不是它已經在科學原理上已經戰勝了人類棋手？在此我想說，作為人類個體的李世石、柯潔們，雖然告負，但對人類整體來說，這無疑是人類自我挑戰的新的里程碑！

二、未來人工智慧和AI2.0國家戰略

1、漫談未來人工智慧

關於未來，儘管以AlphaGo為代表的現在人工智慧已具備了很高的水平，但還有很多的局限性。中科院院士譚鐵牛在2016年人工智慧學會年會《關於人工智慧發展的思考》報告中，曾經總結過四句非常有意思的話。我是這麼理解的，我的理解不一定對。

第一句是「有智能沒有智慧」。智能就是「能幹」，現在AI能做好非常具體的事，比如掃地、下棋，但是不具備靈性，不能創造。

第二句是「有智商沒有情商」。如果讓阿爾法狗訓練一下智商測試的題目，估計智商可能會爆表，科大訊飛的人工智慧要參加2020年聯考，據說要爭取考上大學大學部，但估計情商還是很低。

第三句話是「會計算不會算計」。現在人工智只有「解空間」層面的局部策咯，沒有「問題空間」層面的宏觀戰略，不會挖坑、下套這樣的高級博弈。

第四句話是「會專才不會通才」。主要說現在人工智慧舉一反三的能力差。

基於此，未來人工智慧應該做「四有新人」，也就是有智慧、有情感、有算計、有通才的新一代人工智慧。當然，要實現這樣的強人工智慧，人類還有很長的路要走。

2、AI2.0國家戰略

正在大力發展AI，「人工智慧，之崛起」，對此，我們可以大有信心。AlphaGo的例子我們知道，AI由三部分構成，機器學習是AI的大腦，超算是AI的軀體，大數據是AI成長的養分，據統計43%機器學習相關論文是人寫的，已經有眾多的AI人才，這形成了AI垂直產業應用的人才基礎。超算方面我們的太湖之光、天河二號排名世界前二，發展人工智慧具有很強的硬體基礎。大數據方面，相對歐美日等國家，不僅擁有更多的「冷數據」（包括人口、地理等靜態數據），而且用用更多樣的「熱數據」（比如交易、診療等動態數據），大數據優勢將促使形成特色，在人工智慧時代彎道超車。

人工智慧已經上升為國家戰略，國家「科技創新2030 重大項目」將新增「人工智慧2.0」[2]。潘雲鶴院士於2016年12月在工程院院刊Engineering（主刊）發表了論文「Heading towardartificial intelligence 2.0」，提出了人工智慧2.0的核心理念「基於重大變化的信息新環境和發展新目標的新一代人工智慧」[3]。2017年1~2月，工程院院刊信息與電子工程學部分刊Frontiers of Information Technology & Electronic Engineering出版了「Artificial Intelligence 2.0」專題[4]，該專題分為六大方向，潘雲鶴、李未、高文、鄭南寧、吳澄、李伯虎、陳純等多位院士以及專家學者對人工智慧2.0中所涉及的大數據智能、群體智能、跨媒體智能、混合增強智能和自主智能等進行了深刻闡述。

三、未來人工智慧視覺感知的思考

1、未來人工智慧：類人服務、超人感知

根據國內外專家，未來人工智慧有很多、很高遠的願景。我個人理解，至少其中一個願景是「類人服務、超人感知」，也就是，以類人的方式服務人類自身，以超人的方式感知外部世界。在智能時代，人類智能與人工智慧相互增強，相互對偶，類人服務要求具備類人智能：從人類的視角看，未來人工智慧應該在感官和思維上像人；從機器的視角看，未來人工智慧應該能夠理解人的行為和情緒。

在傳統社會是一個二元空間，人類社會和物理空間形成互訓關係。在信息社會，人、機、物三者相互融合，形成一個三元空間，未來人工智慧能夠進行人、機、物信息的整合，以超越人類的精度和時空尺度，感知三元空間的信息關聯性。多學科的研究，特別是腦計劃的研究，將進一步夯實機器學習的理論基礎，三元空間的大數據和超算能力將進一步提高機器學習的工程能力。機器學習、大數據、超算三者共同推動未來人工智慧超人感知、類人服務的願景。下面就這個願景，稍微做點技術上的展開思考。

2、類人智能

類人智能就是要將類人知覺和類腦思維整合在一起，如果機器人具備逼近人類的人機交互能力，那麼現在擊敗人類的阿爾法狗就有可能進化到陪伴人類下圍棋的BeltaGo（或稱之為「陪Ta狗」？）。

*來源：圖片來源於互聯網

在知覺層面，隨著低成本、低功耗感測器的發展，未來人工智慧要在視、聽、味、觸等不同的模態上實現對現實世界的感知和認知。具體到視覺感知，深度學習三巨頭在2015 Nature上的綜述論文，介紹了用CNN+RNN實現看圖說話。反過來，語言能不能驅動機器視覺？我們說一句話，能不能把對應的物體定位出來？更難地，能不能自動造出來一張與這段話對應的圖像?最近，生成式對抗網路（GAN）在圖像自動生成方面取得重大進展[5]。如果圖像和語言能夠雙向翻譯，這將使得人工智慧的視覺知覺達到一個全新的高度。

在思維層面,未來人工智慧要實現類腦計算。2014年IBM 發布了類腦晶元TrueNorth，集成了100萬個「脈衝神經元」，能力相當於一台超級計算機，功耗卻只有65毫瓦，主要是因為它採用Spike NN結構，用類腦的非同步脈衝來驅動電路，而非傳統電路的同步時鐘。但它還沒辦法高效模擬另一個重要大腦機理，也就是觸突的可塑性，因此，性能離大規模商業應用還有一段距離。

從長遠來看，研究類腦計算是通往強人工智慧的有效方法[6]。傳統的計算機相當於左腦，擅長邏輯思維，處理數字；神經元晶元相當於右腦，擅長形象思維，處理圖像。IBM正想辦法將兩者整合在一起實現全腦的類腦計算。

*來源：圖片來自於互聯網

3、三元空間感知：人機物協同感知

超人的三元空間感知，在側重物理空間的感知層面，科學家正在研究人機物協同感知。突破肉眼感知的局限性是人工智慧的傳統強項，目前太赫茲技術得到很大的進步，上海交通大學跟相關公司合作，在研究太赫茲圖像識別，有可能在5-10米外就能夠識別藏在人身上的刀槍甚至毒品。2017年3月，上海交通大學還跟聯影公司成立了醫學影像先進技術研究院，合作研究成像裝備和大數據診療。可見光譜、紅外光譜、太赫茲、核磁共振等一起實現全譜感知，相當於賦予了人類以天眼、慧眼。

人機物協同感知的一個重大應用就是無人車。在美國加州，全功能的無人車已經允許上路。MIT Technology Review將自動駕駛卡車評為2017年10大突破技術。百度成立了無人車事業部，也在矽谷設立了專門的研究院。

4、三元空間感知：群體智能

超人的三元空間感知，在人類社會層面，正在湧現出群體智能新技術和社會計算新學科，利用互聯網、社交網路、通信網路、監控網路等不同網路的大數據，克服傳統社會學調查方法數據稀少的問題，更好、更快地分析人群、組織和社會的行為。上海交通大學較早開展了這方面的探索，2009年承擔了973項目「混合網路下社會集群行為感知與規律研究」，聯合了信息學、管理學、社會心理學等不同領域的專家開展交叉研究，一些成果為國家提供了決策。我本人承擔了其中「大尺度跨媒體社會集群行為感知」課題，結合網路媒體和視頻監控，為世博會、亞信峰會等大型活動管理提供了技術支持。

在973課題基礎上，我們最近承擔了國家重點研發專項課題，開展大規模人群透徹感知研究，針對反恐維穩、智慧城市、交通控制等需求。利用大數據和深度學習的優勢，進行多尺度、跨相機、跨平台分析，有望實現群體感知從簡單、低密度、小範圍場景到複雜、高密度、大範圍場景的跨越。

5、三元空間感知：互聯網超級智能

超人的三元空間感知，在側重信息空間的層面，未來學家認為互聯網正在向超級智能的方向不斷進化，形成互聯網、人工智慧和人類大腦的聯合智商，互聯網與人類大腦高度相似，它將具備自己的視覺、聽覺、觸覺、運動神經系統，也會擁有自己的記憶神經系統、中樞神經系統。2011年谷歌提出了「谷歌大腦」計劃，以大腦功能區，重新定義Google的業務群。最近，也推出了腦計劃。

*來源：圖片來自於互聯網

四、關於未來人工智慧的

社會經濟影響的思考

未來，強人工智慧將深刻改變人類生活，也給人類帶來巨大挑戰。霍金稱人工智慧或威脅人類，馬斯克認為人工智慧是在「召喚魔鬼」。儘管我們可以相信人類能夠和人工智慧包容發展，至少我們要注意兩方面的挑戰。

一、改變就業結構。不僅大量的流水線工人正在被替代，大量的白領工作崗位也將消失。十幾年前IBM深藍打敗了卡斯帕羅夫，今天我們還是不能小看IBM，AlphaGo還在打名氣，IBM的讀片機器人已經開始上崗。華爾街的量化交易機器人正在替代金融交易員，「今日頭條」的推薦機器人正在替代初級的內容編輯。

二、強人工智慧將衝擊倫理關係。機器人保姆帶大的小孩，還會不會跟親媽親？如果美女機器人擁有非凡魅力，人口數量和結構會帶來怎麼變化？植入了智能器官甚至機器大腦的人，還算不算人？

進一步，我們假設有一天「阿爾法狗」遇上「薛定諤的貓」的時候，也就是當強人工智慧運行在量子計算機上的時候，我們的未來會怎樣？

未來，機器人會是怎麼樣？未來學家們可能正在研究，機器人會不會做夢（意識）？機器人會不會結婚（性別）？機器人會不會用錢（信用）？機器人會不會統治人類（政治）？

未來，人類自身會怎麼樣？從歷史觀看，尤瓦爾·赫拉利不僅寫了《人類簡史》，還寫好了《未來簡史》，認為人類會從智人演化到智神。

未來，人類自身會怎麼樣？從生物觀看，人類的密碼在基因，基因分析是典型的計算密集型問題，這種單一任務的工作恰恰可能是人工智慧的傳統強項。有了基於量子計算的強人工智慧后，人類是不是最終會全面破解基因？很久很久以前，亞當和夏娃遇上了那條蛇，偷吃了智慧之果，被逐出伊甸園。億萬年後，他們的後代遇上了一隻「狗」和一隻「貓」，打開了強人工智慧的魔盒后，會不會摘下傳說中生命樹上的長生之果？這一切，人性中的慾望和貪婪，是否冥冥中早已註定？

*來源：圖片來源於互聯網