search
尋找貓咪~QQ 地點 桃園市桃園區 Taoyuan , Taoyuan

未來人工智慧:從AlphaGo到BeltaGo

作者按:2016年,人工智慧60周年。

1956年夏,麥卡錫、明斯基等正式確立了人工智慧(ArtificialIntelligence)這一術語,標誌著人工智慧學科的誕生。

60年後,AlphaGo戰勝李世石,確立了人工智慧新的里程碑。智能時代正在到來,站在人工智慧的歷史性關口,斯蒂芬·霍金、雷·庫茲韋爾、尤瓦爾·赫拉利等一大批國際學者對人工智慧的未來做過大膽預測。人工智慧已上升為國家戰略,國家「科技創新2030 重大項目」將新增「人工智慧2.0」。最近,一批院士以及專家學者對未來人工智慧和人工智慧2.0進行了深刻闡述。

近年來,本人承擔了人工智慧相關的課程和項目,也一直在苦苦思考。本文根據本人在計算機學會計算機視覺分會「CCF-CV走進高校系列報告會(第二十九期)」中的報告整理而成,分享對未來人工智慧的若干初淺思考。若有不當之處,敬請指正和諒解。

一、從AlphaGo看人工智慧現狀

1、AlphaGo是誰?

根據世界圍棋排行榜,AlphaGo的工作單位是Google DeepMind,性別:無,國籍:英國。它的戰績為,2016年一月份勝了歐洲冠軍,兩個月後勝了世界冠軍,當時,有同學問我,如果AlphaGo和柯傑下,誰贏?當時,我說,我猜AlphaGo贏,因為AlphaGo是在科學原理上贏了李世石。很不幸,我猜中了。2017年1月份對決柯潔等,60勝1和,聶衛平隨後在微博上讚歎:「它是圍棋上帝派來給人類引路的」。

*來源:www.goratings.org,2016.7.1

2、AlphaGo為什麼能贏?

圍棋是棋類遊戲的皇冠上的明珠,最複雜的棋類遊戲,最能體現人類智慧。在這麼一個19*19的棋譜上,它的搜索複雜度高達250^150。

這有多複雜?

這是宇宙級別的複雜度,根據天體物理,整個宇宙粒子數量在10^80級別。由此可見,圍棋有多複雜,這也是AlphaGo震撼人類的原因。我們知道人類高手下圍棋主要靠宏觀的直覺,加上局部的計算。AlphaGo能夠贏在於利用最新的深度學習技術,模仿高手,並通過自我學習超越高手。

AlphaGo的第一招:模仿高手,學習高手的棋形。

要模仿高手棋形,AlphaGo需要一個分類器來判斷棋形象不象高手的棋形。圍棋盤可以看成是19*19的圖像,雖然這個圖像很小很小,但是有250^150種變化,要對這些變化分成高手棋形、非高手棋形,是一個挺難的機器學習問題。難就難在高手棋形的特徵不好定義、不好提取。在人臉識別、車牌識別中,我們可以定義顏色、邊緣、關鍵點等特徵,顯然圍棋棋形的特徵不能這樣定義。深度學習是一種最新的特徵學習方法,能夠自動學出好的特徵。

AlphaGo用了最新的圖像分類器,叫深度卷積神經網路(DCNN)。不同於傳統的人工神經網路,他層數特別多,學習和分類的能力特彆強。神經網路1943年就提出來了,50年代末和80年代中興起過兩波研究熱潮,以前的人工神經網路層數很淺,一般只能訓練兩個隱層,只能解決一些簡單識別問題。2000年左右,G. Hinton等提出了一套預訓練後向傳播的方法,當時就能訓練10幾層,現在的深度學習能夠學習100多層。DCNN是專門針對圖像識別的深度學習方法,對局部圖像進行卷積計算,效率很高。

*來源:圖片來自於互聯網

Nature上有一篇介紹深度學習的綜述,G. Hinton、Y. Lecan、Y. Bengio等深度學習三巨頭是共同作者[1]。Hinton、Lecun相繼去了Google、Facebook,而Bengio繼續留在學術界。這是一個非常有意思的現象。一方面,深度學習跟以前的學術熱點不太一樣,之前,學術界曾經有過很多的熱點,但工業界很少跟進,更談不上花巨資去學術界挖著名科學家。Hinton、Lecun到工業界兼職,說明深度學習是真正有用的,有可能改變產業格局。另一方面,深度學習的成功更多是在應用層面的,很多理論問題還不清楚。兩人去工業界,一人留在學術界,是一種很健康的現象。

深度學習能夠發揮巨大威力的前提是,要有大量的數據用來訓練深度結構,深度學習會涉及到到上百萬、甚至上億的參數,如果數據不夠,很容易過擬合、降低性能。而要進行這樣大規模的訓練,就要有超強的計算能力。其實DCNN 1998年就提出來了,當時只能解決NIST符號識別問題,現在能夠解決ImageNet問題,其使用的深度學習結構基本沒變,主要是用了更強的CPU和以前沒有的GPU,並且用了千萬倍的訓練圖像。據說,AlphaGo存有15萬職業棋手、百萬業餘高手的棋譜,訓練的時候會用到1202個CPU,176個GPU。現在GPU伺服器在深度學習研究中已經是基本配置。

*來源:Fei-Fei LI,ICME2016大會報告

AlphaGo的第二招:自我學習,自我進化。

模仿高手還不足以超越高手,要超越頂尖高手,AlphaGo用了一個自我學習的方法,就像金庸小說《射鵰英雄傳》中的老頑童周伯通,左右互博,自己跟自己學。AlphaGo可以開出兩個程序,自己跟自己下。高手也會自己跟自己擺棋譜,高手擺棋譜擺得慢,需要吃飯、休息。而阿爾法狗只要有電,就一直可以左右互博下去,這就使得阿爾法狗有可能超越高手。

為了達到左右互博的效果,AlphaGo用了一個叫深度強化學習的技術,Google 2014年收購DeepMind后, 申請了深度強化學習的專利。強化學習很符合智能體的學習規律,小孩在不斷跌倒中學會走路,猴子在胡蘿蔔加大棒下學會做馬戲。強化學習的特點,一方面是Agent通過環境交互中學習,另一方是,訓練標註稀少,獎賞在現實世界中,通常是不輕易使用的,並且通常是有一定延時的。比如,孩子考試考得好,我們會給點獎勵,但是考試不是經常考,考完要有一段時間才能知道結果。

強化學習主要包括感知、行動、獎賞三個環節,構成一個狀態轉移空間。學習過程可以用馬可夫決策過程來表示。以前的強化學習的演算法訓練只能解決很小的狀態轉移空間。AlphaGo面臨的是一個超大轉移空間的問題,同時還是一個帶有超長延時訓練標註的問題,一開始的棋,不太好量化好壞,直到很後面才能夠數出各自大概的目數,判斷輸贏,這就可以歸結成為一個深度強化學習問題。這個問題恰恰可以用深度的遞歸神經網路(DRNN)解決。DRNN的訓練和前面的卷積神經網路沒有太多的區別。

在左右互博中,AlphaGo 局部會採用一種叫蒙特卡洛搜索樹的隨機策略進行搜索,先用前面提到的CNN的簡化版本,快速定位比較好的落子方案,同時通過隨機策略,給了其他位置一定的概率。隨機策略使得整個系統能夠自我進化,簡化的CNN兼顧了速度和效率。

把兩招合在一起就是:深度卷積網路,模仿高手,尋找好的落點;深度強化學習,形成左右互博,自我進化。深度強化學習另外一個副產品就是產生了海量的對局,用來充實深度卷積網路的訓練數據,兩招完美結合在一起。

3、再論AlphaGo是誰?

AlphaGo是最新深度學習方法、棋譜大數據以及最新超算體系的總和,它還以現代科學技術指數發展原理繼續進化,並且沒有任何情緒波動。既然AlphaGo是這樣的一個人工智慧系統,是不是它已經在科學原理上已經戰勝了人類棋手?在此我想說,作為人類個體的李世石、柯潔們,雖然告負,但對人類整體來說,這無疑是人類自我挑戰的新的里程碑!

二、未來人工智慧和AI2.0國家戰略

1、漫談未來人工智慧

關於未來,儘管以AlphaGo為代表的現在人工智慧已具備了很高的水平,但還有很多的局限性。中科院院士譚鐵牛在2016年人工智慧學會年會《關於人工智慧發展的思考》報告中,曾經總結過四句非常有意思的話。我是這麼理解的,我的理解不一定對。

第一句是「有智能沒有智慧」。智能就是「能幹」,現在AI能做好非常具體的事,比如掃地、下棋,但是不具備靈性,不能創造。

第二句是「有智商沒有情商」。如果讓阿爾法狗訓練一下智商測試的題目,估計智商可能會爆表,科大訊飛的人工智慧要參加2020年聯考,據說要爭取考上大學大學部,但估計情商還是很低。

第三句話是「會計算不會算計」。現在人工智只有「解空間」層面的局部策咯,沒有「問題空間」層面的宏觀戰略,不會挖坑、下套這樣的高級博弈。

第四句話是「會專才不會通才」。主要說現在人工智慧舉一反三的能力差。

基於此,未來人工智慧應該做「四有新人」,也就是有智慧、有情感、有算計、有通才的新一代人工智慧。當然,要實現這樣的強人工智慧,人類還有很長的路要走。

2、AI2.0國家戰略

正在大力發展AI,「人工智慧,之崛起」,對此,我們可以大有信心。AlphaGo的例子我們知道,AI由三部分構成,機器學習是AI的大腦,超算是AI的軀體,大數據是AI成長的養分,據統計43%機器學習相關論文是人寫的,已經有眾多的AI人才,這形成了AI垂直產業應用的人才基礎。超算方面我們的太湖之光、天河二號排名世界前二,發展人工智慧具有很強的硬體基礎。大數據方面,相對歐美日等國家,不僅擁有更多的「冷數據」(包括人口、地理等靜態數據),而且用用更多樣的「熱數據」(比如交易、診療等動態數據),大數據優勢將促使形成特色,在人工智慧時代彎道超車。

人工智慧已經上升為國家戰略,國家「科技創新2030 重大項目」將新增「人工智慧2.0」[2]。潘雲鶴院士於2016年12月在工程院院刊Engineering(主刊)發表了論文「Heading towardartificial intelligence 2.0」,提出了人工智慧2.0的核心理念「基於重大變化的信息新環境和發展新目標的新一代人工智慧」[3]。2017年1~2月,工程院院刊信息與電子工程學部分刊Frontiers of Information Technology & Electronic Engineering出版了「Artificial Intelligence 2.0」專題[4],該專題分為六大方向,潘雲鶴、李未、高文、鄭南寧、吳澄、李伯虎、陳純等多位院士以及專家學者對人工智慧2.0中所涉及的大數據智能、群體智能、跨媒體智能、混合增強智能和自主智能等進行了深刻闡述。

三、未來人工智慧視覺感知的思考

1、未來人工智慧:類人服務、超人感知

根據國內外專家,未來人工智慧有很多、很高遠的願景。我個人理解,至少其中一個願景是「類人服務、超人感知」,也就是,以類人的方式服務人類自身,以超人的方式感知外部世界。在智能時代,人類智能與人工智慧相互增強,相互對偶,類人服務要求具備類人智能:從人類的視角看,未來人工智慧應該在感官和思維上像人;從機器的視角看,未來人工智慧應該能夠理解人的行為和情緒。

在傳統社會是一個二元空間,人類社會和物理空間形成互訓關係。在信息社會,人、機、物三者相互融合,形成一個三元空間,未來人工智慧能夠進行人、機、物信息的整合,以超越人類的精度和時空尺度,感知三元空間的信息關聯性。多學科的研究,特別是腦計劃的研究,將進一步夯實機器學習的理論基礎,三元空間的大數據和超算能力將進一步提高機器學習的工程能力。機器學習、大數據、超算三者共同推動未來人工智慧超人感知、類人服務的願景。下面就這個願景,稍微做點技術上的展開思考。

2、類人智能

類人智能就是要將類人知覺和類腦思維整合在一起,如果機器人具備逼近人類的人機交互能力,那麼現在擊敗人類的阿爾法狗就有可能進化到陪伴人類下圍棋的BeltaGo(或稱之為「陪Ta狗」?)。

*來源:圖片來源於互聯網

在知覺層面,隨著低成本、低功耗感測器的發展,未來人工智慧要在視、聽、味、觸等不同的模態上實現對現實世界的感知和認知。具體到視覺感知,深度學習三巨頭在2015 Nature上的綜述論文,介紹了用CNN+RNN實現看圖說話。反過來,語言能不能驅動機器視覺?我們說一句話,能不能把對應的物體定位出來?更難地,能不能自動造出來一張與這段話對應的圖像?最近,生成式對抗網路(GAN)在圖像自動生成方面取得重大進展[5]。如果圖像和語言能夠雙向翻譯,這將使得人工智慧的視覺知覺達到一個全新的高度。

在思維層面,未來人工智慧要實現類腦計算。2014年IBM 發布了類腦晶元TrueNorth,集成了100萬個「脈衝神經元」,能力相當於一台超級計算機,功耗卻只有65毫瓦,主要是因為它採用Spike NN結構,用類腦的非同步脈衝來驅動電路,而非傳統電路的同步時鐘。但它還沒辦法高效模擬另一個重要大腦機理,也就是觸突的可塑性,因此,性能離大規模商業應用還有一段距離。

從長遠來看,研究類腦計算是通往強人工智慧的有效方法[6]。傳統的計算機相當於左腦,擅長邏輯思維,處理數字;神經元晶元相當於右腦,擅長形象思維,處理圖像。IBM正想辦法將兩者整合在一起實現全腦的類腦計算。

*來源:圖片來自於互聯網

3、三元空間感知:人機物協同感知

超人的三元空間感知,在側重物理空間的感知層面,科學家正在研究人機物協同感知。突破肉眼感知的局限性是人工智慧的傳統強項,目前太赫茲技術得到很大的進步,上海交通大學跟相關公司合作,在研究太赫茲圖像識別,有可能在5-10米外就能夠識別藏在人身上的刀槍甚至毒品。2017年3月,上海交通大學還跟聯影公司成立了醫學影像先進技術研究院,合作研究成像裝備和大數據診療。可見光譜、紅外光譜、太赫茲、核磁共振等一起實現全譜感知,相當於賦予了人類以天眼、慧眼。

人機物協同感知的一個重大應用就是無人車。在美國加州,全功能的無人車已經允許上路。MIT Technology Review將自動駕駛卡車評為2017年10大突破技術。百度成立了無人車事業部,也在矽谷設立了專門的研究院。

4、三元空間感知:群體智能

超人的三元空間感知,在人類社會層面,正在湧現出群體智能新技術和社會計算新學科,利用互聯網、社交網路、通信網路、監控網路等不同網路的大數據,克服傳統社會學調查方法數據稀少的問題,更好、更快地分析人群、組織和社會的行為。上海交通大學較早開展了這方面的探索,2009年承擔了973項目「混合網路下社會集群行為感知與規律研究」,聯合了信息學、管理學、社會心理學等不同領域的專家開展交叉研究,一些成果為國家提供了決策。我本人承擔了其中「大尺度跨媒體社會集群行為感知」課題,結合網路媒體和視頻監控,為世博會、亞信峰會等大型活動管理提供了技術支持。

在973課題基礎上,我們最近承擔了國家重點研發專項課題,開展大規模人群透徹感知研究,針對反恐維穩、智慧城市、交通控制等需求。利用大數據和深度學習的優勢,進行多尺度、跨相機、跨平台分析,有望實現群體感知從簡單、低密度、小範圍場景到複雜、高密度、大範圍場景的跨越。

5、三元空間感知:互聯網超級智能

超人的三元空間感知,在側重信息空間的層面,未來學家認為互聯網正在向超級智能的方向不斷進化,形成互聯網、人工智慧和人類大腦的聯合智商,互聯網與人類大腦高度相似,它將具備自己的視覺、聽覺、觸覺、運動神經系統,也會擁有自己的記憶神經系統、中樞神經系統。2011年谷歌提出了「谷歌大腦」計劃,以大腦功能區,重新定義Google的業務群。最近,也推出了腦計劃。

*來源:圖片來自於互聯網

四、關於未來人工智慧的

社會經濟影響的思考

未來,強人工智慧將深刻改變人類生活,也給人類帶來巨大挑戰。霍金稱人工智慧或威脅人類,馬斯克認為人工智慧是在「召喚魔鬼」。儘管我們可以相信人類能夠和人工智慧包容發展,至少我們要注意兩方面的挑戰。

一、改變就業結構。不僅大量的流水線工人正在被替代,大量的白領工作崗位也將消失。十幾年前IBM深藍打敗了卡斯帕羅夫,今天我們還是不能小看IBM,AlphaGo還在打名氣,IBM的讀片機器人已經開始上崗。華爾街的量化交易機器人正在替代金融交易員,「今日頭條」的推薦機器人正在替代初級的內容編輯。

二、強人工智慧將衝擊倫理關係。機器人保姆帶大的小孩,還會不會跟親媽親?如果美女機器人擁有非凡魅力,人口數量和結構會帶來怎麼變化?植入了智能器官甚至機器大腦的人,還算不算人?

進一步,我們假設有一天「阿爾法狗」遇上「薛定諤的貓」的時候,也就是當強人工智慧運行在量子計算機上的時候,我們的未來會怎樣?

未來,機器人會是怎麼樣?未來學家們可能正在研究,機器人會不會做夢(意識)?機器人會不會結婚(性別)?機器人會不會用錢(信用)?機器人會不會統治人類(政治)?

未來,人類自身會怎麼樣?從歷史觀看,尤瓦爾·赫拉利不僅寫了《人類簡史》,還寫好了《未來簡史》,認為人類會從智人演化到智神。

未來,人類自身會怎麼樣?從生物觀看,人類的密碼在基因,基因分析是典型的計算密集型問題,這種單一任務的工作恰恰可能是人工智慧的傳統強項。有了基於量子計算的強人工智慧后,人類是不是最終會全面破解基因?很久很久以前,亞當和夏娃遇上了那條蛇,偷吃了智慧之果,被逐出伊甸園。億萬年後,他們的後代遇上了一隻「狗」和一隻「貓」,打開了強人工智慧的魔盒后,會不會摘下傳說中生命樹上的長生之果?這一切,人性中的慾望和貪婪,是否冥冥中早已註定?

*來源:圖片來源於互聯網



熱門推薦

本文由 yidianzixun 提供 原文連結

寵物協尋 相信 終究能找到回家的路
寫了7763篇文章,獲得2次喜歡
留言回覆
回覆
精彩推薦