search
尋找貓咪~QQ 地點 桃園市桃園區 Taoyuan , Taoyuan

【未來已來】人工智慧PK人類智慧

《金卡生活》雜誌

銀聯 主管主辦

理論研究 實務探討

我們

作者系澳門大學學術副校長,香港科大霍英東研究院院長,香港科大校長特別助理,計算機科學與工程系講座教授,相關領域國家重點基礎研究發展計劃項目首席科學家。

編者按:國務院總理李克強在3月5日第十二屆全國人民代表大會第五次會議上所作《政府工作報告》中提到,要加快培育壯大新興產業,全面實施戰略性新興產業發展規劃,加快新材料、人工智慧、集成電路、生物製藥、第五代移動通信等技術研發和轉化,做大做強產業集群。值得注意的是,「人工智慧」首次寫入《政府工作報告》,這為發展人工智慧釋放了重要的信號。2017年,人工智慧又為我們帶來什麼?

么是人工智慧?計算機是如何實現圖片識別、指紋識別、面部識別的?機器人如何實現與國際象棋選手對決?戰勝圍棋世界冠軍李世石的AlphaGo的成名秘訣是什麼?人工智慧的極限在哪裡?未來它會成為人類的威脅嗎?知名計算機科學家倪明選教授向我們講述了最新的人工智慧科技成果,這些令人興奮的最新進展,將為人類未來奠定富有想象力的長期技術創新基礎。2016年的春天,AlphaGo與世界頂級圍棋高手李世石進行人機世紀對戰,這一場曠日持久的「人機大戰」在圍棋界和科技界引起了巨大的輿論漩渦。再往前,智能機器人漫步雪原森林,顯得很輕巧很智能。一時間,把人工智慧浪潮推上了全球新高。

人工智慧VS大數據

2016年2月,物理界有個大事,「引力波」被證明是存在的,同時也再次證明了地球爆炸原理。如果說在物理科學領域「引力波」是大家探討最多的關鍵詞,那麼在計算機領域,「人工智慧」則是最熱門的新技術。

什麼叫「智能」?(8377×579)/2=?這道題可能我們中的大部分人都無法立即給出答案,在江蘇衛視《最強大腦》節目中,雨人周瑋憑藉超出常人的計算能力成為眾人矚目的焦點。周瑋可以不靠計算器直接給出答案,不得不說這是一個奇迹。實際上,在計算機發明之前,我們通過計算器完成一些難度係數較大的計算,但絲毫感覺不到威脅或挑戰,因為它只是一個「工具」而已。

我們再來看一道計算機領域有名的難題:如何識別人臉和狗臉?為了讓計算機辨認,研究了好多年,直到最近這個問題才有所突破。所以說,智能的「智」是學習產生的。

人工智慧(AI),是每個計算機工程師的夢想,讓機器變得和人一樣智慧,早在上世紀70年代末到80年代初就帶動了風潮。在1980年我讀博士時,美國喊得最紅的就是「人工智慧」,但當時感覺是「Totally useless」。然而,學者們沒有放棄,繼續深入鑽研發展到第二波「專家系統(Expert system)」階段,即在某個領域內解決問題。AI的第三波叫「數據挖掘」(Data mining),AI的發展到這時開始漸露曙光。再發展到近期,也可以稱作是AI的第四波,即「大數據與深度學習(Big Data and Deep Learning)」階段。

我們講了這麼多年「大數據」,大數據是一個突破性、革命性的工具,是使人類在各個領域「分析事情」,並得以極大改變的最新工具。再通俗些講,如果說老師是教人學習的,那麼「大數據」是來教機器學習的。AlphaGo能夠打敗世界圍棋冠軍李世石,是基於大數據技術。那麼到底什麼是人工智慧?第一,能夠理解知識;第二,懂得學習,這是KEY;第三,能夠普遍適用。

電腦學習VS人腦學習

我一直在想這個問題,機器到底怎麼學習?人腦跟電腦到底有什麼差別?我們先看人腦是如何學習的,人腦裡面有上千億個神經元,有很多樹突,每個樹突經過神經元做函數的運算,然後產生結果。人的記憶量好像很大,這是人腦的特性,但也是有限的,而且會記錯。除此之外,人腦能夠做推理、分析、搜索、計算等等。

「電腦」如何學習?電腦是數字化的,是0和1組合的、有學習能力的「感知器(Perceptron)」,這是人工智慧神經網路的雛形。1958年,美國心理學家Frank Rosenblatt分析提出,人腦中有這樣一個複雜並交互的系統,我們能不能把這樣一個系統數字化,讓電腦模擬出來。所以說,電腦學習的基本結構最初就是模仿人腦神經樹突結構而來,在電腦神經網路中,有input、output、function,每一個權重是不一樣的,各項系統參數的配置也相應不同。電腦的特性是記憶比人強、各種邏輯能力比人強、計算比人快。

先看電腦如何學「字」,其間用了N個神經元,然後在裡面設置很多參數,並且不斷調整和完善,再調參數,調完參數再反饋,一直按照這個程序來做。所謂調參數就是一個優化的過程,首先找「字」的特徵,然後按照或然率(也叫概率、幾率,是對可能性大小的科學說明和測定)排序。事實上,各個公司比較產品的高下,也就是說我做的參數比你做得漂亮,我的成功率大,那你就輸給我。再看圖片識別,神經網路理論上是可以認出圖片的,但是需要神經元的數目巨大。多倫多大學的Geoffrey Hinton教授推出了「深度神經網路」,原理是把神經元拉了很多層,變化是用乘法來計算。之後,谷歌用1000台電腦,從網上抓了1000萬張貓的照片,用10億個參數,讓電腦認出了貓。

那什麼叫深度學習?在不增加參數參量的情況下,模型有強大的特徵表達能力,基本上需要自動地從底層過渡到高層,分類不同特徵。到底要多少個神經元?有多少層?層和層怎麼連接?參數多少?初始值多少?怎樣反覆調?這也是一項項非比尋常的挑戰。

圖片識別每年都有比賽,用5000多張有編號的照片來訓練機器。到2011年,大概只認出74%;在2012年的時候,Geoffrey Hinton團隊找出了最大突破,達到了85%,這個結果一公布,全世界轟動了;2015年,微軟位於北京的亞洲研究院參數調整率達到了96.4%,比人眼識別還要准,用了152層的,叫Convolutional Neural Network(卷積神經網路)。從不會認到會認,再到認到96.4%,要用大量已知的東西訓練它,調參數,不斷增加它的可認度。

人工智慧未來會怎樣發展?

機器把冠軍打敗了,這使我對人工智慧從看不起、純忽悠到改變了認知。棋盤就是一張圖,我input 這張照片,19×19,需要大量的數據來訓練我的神經網路。根據直覺,我們通常下棋的時候,下完一步,肯定要想對方會下哪裡,然後再想我的應對是走哪一步。不管是圍棋還是象棋,高手都是能夠預估後面2、3、4、5 步棋。

如果說計算機有無限的速度和空間,那是否能用「窮舉法」來預判後面所要走的棋。假使機器有能力把所有的排列組合都能夠放進去的話,那麼下棋是不會輸的,但問題是,「窮舉法」是無法實現的。也就是說,目前先進入卷積神經網路,然後算廣的應該幾步走、深的應該幾步走,對所有的可能,做一個快速的模擬來決定勝負,這就是AlphaGo 的基本原理。

計算機如何做到這些?有兩種方法:第一種,專家設計訓練參數,先把不合理的刪掉,減少搜索的空間;第二種是自己跟自己打,下完之後,修正自己的模型,迭代500 次以後再對打,之後再產生更好的模型,再繼續打,一直不斷地把參數調上去。

第一種也叫「 深度剪枝」,降低勝率較低的下子步驟。每次下子,要對當前棋盤做勝率的估算。如果勝率大於50% 了,再往前走;如果勝率小於50%,那再換一步試試。要訓練那麼多的神經網路,要用很多的棋譜來訓練它。只找5-9 段的高手棋譜來做參數,也需要用16 萬場棋來訓練,用2840 萬步來調參數,再用100 萬步來作驗證。即便通過這樣的方法,計算機下棋的勝率也只是47%。概率還不夠,怎麼辦?

這時,就要用到第二步,神經網路是用已知的東西來調參數,自己和自己下,英文叫Reinforcement Learning。再產生3000 萬局,一直不斷修正模型,一直達到新的模型能夠比我第一步達到的概率還要高80% 以上。

1997年IBM 的Deep Blue打敗了俄羅斯人國際象棋特級大師卡斯帕羅夫,做法很簡單,就是把所有能買到的棋譜全部輸入電腦,包括殘局。所以,Deep Blue 完全是按照棋譜上過去的步伐來走的,第一次它輸了,又增加一些棋譜進去,它贏了。

深度學習、人工智慧,對我們是個突破。因為它不只能夠理解知識,還懂得學習,而且應用非常廣泛。最早的應用是語音識別,從語言的理解,到同聲翻譯,也可以是圖像識別,微軟就是用神經網路做圖像識別。這是人工智慧的一大突破,大家都在研究怎麼用,可以解決什麼樣的問題,這是目前最接近人類的學習方式。

Hinton 早就做出了深度學習網路,為什麼一開始它的方案沒有得到更好地應用,就是因為它的東西無法得到驗證,那個時候沒有大量的數據來訓練。如果用大量的數據來訓練,機器又太慢,也是不行。所以,因為有了大量的數據,有了超算、很多GPU 等等,它終於可以實現了。

所以說,大數據和超算帶動人工智慧發展,進而引爆人類社會革命,影響深遠。金融、生命科學、精準醫療等領域,今後要做的都是靠大量的數據來訓練機器。有人問我,機器人會對人類社會造成威脅嗎?我覺得不會。機器人砍你是因為有bug,而這個bug 是由人來控制的。

人工智慧可不可能做創新?我的答案是不可能。人工智慧是一個更高級的工具,數字化電腦僅僅是模擬人腦,應該不會有智慧。科技創新是為人類帶來福利,遵循的原則是不應該為人類的有序生存帶來災難。真的有一天,我的機器人有智慧,可以創新;有情感、有直覺,能探索未知,甚至超越人的想象和思考,那麼,我們可以謙遜地在機器搬家的路上過上好日子,也可以傲慢地死去。



熱門推薦

本文由 yidianzixun 提供 原文連結

寵物協尋 相信 終究能找到回家的路
寫了7763篇文章,獲得2次喜歡
留言回覆
回覆
精彩推薦