國家「863」專家張文生：從深藍到AlphaGo，人工智慧雖難但是在進步

張文生：「人工智慧的未來實際上前景還是很廣闊的，我們儘管難但是我們還在進步、還在往前做，它是一個演進的過程。」

以下為現場實錄：

首先我們說人工智慧實際上出現了很多事，就是從1956年Dartmouth會議上以複雜信息處理為主體的會議，到現在我們人工智慧又熱起來，這個中間有很多事情我想講一下。另外從1957年馬文·明斯基的神經計算機當時他還在上學，後面就是關於Watson這樣一個過程，最後我們從跳棋到IBM的深藍又到後面谷歌的AlphaGo，這樣一些事情預示著什麼？

人工智慧實際上本身是作為研究、開發、模擬、延伸和拓展人的智能理論、方法、技術與應用系統。機器人實際上是人工智慧一個展示，當然不是全部。人工智慧我想講的是人造的智能，主要是想把有智能的生物體特別是人的智能怎麼樣用機器來實現，最集中的可能還是在大腦上。我們說人工智慧它的內涵和本質，從這個問題出發六十年了它做了很多事，但是哪些是我們應該關注的事情？這個可能我簡單說一下。

實際上在人工智慧這一塊，有的人劃分得很多，我覺得劃分兩塊就可以了：

第一塊就是結構派，我們要研究一下產生智能的載體到底是怎麼樣的，通過研究載體我們怎麼樣做一種機器，讓機器來模擬載體的結構那就是神經元的過程然後進行信息的智能處理，這就屬於結構派。像現在我們用的很多神經元網路、深度學習等等都是這樣一排。

另外一派就是鳥飛派，也就是在模擬人腦的功能、智能功能。比如我們最早的，實際上是一個黑箱子過程，比較典型的就是飛機，我們要造飛機，鳥能飛起來是有翅膀來回動飛起來，我們的飛機不動、翅膀不動怎麼樣能飛起來？實際上在功能上的模擬，裡面結構到底怎麼處理的我們不關心，實際上這樣兩派。具體實現又有很多的相應技術。

人工智慧和機器人相關，在我們人工智慧領域裡面有一個叫臨場感人工智慧，很像現在的增強現實。

最早是做昆蟲，美國相應的大學、歐洲大學做昆蟲，希望把智能的東西在昆蟲這樣一個載體上來實現，進行感知、進行認知、進行控制這樣一個過程。最具代表性的是1986年Brooks臨場感的提出，主要是對環境的適應。

另外一塊就是工業機器人工業生產線，這個剛才趙老師和曲總都會講，這裡面都是大家我就盡量不講，因為講起來害怕講錯了。

另外一塊就是類人機器人和臨場感機器人有突破，比如能夠進行識別手勢應答新加坡做的工作。比如我們科技大學做的這樣一個佳佳的過程，你看兩個人模仿她很像，但是大家會發現她的行為很少，打招呼、簡單交互但是更多的東西還是做不到的。

另外一個像美國做的一些大狗，然後仿照士兵的行為，能夠站立、能夠奔跑。包括足球機器人，做的也比較多，那麼它內部大腦的控制和感知這一塊是屬於我們，包括發送一些指令這是人工智慧要做的事情。

人類做人工智慧追求什麼？追求就是要把人類的大腦變成機器的大腦、機械的大腦或者是鐵打的電子的大腦，最終核心就是我們這個大腦到底怎麼樣發揮作用，這是一個我們要關心的事情。

我們說什麼叫智能？這個智能實際上定義五花八門，它是認知和理解世界環境的能力，這是一個方面。另外我們說能夠通過提出概念建立方案進行演繹、歸納、推理進行決策的能力反映在智能上。另外他的學習能力、自適應能力等等，總的來說人類的智能涉及到信息的描述以及信息處理複雜的過程。

那麼複雜信息的處理到底是幹什麼的？實際上複雜信息的處理我們計算機是搞計算的，計算這個東西我們說信息的加工實際上就是一種計算。我們怎麼樣把數字的計算推到符號的計算？也就是說我們怎麼樣進行符號的加工、符號的表示、符號的推理以及學習？這個過程是由傳統的計算到人造智能的過渡過程。複雜信息是什麼信息呢？是非線性信息，所以處理起來就相當的麻煩。

實際上人工智慧的本質是複雜信息處理，那麼這樣的過程大家起了個好名字，但是很多人把這個東西給忘掉了。我們說人工智慧的任務實際上就是做這樣一個過程，根據人類信息加工原理設計計算系統，使計算系統來完成更複雜處理的任務。另外一塊就是用計算系統來研究人類的思維活動。

最早檢測智能是圖靈測試，實際上這個大家都知道，但是圖靈測試最關鍵的一條是所有人都認為這個計算系統跟人區別不開，那麼這樣一個定義被媒體給偷換了。比如AlphaGo只戰勝一兩個冠軍然後它認為就把人類給戰勝了，包括深藍很早下國際象棋把卡斯帕羅夫下敗了就認為把人類下敗了，這是概念的偷換，你把李世石下敗了不一定能下過張世石不一定能下過另外一個人，你能說它會超越人類嗎？這是另外一個。

但是我們覺得這樣一個偷換就激勵人做的更好。人工智慧你做的系統是不是就有智能？你得試，怎麼試呢？你得找這樣一個領域，包括人機大戰，整個人機大戰過程就是在試你的系統具不具有智能這樣一個過程。

人工智慧實際上發展得很快，他能夠解代數方程、證明定理、學習和使用英語等等。在情感這一塊，在這個過程中大家非常樂觀，認為很快當時認為二十年就會怎麼怎麼樣，但是事實上這個樂觀一直沒實現，一直沒實現主要原因就是人們對他的估計不足，對這裡面的估計很不足，所以造成了一連串的打擊，對這個學科的打擊。實際上是困難重重的，比如我們要證明連續函數的和仍然是連續函數，如果要是用計算機來證明，這就要用到人工智慧最重要的就是歸結原理，要做這個東西要做十萬步仍然做不出來結果，那麼這麼簡單的東西它就做不了，證明這個問題讓計算機做還是很複雜的。

另外一塊是下棋，很多人說世界計算冠軍很多人都下過了，但是到現在都沒有下過。包括翻譯，自然語言翻譯經常鬧笑話，這裡面的原因是什麼呢？我們想造一個人造的系統來反映人類，在反映人類的時候你要處理的能力是怎麼樣？實際上我們人類如果從結構上看，我們的大腦有11-12次方的神經原它的連接大概是10的11-12次方，這麼複雜的東西我們怎麼樣構造一個函數甚至一個系統能夠實現它呢？現在大家冷靜期來看，這是非常難的一個事情，甚至是很難解決的一個事情。

我們看一下象棋，國際象棋的比賽。走第一步有10的120次方可能，那麼我們要用計算機算要算這麼多年根本沒法做，不管有法做沒法做但是這是確定量的，它的理都是確定的。走了這一步往下一步算只是時間問題、只是存儲問題，但是我仍然能夠算出來，這個大家要注意。就是如果我能算出來的，用解析的方法算出來的我個人覺得不是大事，那就是計算量存儲問題。另外一個是算不出來的，那是難事。在這樣的情況下，大家為什麼做的遊戲還能戰勝一些人呢？就是他不是全算，而是在這裡面採用了一些技術，比如減枝技術、啟髮式信息技術在這裡面做了工作。

2010年以後人工智慧又火起來了，處理主要核心就是信息的有效利用，包括剛才講的一些國家重點專項、重大專項裡面也是複雜信息、複雜場景的感知、複雜場景的理解、複雜場景的判斷和預測，主要是做這個問題，有效信息的利用。

下面我們就簡單說一下，人工智慧的核心是三個東西：表示問題、推理問題、搜索問題。

實際上我們人類聰明不聰明？聰明的人表示問題非常簡潔，由於你表示問題簡潔、概括性強那麼你推理非常快，如果你是亂麻糟的東西推理起來肯定很亂，最終你要得到結果肯定要在大腦裡面搜索你已有的東西，這三個東西是人工智慧的核心。你做來做去做人工智慧就做這三個東西，不管怎麼變都是在做它。

在理論上講，表示主要是知識的表示，而不是數據的表示，知識的表示就是在特定的函數下這個理論模型，如果這個理論模型跟真實模型一樣那麼這個問題就解決了，大量的情況下不一樣。在工程上我們就要在特定結構下建模，這是表示。另外推理實際上我們是有意義的，也就是在給定邏輯公理，在公理下進行演繹。

對於人工智慧來說公理不僅僅有數學意思更重要的必須有實際意義，如果沒有實際意義這個人工智慧就沒用了，就變成數學了。最後搜索所有的問題因為複雜信息是非線性的都是NP的，那麼我們怎麼樣把非指數的變成線性的或者是近似線性的這樣一個過程實際上就要用到難度曲線方法，一級啟髮式的方法。也就是說我不知道背景在哪，我可以問一下北京在北邊，蘇州在南邊我就往北走，這樣的話這個方向就是啟髮式信息給大家了。數學追求的是精確，我們追求的是次優。

下面我簡單講一下人機大戰預示著什麼，到底背後是什麼，看熱鬧大家都在看。實際上大家知道1956年提出來的人工智慧，那麼1957年這兩個大佬他們就開始研究跳棋，讓機器來玩跳棋，這當時還是很厲害的，還想到要做符號。做這樣一個過程他們希望十年之內戰勝國際象棋冠軍，事實上60年了，仍然沒戰勝，我剛才說了很難。

那麼哪些能戰勝呢？有些不能戰勝，哪些能戰勝呢？

IBM國際上非常有名的公司他就選了一個我能戰勝的領域來做，那就是在國際象棋冠軍裡面的深藍做了這樣一個機器人。這樣一個機器人經過了1985年、1996年、1997年到2011年這樣一個演變，這樣一個演變過程比如在1985年的時候然後卡斯帕羅夫一個人下32台電腦，仍然電腦下不過他，這裡頭當時計算、搜索、推理能力很弱，當然當時的演算法都有，當時的演算法數學的東西都有，但是由於機器跟不上所以他後來就考慮了其他的事情。

到了1996年，他比賽的時候能夠實現比賽結果4：2，這時候卡斯帕羅夫就感覺到有壓力了。在1996年2月10日-17日之間他們比賽的時候出現了這樣一個結果，就是出現了深藍的戰績勝、和、和其他都敗。這樣一個過程創造了計算機首次在規定時限的條件下贏下了一名國際象棋冠軍的記錄，這樣一個記錄之後經過了14個月的攻關主要是對晶元加速、對軟體改進然後做啟髮式評估函數這樣一個過程，然後對他的復盤、檢測以及全新的評價函數做減枝，大家能看到AlphaGo做的東西只不過算的複雜一點，但是計算機複雜了所以我後面在講做的主要是減枝。

做了這樣14個月，最終終於戰敗了，後來卡斯帕羅夫說我再跟你下我不信我下不過你，結果人家不下了，給你二百美元就不下了，因為再下有可能下敗。IBM為什麼花三千多萬搞這個事呢？重要的是由於IBM想創造一個先機，說我的計算機不單硬體好，我的軟體也好，那你要買你就買我的，我軟體也好、硬體也好，你不買我的買誰的呢？算是做廣告。

這樣一個情況下IBM賣了十幾年發現又有競爭對手了，當時光下棋不行，大家希望追求的是能夠理解自然語言，能夠對自然語言進行回答。他就選了另外一個不下棋了，選擇了一個類似於的《一站到底》、《開心辭典》，我們競爭我們選，誰選上了誰回答，回答了之後贏錢。

這樣一個涉及到歷史、文學、藝術、科技、體育等等五花八門的問答強答，上一次選的卡斯帕羅夫最牛的世界冠軍，這一次他選了兩個，一個是美國的獲獎金最多的，從2002年到2005年得了330萬美元的這位老兄，然後又選了一個永遠不敗記錄最長的連續勝了74場的這樣一個人，他用這兩個人我的機器跟他們答，結果最後經過比賽沃森也贏了。

這個贏的很艱難，要快速理解問題要識別人類的語言而且還要分析微妙的諷刺、聯想這樣微妙語言的意思，這是很難的。另外還要模仿人，模仿人的搞笑另外與互聯網斷開自己想這樣一個過程，這是他的問題。

另外他的團隊大家看涉及很廣，很多人都對他進行支持。這個能做，為什麼在1997年、1998年、1999年不做呢？大家看這裡面用了90台伺服器，然後處理晶元的個數以及處理的速度峰值每秒八十萬億次，原來根本做不到。另外一個它的存儲容量15T，能存這麼多的東西在裡面，所以脫開以後仍然能夠工作，而且比人強，這個是由於技術的進步為信息技術的進步提供了工具。

另外一個在技術上光技術硬體進步不行還有軟體，這裡面他建立了一個新的體系，就是深度開放域的問答系統，這是很難的東西。這個難的東西，現在掌握和應用這樣一個框架的公司不多，主要是有一百多套核心的演算法有域網路的技術，另外可以在三秒之內把問題給解析了，這個很快，比人快，然後解析了以後馬上就選擇，花了這麼多錢做了這麼多事，然後結果非常好。

我們對比深藍和沃森，他們兩個計算能力沃森是深藍的1000倍，解決的問題也不一樣。深藍下棋包括AlphaGo做的都是確定型的，就是只管算就行了。而沃森做的是模糊型的，我們人類主要是模糊型的信息，這是一個質的跳躍而不是量的增加，這是人工智慧最重要的。不同的里程碑，深藍解決的是數學問題，而沃森解決的是常識問題，這是人類最核心的東西。

由於戰勝了他，IBM現在火了，機器根本不用宣傳大家都在買。我告訴你，全世界的銀行用的幾乎全是IBM的機器，你想想那得多大，金融業幾乎都用他的，也是用他的。他應用很廣泛，但是現在只做三個領域，第一是金融領域，第二是政府管理，第三是醫療健康領域，其他的不做，其他的願意做別人做去。

真正實現了計算機的感知能力重大的突破，使得IT產業從「人圍繞計算機轉」變成「計算機圍繞人轉」的進步，這樣一個過程。

另外讓人基本上從聽不懂人的感受到聽懂人的感受，這是非常難的一個過程。我為什麼不講AlphaGo呢？它是一個確定問題。我個人覺得就是深藍上的增量增加，它用的東西就是計算能力強了，創新體現在是深藍仍然設計評估的函數，而AlphaGo是靠學習來做評價函數，這是兩個本質不一樣的，這是機器裡面學習的本質不一樣，這是有進步的，最後套在Deep Learning上這不是一個大的問題。

最後我講一下人工智慧的局限與展望，人工智慧的局限實際上就在認知領域我們有局限，對人類大腦的結構和功能我們遠遠不了解。第二個就是智能物化的方法和途徑，我們在結構派、鳥飛派上我們也有局限。第三個是數學，數學上的局限在於數學解決的是結構不變的東西，而人工智慧解決的是結構大量開放域，開放域這個東西就容易發散。另外數據解決了封閉系統，而人類解決的是開放系統，這兩個系統完全不一樣。

數學解決的是線性問題而人工智慧解決的是非線性問題，數學追求收斂，人類往往是發散思維。另外鼠雀解決的是精確解，而人工智慧解決的是近似解，這是完全不一樣的。有人說把數學扔了用其他的，門都沒有，還得用。還有計算模型、演繹理論以及硬體軟體實現上也有局限。

人工智慧的未來實際上前景還是很廣闊的，我們儘管難但是我們還在進步、還在往前做，它是一個演進的過程。包括現在兩會開了以後把人工智慧寫進五個領域之一，這實際上對我們做這個行當的人是一個激勵、是一個利好。