search
尋找貓咪~QQ 地點 桃園市桃園區 Taoyuan , Taoyuan

吳恩達:人工智慧不僅能獲得創造力,還可能具備意識

【編者按】百度首席科學家吳恩達近日接受科技博客GigaOM採訪時表示,創造力並非深不可測,人工智慧不僅可以獲得創造力,甚至有可能具備意識。他認為遷移學習和多任務學習是我們需要探索的領域之一,同時他認為機器的行為在某些人的眼中已經具備了一定的創造力。機器最終也將在未來幾年更具「創造力」。

本文發於「AI世代」,由長歌編譯;經億歐編輯,供行業人士參考。

以下為原文內容:

吳恩達2014年5月出任百度首席科學家。他負責領導該公司的全球人工智慧戰略和基礎設施建設。他領導百度北京研究院和百度矽谷研究院,帶領技術團隊在語音、大數據和圖片搜索領域開展研發工作。

除了任職於百度外,吳恩達還是斯坦福大學計算機科學系的兼職教授。2011年,他領導開發了斯坦福的MOOC(大規模開放在線課程)平台,並教授了一門在線機器學習課程,聽課學生已經超過10萬。他後來參與創辦了Coursera,至今仍然擔任董事長。

在此之前,吳恩達還是谷歌大腦深度學習項目的創始負責人。他署名和聯合署名的機器學習、機器人及相關領域論文超過100篇。他2013年入選《時代周刊》評選的「全世界最有影響力的100人」。他先後在卡內基梅隆大學、麻省理工學院和加州大學伯克利分校獲得學位。

他將於2月15日至16日在舊金山舉行的Gigaom AI大會上發表演講,以下是我們對他的採訪。

問:請給我們講講你在百度的日常工作。你的人工智慧團隊都做些什麼?

答:我們會開發基礎的人工智慧技術,從語音識別到計算機視覺,從神經語言程序學到數據倉庫,再到用戶理解。我們會利用這些技術支持百度的很多內部業務,還會孕育新的方向。例如,在百度內部,我們所有的重要業務領域都已經被人工智慧改變。從網路搜索和廣告投放到機器翻譯和餐廳推薦。所以人工智慧已經在百度隨處可見。

除此之外,我們還看到了很多由人工智慧創造的新機會,例如更好的對話式醫療助手——它採用聊天盒子的形式。我們還使用面部識別開發了十字轉門,可以在有許可權的人接近時自動打開。所以說,我們的團隊正在追求垂直領域的各種新機會。

問:你做的事情有沒有涉及基礎研究的內容?你有沒有做過一些或許有用,但還不知道具體如何使用的事情?

答:我們會從事很多基礎研究。有些研究最初是一項非常成功的基礎研究,經過一段時間之後,當你從中看到實用價值后,它就沒有那麼基礎了。我們有很多這樣的研究。我們在百度開展的早期面部識別工作最初就像是基礎研究,但現在已經成為融入產品的一項服務,供數以億計的用戶使用。

我們早期在神經機器翻譯領域的工作最初也是基礎研究。事實上,此事包含著鮮為人知的一面:神經機器翻譯是一項最早由開拓、發展和推出的技術。美國公司在這方面遠遠落後於百度,這個例子可以說明我們的團隊處於領先地位。

我感覺我們在面部識別領域展開的計算機視覺基礎研究同樣處於先驅地位。我們目前正在學習機器人和機器學習等領域展開廣泛的基礎研究,涵蓋從基礎研究到應用的整個過程。

問:百度的團隊是什麼樣子?你們是否普遍採用小團隊形式?是否以開發人員為主?你們認為怎樣才能有效分配有限的資源?

答:這是個複雜的問題。我們的很多項目一開始都很小。比如一年前,自動駕駛團隊只有22人。但在取得一些進展,展示出最初的前景,並制定了經過深思熟慮的商業計劃后,便可因此投入更多資源,現在的團隊可能已經有幾百人了。這一開始是一個基礎研究項目,但現在成為了全新的業務方向。

所以我們有很多項目最初的團隊規模都很小,但在取得一些進展,價值越發明確后,便會將團隊規模擴大到幾十人,甚至幾百人。

問:你認為當今人工智慧技術有哪些難題可以在5年內解決? 有哪些事情如今看來很難實現,但5年後會變得稀鬆平常?

答:從研究角度來看,我認為遷移學習和多任務學習是我需要探索的領域之一。當今機器學習技術的多數經濟價值都是應用學習,學習許多標籤化的數據,以此完成你希望解決的具體任務。例如,利用龐大的標籤化人臉資料庫學習識別人臉。對於很多任務而言,我們在特定的垂直領域根本沒有足夠的數據來構建自己的系統。

所以今後的一大領域是遷移學習,你可以讓一套機器學習系統從事不同的任務。比如讓它學會識別常見物體。學會了識別常見物體后,可以利用其中的多少知識來從事面部識別這項具體任務?

從研究角度來看,我認為這很有前景,而且有一些技術目前已經廣泛應用於遷移學習,但我認為相關的理論和最佳實踐仍然處於早期階段。我們之所以看好遷移學習,是因為現代深度學習技術已經可以為具備海量數據的問題提供不可思議的價值。這可以為很多應用模式的發展提供巨大的動力。

以語音識別為例。我們在某些語言上擁有海量數據,比如普通話。某些語言的使用人數很少,永遠不可能有這麼龐大的數據。因此,可以將我們從普通話學到的知識遷移到這種語言,從而則針對只有少數人使用、數據量很小的方言提供語音識別。我們的確有這方面的技術,我們目前也在從事這方面的開發,但我認為這一研究領域的進步可以幫助人工智慧解決更多問題。

問:人工智慧是否為我們提供了有用的信息,幫助我們了解人類智能?或者反過來,我們是否利用對人類智能的了解改進人工智慧的效果?又或者它們雖然都有「智能」這個詞,但實際上卻截然不同?

答:神經科學領域的知識對最近的人工智慧發展只起到了一點作用。從現實角度看,儘管神經科學經過了幾個世紀的發展,但我認為我們至今對人類大腦的工作方式仍然很不了解,所以我們對人類大腦工作方式的了解並沒有給人工智慧帶來太多啟發。但實際上,人工智慧技術當前的進步更大程度上源於計算機科學原理,而非神經科學原理。

儘管如此,人工智慧已經非常擅長自動處理人類所能從事的事情。例如人類非常擅長識別語音,而人工智慧語音識別也在從事相同的任務。人類非常擅長識別人臉,人工智慧也在這一領域取得了快速進步。

結果就是,我們的工具更擅長自動處理人類所能完成的工作,而不是解決人類都無法勝任的任務。原因有很多,但其中之一在於,當我們選擇一項人類能夠完成的任務,然後讓人工智慧介入其中之後,就會努力研究為什麼人類完成任務的速度更快。所以,如果你看看人工智慧的各種垂直領域,肯定會發現一些連人類都不太擅長的任務。

我認為亞馬遜現在為我推薦的書甚至比我妻子推薦的還好。要知道,我妻子對我非常了解。之所以出現這種情況,是因為亞馬遜匯總了海量數據,了解我瀏覽過哪些書,在網站上看過哪些書。從這個角度看,它遠比我的妻子更了解我在看什麼內容。

雖然也有一些例外,但當人工智慧試圖處理人類力所能及的事情時,我認為整體的進步速度很快。

問:談到人工智慧所能完成的任務,你總是顯得很保守。我猜之所以這樣,部分原因在於過高的預期曾經對科研工作產生過極大的影響,尤其是在資金方面。是這樣嗎?

答:我通常很務實,也很實際。但我希望提供一個略有不同的視角。如果我要組建一個團隊來治癒人類所有的疾病,那肯定值得慶祝。這是個偉大的任務。但說實話,有時候把目標定得太高會付出代價。在當今的矽谷,這顯然不受歡迎,而且逆勢而為。矽谷現在都喜歡談論登月那種級別的目標,因為即便你失敗了,仍然會成為明星。

但實際上,我認為把目標定得太高會付出代價。所以,跟組建團隊來治癒人類所有的疾病相比,更有成效、對世界更有利的做法或許是解決瘧疾問題。所以我認為,我們可以通過人工智慧技術給世界帶來一些重大改變。可以用無人駕駛汽車改變交通狀況,也可以利用人工智慧技術改變物流行業,甚至可以用人工智慧技術徹底改變醫療技術。可以藉助人工智慧技術給世界帶來重大變革。

因此,我的很多工作都瞄準了這些具體而務實的目標,因為我認為,相比於花時間描繪科幻小說那種幾百年可能都無法實現的場景,這樣做對世界更為有利。我知道這種思維方式在矽谷已經不再流行,甚至逆勢而為。

儘管如此,作為一個社會,我們應該從事各種各樣的事情。所以我認為世界會變得更好,有的人會通過蓋茨基金會和世界衛生組織解決瘧疾問題,我們在對抗瘧疾的過程中或許已經取得了實質性進展。但同時也有一些人在解決人類的所有疾病。以不同方式分配社會資源是件好事。

但我的確認為,如果能夠思考「我們有信心解決哪些任務?」而不是「我們應該投資哪些遙不可及的夢想?」肯定有助於我們所在的領域取得進步。我們團隊有一部分人在從事這些工作,但僅占很小一部分。

問:你相信有可能實現強人工智慧(AGI)嗎?如果相信,你認為這有可能藉助摩爾定律,在我們所知的技術革命道路上實現嗎?或者,要實現強人工智慧,是否需要藉助全新的突破,甚至我們不曾預料的突破?

答:要實現強人工智慧肯定需要很多突破。這很可能發生。既包括軟體演算法突破,也有可能包括硬體突破。但究竟是在十年、百年還是千年以後實現,我很難預測。

問:你認為人類的創造力(例如創作劇本或偉大的小說)需要藉助強人工智慧技術,還是利用現有的技術即可完成?

答:我認為很多時候,當我們不知道某個東西的創造流程時,會思考很多創造力方面的東西。例如,加里·卡斯帕羅夫(Garry Kasparov)曾經說過,他從深藍的招數中看到了創造力。而作為技術人員,我了解國際象棋程序的運行規則。通過海量計算,它們使出的國際象棋招數甚至能被象棋大師視作創造力。

當我自己參與到創造流程之後,我發現創造力是很困難的事情,需要將很多小東西逐漸拼湊起來,然後形成一個似乎不知來自何處的大東西。但如果有人沒有看到所有的小東西,那就很難將所有小東西拼湊成有創意的東西。有的時候,與從內部觀察相比,從外部觀察創造力會感覺這更像是一種魔術。

我的藝術家朋友會反覆訓練自己的筆觸,一遍一遍不厭其煩地繪製相同的東西,逐漸取得進步。我的祖父是一名畫家,他通過日積月累的進步創造出優異的作品,當你見到最終的作品而沒有目睹整個過程的點滴進步時,我認為你更會感覺這像是一場魔術。但如果你本人需要從事各種工作來實現這個點滴進步的過程,恐怕就不會有這麼強烈的衝擊。

問:你的言外之意是說,人類的創造力是可以通過計算獲得的。在某個時間範圍內是合理的。這並不是什麼超凡脫俗的神秘能力,並沒有超越我們的認知。是這樣嗎?

答:沒錯。無論是偶爾令人眼前一亮的象棋妙招,還是找到一句人類未曾思考過的句子解釋,抑或創造一件簡單的藝術品,我認為機器的行為在某些人的眼中已經具備了一定的創造力。我們可能會繼續看到點滴的進步,而機器最終也將在未來幾年更具「創造力」。

問:你的團隊在地理上是如何分佈的?多數人都在哪裡?

答:主要在北京,我們在美國大約有一個100人的團隊,北京有幾個大型團隊,在上海和深圳還有幾個小團隊。

問:有了機器人,你可以看到國家和地區的重點開始浮現。例如,與其他地方相比,日本更重視提升機器人的友好度,讓人類可以與之建立情感聯繫。人工智慧領域是否也是這種情況?因為你之前提到面部識別已經進入。不同公司、不同地區或不同國家對於人工智慧的看法是否會有差異?

答:我認為面部識別就很好地證明經濟壓力和一流的商業模式已經推動實現了很大進步.。從產品角度來看,不同的商業壓力和產品優先順序導致不同國家對不同領域的投資力度有所差異。

就有一些現成的例子:在,通過手機鍵盤輸入中文比輸入英文更痛苦。由此便產生了很多壓力,催生了更好的手機語音識別技術。所以我感覺,百度引領的很多語音識別突破都源自產品壓力,必須為用戶提供有效的語音識別功能。

具體到機器翻譯,美國針對神經機器翻譯展開了很多公關工作。但鮮為人知的是,神經機器翻譯是由率先開拓、發展和推出的。美國大型公司後來才開始發展這項技術。我認為,之所以出現這種現象,原因之一在於人很需要把公開內容翻譯成中文。而英文世界里已經有很多英文內容。中文內容同樣很多,但外國內容也在快速翻譯成中文。這就像一種文化現象。由於世界上有很多英文內容,我認為說英語的人接觸外語內容的壓力較小。

面部識別業務在進展飛快,因為作為一個優先使用移動設備的社會,人已經習慣了開展重大的財務交易。例如,你可以向百度申請教育貸款,我們就會根據你在手機上的行為貸給你很多錢。而當我們通過手機給某人匯去很多錢時,就很希望能驗證此人的身份。所以面部識別就成為這一領域的關鍵技術。正是因為面對這些壓力,才使得面部識別在實現了快速發展,速度超過其他國家。

和美國都在人工智慧領域展開了很多創新。我猜還有其他領域。英國在人工智慧遊戲領域進行大舉投資,我本人並沒有投入這一領域的研究,但我估計不同組織有著不同的興趣和重點。

我認為當今的人工智慧發展已經成為一個全球化的現象。我感覺還有很多創新是英語世界的人沒有意識到的。問題不在於保密與否,關鍵是缺乏流暢的交流能力。例如,我幾周前剛剛參加了NIPS大會。短短一天內,NIPS上的多數重要講話都已經總結和記錄成中文,並發表在的網站上。也就是說,把巴塞羅那的英語會議上的知識翻譯成中文的速度很快,效率很高。這樣一來,很多研究人員一天之內就能看到這些內容的中文翻譯。我認為,正是因為很多人都能用英語流利地閱讀和講話,才使之成為可能。

可惜的是,把中文翻譯成其他內容的速度卻慢得多,這完全是因為之外的很多研究人員都不說中文。所以雖然發明了很多東西,也有很多東西廣為流傳,但英文世界的人卻並沒有注意到。有的時候,英語世界的公司可能要到一年以後才能發明類似的東西。

因此,我希望能夠幫助人們加快知識的反向傳播速度。因為,如果我們建立一個更加國際化的研究社區,全世界都將取得更快的進步速度。

我覺得還有一些更具體的例子。一年多以前,普通話短語的語音識別率已經超過人類,但這個結果直到最近才在全球廣為人知。我還見過很多例子,從語音識別進步到神經機器翻譯進步,再到GPU開發流程的進步。但我希望在發明出來之後,能夠儘快傳播到美國。

問:你能否介紹一些網站或期刊,方便我們找到這些信息?

答:中文的知識傳播方式與美國不同。人工智慧知識在社交媒體上傳播速度極快,如果你不親身體驗,就很難理解這種模式。此外還有很多網站,但很多都是中文網站。你可以在Twitter上關注我,看看我能做點什麼。

問:你對人類意識有什麼看法?或者更具體地說,你是否相信人類的意識本質上也是一種計算?

答:我不知道意識是什麼。從哲學上講,關於你周圍的人是真的有意識,還是行屍走肉,抑或是通過計算表現出意識的機器人,一直都有爭論。畢竟,我們如何知道自己之外的其他人真的有意識,而不是機器人?我不認為意識是計算機永遠無法達到的,但目前還不清楚究竟如何實現,需要多少年才能實現。



熱門推薦

本文由 yidianzixun 提供 原文連結

寵物協尋 相信 終究能找到回家的路
寫了7763篇文章,獲得2次喜歡
留言回覆
回覆
精彩推薦