search
今天柯潔與阿爾法狗「終極決戰」,150萬美金創圍棋獎金史之最

今天柯潔與阿爾法狗「終極決戰」,150萬美金創圍棋獎金史之最

今日,兩次出手都讓吃瓜群眾大驚失色的「AlphaGo」又要殺回來了,這次對戰的對手將是棋手柯潔,其意義對觀眾來說當然非同小可。加之醞釀已久的「終極決戰」和高達150萬美金的史上最高圍棋賽獎金,這場「捍衛人類尊嚴」的大賽必定萬眾矚目。

但相比於棋盤內的勝敗,我們卻更希望在這時候聊一下AlphaGo的創造者,著名人工智慧企業DeepMind。

對於大部分人來說,常識中AlphaGo是由谷歌製造。但事實上,DeepMind雖然在14年就被谷歌收購。但總部和項目始終繼續保留在倫敦,人員也對外保持著高度的神秘性。另一方面,即使對DeepMind有了解的人,也更多的是知道它的創始人戴密斯·哈薩比斯(Demis Hassabis)是一位少年天才,4歲下國際象棋16歲進入劍橋等等。但DeepMind作為一家創業企業的規劃、產品序列和目標實施情況,好像總是隱藏在一些面紗之後。

從目前消息來看,谷歌AI與DeepMind依舊保持著高度的相互獨立屬性。雖然有戰略和技術上的結合,但谷歌AI的重點推進工程列表中可說是完全不見DeepMind的蹤影。

而AlphaGo作為DeepMind的核心創造物之一,絕不僅是為了挑戰人類圍棋界而生。作為核心領域技術的關鍵載體,承接著整個公司戰略的上下銜接。

因此,通過DeepMind做了什麼,來重新認識一下這家被谷歌大腦專家稱為「AI實力世界第一」的公司,可以幫助我們更好的理解AlphaGo及其背後的更大野心。

我們通過8件DeepMind所做的關鍵動作來梳理這家公司的實力與目標,希望在棋盤的決勝以外,提供給你一點新的思考。

一、一鳴驚人的遊戲系統

DeepMind的創始人是棋類和電子遊戲高手,而這家公司邁出的第一步就與遊戲有關。

2013年,當時名不見經傳的在DeepMind發表了一篇論文,內容是他們自己開發的AI遊戲系統。論文中描述的計算網路並不是為了遊戲而服務,反而是讓一個AI系統自己去玩遊戲。

神奇的是,DeepMind的遊戲系統可以在完全沒有接觸的前提下,通過對遊戲的自我學習,自動的玩一系列初級電視遊戲。

這個系統可以通過屏幕上面的圖像和遊戲中的分數是否上升下降,從而做出選擇性的動作。

雖然這個行為對人來來說難度不大,但對於機器學習來說卻意義驚人。因為它涉及架設任務、建立人工精神網路、建立深度學習模型和完善學習過程幾個關鍵部分,並且需要大量的圖形處理單來輔助。

這款「玩兒出來」的AI程序,最終幫助DeepMind登上了《自然》。隨後開始受到各大互聯網巨頭的關注,並成功在一系列拉鋸戰後,被谷歌以據說高達6億美金的代價收購。更可怕的是,這還被稱為谷歌有史以來最成功的收購案。

從初出茅廬的這件作品,可以看出DeepMind的幾個特點。首先是擅長多種複雜技術的集成,其次對於AI應用有遠超於業界水準的解決能力。而其喜歡遊戲、熱愛人機對決的基因特質,也在一開始就暴露無遺。

二、給AI上3D遊戲課:開源DeepMind Lab

2016年底,DeepMind將其核心深度學習平台之一「DeepMind Lab」進行開源,供研究人員和開發者使用。

區別於以往的深度學習開源平台,DeepMind Lab的特殊之處在於,它其實是一套專門給AI玩的3D遊戲。

就像人類玩的第一人稱射擊遊戲一樣,這套開源程序可以設計多重複雜的環境架構,專門用來訓練人工智慧和機器學習系統。用於訓練人工智慧在大型環境、部分可視環境,以及視覺多樣化條件下學會執行複雜任務。

DeepMind Lab據說是在《雷神之錘3》的基礎上演變而來的,有比較強的延展性和適用性。可以讓適用人員自行設計關卡和環境效果,來針對性訓練出AI不同的判別與處理機制。

相比於針對數據樣本的機器學習系統,DeepMind開源的體系可以專註於AI在實際環境中進行視覺+感知的交互。這對於AI行業來說可謂是打開了巨大的腦洞,尤其對於無人駕駛、AR、地圖導航、機器人記憶等領域的研究與創業者來說,可謂是福音。

從這套靈感依舊來源於遊戲的系統中,不難看出DeepMind一個特點是非常重視AI與人類高度貼合的研究。目標指向把人類的感知與精神思維方式移植到機器當中去,而且他們還鼓勵其他人一同在這個方向嘗試。

三、人腦模式與經典計算機合體:可微分神經計算機

另一個值得關注的動作,是2016年底DeepMind公布了他們打造的一台「可微分神經計算機」(DNC)。

DNC的特點,是結合了精神網路的運作原理和經典計算機的運算能力和外部儲存能力。簡單來說,其解決方案就是將神經計算機的本體:以人類大腦為生物網路藍本設置的精神網路,與可讀寫的外部存儲器相分離,架設雙層的處理與運算結構。

這樣打造的運算系統,核心特徵是解決了神經網路實際運作當中的機器記憶問題。做出了一台又能像人類一樣想,又能像計算機一樣高速運算、記憶數據的機器。在發布的論文中,這台計算機可以規劃相距甚遠的捷運站間的最佳路線,弄清楚複雜的親戚關係——尤其這些都是在沒有先驗數據的前提下。

整合多元能力,對演算法進行創意性的解放,在這台計算機當中展現的淋漓盡致。雖然原理聽起來蠻簡單,但實際運用到的解決方案卻非常複雜,設計多個領域的協同。

四、開發用於《星際爭霸2》的人工智慧訓練環境

2016年的暴雪嘉年華上,DeepMind宣布將於暴雪合作,打造一個專門玩《星際爭霸2》的AI系統。這台系統會像人類一樣去思考和決策,並希望複製AlphaGo的奇迹,最終打敗所有人類高手。

這裡不禁要懷疑,這家公司到底是有多愛玩遊戲。

但事實卻是如此,《星際爭霸2》這種完全動態的遊戲環境當中,人類選手對大勢、時機、環境的處置始終都是高於電腦系統的。

圍棋的問題是運算量巨大,而這類策略遊戲的問題是變化性太強,都是人工智慧面對的核心問題。

顯然通過挑戰人類擅長領域來做PR、講故事、推產品,是DeepMind的拿手好戲。

五、最精準的語音生成系統WaveNet

在玩遊戲之餘,DeepMind也做點大家都在做的「正經事」。

比如近兩年,DeepMind先後公布了其在圖像生成和語音生成領域的成果。比如16年公布的語音生成系統WaveNet,號稱將計算機輸出音頻與人類自然語音差距縮小了50%。至少根據親身嘗試者的說法,這一系統比谷歌和蘋果的語音生成系統都聽起來自然流暢許多。

(波形原理合成聲音的WaveNet)

WaveNet的優勢,是通過原始的波形合成了近似真人的語音,而不是將語音樣本進行逐字逐句的拼接。

這讓未來機器的聲音可能更加接近人來,想想也是細思恐極的一件事。

六、醫療應用計劃DeepMind Health

以上說的,基本都是DeepMind在研發端的動向,核心載體是演算法架構和論文。而在產品應用端,DeepMind也有一些動作,比如其推出的DeepMind Health就指向智能醫療系統,根據與英國全國醫療系合作獲取的數據,來打造基於人工智慧進行診療幫助和癥狀判斷幫助的系統。比如說DeepMind打造的智能診療系統可以通過學習上百萬份眼部監測資料,據此建立模型來識別早期徵兆及早發現眼病。此外,DeepMind還架設了一些移動應用類的非人工智慧產品。

不過,與英國醫療系統的合作也帶來很大麻煩,DeepMind在缺少監督的境況下獲得了全英病人數據,讓媒體發出了不小的驚恐和反對聲音。

七、幫谷歌省電

去年夏天,很少真正嘗試應用領域的DeepMind在東家谷歌的大本營小試牛刀了一把

利用深度學習演算法,DeepMind把谷歌數據中心的冷卻系統用電給節約了40%。冷卻系統是維持數據中心伺服器運行的重要系統,但因為設備眾多、需求量極高,其中大量的能源其實是被浪費掉了。

DeepMind運用AI系統,優化了整個冷卻系統的用電效率,據說一次性幫助谷歌節省了上億美金的開銷。而外界更加關注的,是這類技術可以被用於多種大規模工業系統上,谷歌從自家大樓做案例,顯然也是要為未來的大規模發展做廣告。

八、全面進駐谷歌TensorFlow

最後,不得不說的一件事,是DeepMind 雖然在產品和研究上保持了高度的獨立性,但還是在2015年將研究全面進駐到了谷歌的TensorFlow開源架構當中。並且官方高度肯定了TensorFlow的高度適用性、延展度和操作體驗。2016年,DeepMind 還開發了一個能在 TensorFlow 上快速創建神經網路模塊的高級框架Sonnet,並且對其進行了開源處理。

由此可見,對於谷歌AI體系的核心業務和生態基礎,DeepMind還是支持的。並且願意在這個領域幫助谷歌完善生態。

其實谷歌本體所需要的,也是DeepMind作為一個精英企業在生態核心上提供更多支持——面向大眾賺錢的事可以谷歌做,但華山論劍的時候DeepMind還是出馬一下的好。

總結

通過總結DeepMind在研究方向、應用化和與谷歌關係的幾個案例。我們不難發現DeepMind的幾個特點,或許我們可以為它做個簡單清晰的畫像:

在技術探索方面,DeepMind更多指向以高度模擬人腦的方式,在核心領域超過人類已有水平的AI系統。無論是圍棋、遊戲,還是環境判斷、圖像與音頻生成,都指向這個巨大的野心。

而在技術優勢上,DeepMind一方面得力與強大的多領域人員儲備,讓它擁有了橫跨多學科打造演算法與產品的優勢。另外一方面,DeepMind的技術優勢在於高度應用化水準跨越上。雖然他發布的東西不多,但沒有一次讓我們看到很初級、很簡單的應用模型。

在產品的商用價值上,DeepMind或許會主攻醫療健康和垂直領域的機器學習應用上,這個從他們2016年的動向中已現端倪。

綜合來看,這家公司是半學術化半商業化的創業團隊,技術實力極高,卻也不太急於賺錢——有谷歌做後台,他們還忙著玩遊戲呢。

當然,這家公司最強的可能還是人工智慧的品牌PR上,這不,他又來用圍棋PR人類了。

熱門推薦

本文由 一點資訊 提供 原文連結

一點資訊
寫了5860316篇文章,獲得23312次喜歡
留言回覆
回覆
精彩推薦