Zi 字媒體

全盤迴顧人類最後希望與圍棋上帝終極PK，真正可怕的還在後面

2021/12/25

yidianzixun

全球技術地圖

創新丨前沿丨科普丨資訊

圍棋領域，人類最強大腦，也最終宣告完敗。但這不是我們不給力，而是對手它，不是人啊……

2017年5月27日，人工智慧歷史上具有標誌性意義的一天。柯潔在烏鎮依然沒能帶來一場勝利，最終以0：3 敗給升級版AlphaGo。

柯潔在賽前曾表示，這是他最後一次與機器對決。

人類最後的希望與圍棋上帝的終極PK

5月23日，·烏鎮圍棋峰會的首場人機圍棋對抗比賽打響，世界第一柯潔 PK 設升級版的 AlphaGo。AlphaGo 經過一番苦戰，憑藉四分之一子的優勢，首戰戰勝了柯潔。

在網路上，人們稱柯潔為「英雄」。 DeepMind的聯合創始人Demis Hassabis在比賽結束后的新聞發布會上表示，他對「柯潔」表示巨大的尊重。

面對大眾，柯潔承認AlphaGo「真的很好」，並稱，有機會對抗是「人生最大的榮譽」。他說：「去年，AlphaGo更像是一個人，但是現在，它更像是圍棋的上帝。」

sixthtone 在賽后的報道中把柯潔形容為「人類最後的希望」。

5月25日的第二盤比賽，儘管局面一度非常接近，柯潔甚至已經感受到了「（勝利的）機會」，但是最終依然敗北。

賽后柯潔走進新聞發布會現場，他說：「比賽時我把手放在胸口上，是因為我覺得自己有機會贏。中途我一度認為離勝利很近了，不過看起來AlphaGo 不是這麼想的。我當時非常緊張，都能感覺心在砰砰跳。」

DeepMind 聯合創始人兼 CEO Demis Hassabis 立即對柯潔的評價表示認同：「本局前100手棋是 AlphaGo Master 版本所經歷過的最佳棋局，我們的心也在砰砰跳。非常榮幸能與柯潔這樣的天才棋手進行對弈，我們彷彿看到了來自未來的棋局。」

到了5月27日，比賽的懸念似乎並不大，進程也沒有多少波瀾。AlphaGo輕鬆獲勝。

下到第39手，阿爾法狗用時不到15分鐘，解說員、著名圍棋手聶衛平判斷黑子已經贏了。

自此，圍棋的新紀元真的到來了，人將向機器學習此前從來沒見過的下法，共同構建新的「棋譜」，並且，估計也不再會有人會貿然再去挑戰機器。

圍棋史上這樣的劃時代事件曾經發生過兩次，第一次是發生在1600年左右的日本，20世紀30-40年代的日本，日本一位當時非常傑出的圍棋高手吳清源提出了一個全新的關於圍棋的理論，將圍棋提升到了一個全新的境界。如今，阿爾法狗帶來的是圍棋界的第三次變革，這一變革，比以往任何一次都要更劇烈、更徹底。

現在的AlphaGo有多強大？

或許，關於AlphaGo的很多問題，可以在DeepMind對其演算法的講解中得到解釋。

早在去年，AlphaGo就已經以4:1戰勝過李世石。而在今年年初，Master橫空出世，在弈城和野狐兩大圍棋網站上，和各國頂尖棋手快棋對弈，最後以60：0的戰績橫掃棋壇。而賽后，Master自揭真身，正是AlphaGo的最新版本。

而這次在烏鎮和柯潔對弈的，正是Master。年初的對弈中，柯潔已經在快棋上，敗給了它。

AlphaGo Master和戰勝李世石的AlphaGo Lee相比，有哪些區別？第一局賽后，DeepMind首席科學家席爾瓦在演講中透露，去年與李世石對戰的AlphaGo Lee有50個TPUs在運作，搜索50個棋步為10000個位置/秒，而昨天打敗柯潔的AlphaGo Master則是在單個TPU上進行遊戲，計算量只是去年那個版本的十分之一。

和柯潔對戰的是年初戰勝60位高手的AlphaGo Master。

目前的AlphaGo是單機版。

配備了4塊TPU。

與去年3月與李世石的比賽時相比，當前的版本在處理計算時所消耗的能量僅為過去的十分之一。

目前，與柯潔對戰的AlphaGo Master的等級分已經接近了4800分。

現在的AlphaGo採用強化學習，讓人工智慧進行自我博弈，產生更強的神經網路。這一次AlphaGo用自我對弈訓練出的策略網路，可以做到不需要更多運算，直接給出下一步的決策。

相比之下，現在的AlphaGo比去年擊敗了李世石那一版的AlphaGo Lee相比要「強三子」。

4塊TPU，單機版，完虐了人類。而「強三子」的概念是什麼？讓柯潔的反應來告訴你。

如果說打敗了李世石的AlphaGo是利用卷及神經網路，讓它了解規則、了解棋局，從而進行處理，那麼，現在的AlphaGo，就增強了「思考」能力，並且，可以自學成才了。

在這次賽前，很多媒體報道，此次參戰的 AlphaGo 2.0 可能採用了全新的演算法模型，放棄了監督學習，即未先學習人類棋譜的經驗，而是直接通過對戰來獲得認知和能力。但哈比薩斯在賽后發布會上回答，這明顯是個誤解。AlphaGo還是要學習人類經驗，但這個版本的AlphaGo更依賴自我博弈來學習。

如何讓AlphaGo進行監督學習和強化學習，席爾瓦解釋，是讓AlphaGo先通過訓練形成一個策略網路，將棋盤上的局勢作為輸入信息，並對所有可行的落子位置生成一個概率分佈。然後，訓練出一個價值網路，以 -1(對手的絕對勝利)到1(AlphaGo的絕對勝利)的標準，預測所有可行落子位置的結果。也就是說，在這個過程中， AlphaGo不僅會算出自己的最優選項，還會根據自己下過的棋，經過多層處理形成一個「值」，值高意味著自己贏，低意味著對手贏，並在棋局中的某一步判斷是否是關鍵的一步。

並且，AlphaGo的搜索演算法能在計算能力之上，加入和人類直覺近似的判斷，讓它更接近人腦。

AlphaGo下完棋能做什麼？

「

AlphaGo 贏了李世石，so what？下圍棋本來的樂趣就是對方下一把臭棋，結果機器不會下臭棋，那還有什麼意思呢？

——by：馬雲

」

所以，我們可以意識到，棋牌類遊戲，對於人工智慧而言，是一種早期的演練。或許它能夠讓遊戲更有趣味，會挑戰專業棋手的價值，會引發很多人的思考和恐懼，但是，AlphaGo，或者說DeepMind，它的最終目標不僅僅是下棋。DeepMind的最終目標，還是智能助手、醫療和機器人等領域。

谷歌現在有兩套人工智慧系統，包括谷歌的機器學習開發者工具TensorFlow，以及DeepMind的AlphaGo系統，AlphaGo未來將計劃應用在醫療看護、自動駕駛車等部分。

在烏鎮的人工智慧峰會上，Alphabet 董事長 Eric Schmidt談到機器學習和人工智慧引領了「智能時代」的發展，他表示：「神經網路和深度學習的爆發是我所經歷過的最大變革」。他還表示，這些新技術不僅提升了日常的生產效率，更為企業帶來了無限機遇，尤其是在「醫療、交通以及政務」等領域。而谷歌的各項AI研究成果，也在這場交流中向國內觀眾做了完全的展示。

比如機器學習在消費產品中的應用，包括 Google Photos以及Gmail。以 Google Photos最新版本為例，通過機器學習技術，可以將照片中的雨滴去除，並為照片添加濾鏡，使其擁有與知名藝術作品一般的效果。

還比如，如何利用電腦工具幫助缺乏醫療資源的國家更廣泛地進行眼疾診斷，這其中就包括了印度。印度擁有13億人口，總計缺少 127,000 名眼科醫生。Google 的機器學習模型診斷眼疾的準確率，甚至略微高於一些通過美國認證委員會認證的眼科醫生。這個技術還有很大的潛能可以應用到其它疾病的診斷，例如斯坦福的研究者近期已經開始使用 TensorFlow 利用圖像進行皮膚癌的診斷。

TensorFlow 是現在 GitHub 上世界第一的機器學習知識庫，其使用增長率遠遠高於其它同類型平台。比利時公司Connecterra 就將TensorFlow 應用到了牧場當中，而澳大利亞的研究者則將此項技術用於判斷海牛種群的健康狀況。

Google 翻譯也用到了TensorFlow。隨著神經網路機器翻譯的引入，翻譯結果有了顯著提高。同時，結合了「計算機視覺」使得 Google 翻譯 App 能夠利用手機攝像頭進行即時圖像翻譯，這項功能正是通過TensorFlow 在移動設備上的版本來實現的。在文藝領域，還有「Portrait Matcher」，一個可以利用攝像頭將你的面部特徵與類似藝術品匹配的功能。

柯潔戰後說：「未來是人工智慧的。」而人工智慧，終究是人類所開發的。

暫時我們也不必擔憂，人類將被機器所完全取代和統治。李開復的答案是，人工智慧目前只有在符合以下三個前提的領域裡，將全面戰勝人類：

第一，有海量的數據；
第二，數據有標準；
第三，單一領域。

在前不久的IT領袖峰會上，李彥宏也說：「強人工智慧時代，也許永遠不會到來。」

也許，機器並不值得我們去恐懼。但真正可怕的事實，其實是，我們並不知道，人類會將它推向哪一步……

桃園 qq 地點貓咪桃園市 taoyuan xuan 根部尾巴有大桃園旅遊景點