search
「人機大戰2.0」落幕 阿爾法狗三局連勝

「人機大戰2.0」落幕 阿爾法狗三局連勝

【財新網】(記者 石睿)5月27日,「人機大戰2.0」最後一戰落下帷幕,世界排名第一的圍棋選手柯潔再度敗給人工智慧程序AlphaGo(俗稱「阿爾法狗」)。至此,「人機大戰2.0」三番棋較量結束,柯潔0:3敗北。

今日上午10點30分,柯潔與AlphaGo在本屆烏鎮圍棋峰會上的第三場對弈開賽。比賽開局,執白的柯潔就不佔優,對弈進行一小時左右,「棋聖」聶衛平即在解說中表示,目前的局面看來,「黑棋快贏了」。此後,柯潔頑強迎戰,但是AlphaGo並未給柯潔機會,雙方對弈至209手,柯潔投子認輸,AlphaGo贏得比賽。

比賽結束之後,聶衛平在微博上評論稱:「柯潔雖然下得很努力,但畢竟對手太強了,人類棋手能和AlphaGo比賽是一種錯覺。以後希望我們能夠多多學習人工智慧圍棋的優點,共同進步。」

本次比賽採用了三番棋賽制,無論輸贏雙方必須下滿三盤。每場比賽,雙方各有3小時限定時間,用時結束后將有5次1分鐘讀秒。在5月23日、25日舉行的前兩場比賽中,柯潔首賽以四分之一子惜敗AlphaGo;第二場比賽於中盤投子認輸,AlphaGo再度贏得比賽。

按照比賽規定,柯潔仍可獲得30萬美元的參賽費。此前主辦方稱,如果柯潔取勝,將獲得150萬美元的獎勵。

值得一提的是,5月26日下午,AlphaGo參與了一場團體賽,與周睿羊九段、陳耀燁九段、時越九段、羋昱廷九段、唐韋星九段五位組成的團隊對弈,不過世界冠軍組合仍不敵AlphaGo,至中盤投子認輸。

AlphaGo是由谷歌旗下人工智慧公司DeepMind研發的計算機圍棋程序。據谷歌大中華區總裁石博盟(Scott Beaumont)介紹,AlphaGo所應用的原理,是在過往圍棋人工智慧通常採用的蒙特卡洛法之外,加入了策略網路(policy network)和價值網路(value network)兩種神經網路演算法。2016年3月,AlphaGo以四比一的成績戰勝韓國世界圍棋冠軍李世石,引起廣泛關注。

在賽事期間舉行的人工智慧峰會上,AlphaGo 首席研究員 David Silver介紹, AlphaGo在和李世石對戰之後,進行了更新迭代,「與李世石對戰的AlphaGo 在雲上有50個TPUs在運作,搜索50個棋步為10000個位置/秒,而打敗柯潔的AlphaGo Master則在單個TPU上進行遊戲,AlphaGo成為自己的老師,它從自己的搜索里學習,有著更強大的策略和價值網路。」David Silver介紹,新版的AlphaGo和「前任」對戰,可以讓其三子。■

熱門推薦

本文由 一點資訊 提供 原文連結

一點資訊
寫了5860316篇文章,獲得23305次喜歡
留言回覆
回覆
精彩推薦