Zi 字媒體

「人機大戰2.0」落幕阿爾法狗三局連勝

2021/12/25

【財新網】（記者石睿）5月27日，「人機大戰2.0」最後一戰落下帷幕，世界排名第一的圍棋選手柯潔再度敗給人工智慧程序AlphaGo（俗稱「阿爾法狗」）。至此，「人機大戰2.0」三番棋較量結束，柯潔0:3敗北。

今日上午10點30分，柯潔與AlphaGo在本屆烏鎮圍棋峰會上的第三場對弈開賽。比賽開局，執白的柯潔就不佔優，對弈進行一小時左右，「棋聖」聶衛平即在解說中表示，目前的局面看來，「黑棋快贏了」。此後，柯潔頑強迎戰，但是AlphaGo並未給柯潔機會，雙方對弈至209手，柯潔投子認輸，AlphaGo贏得比賽。

比賽結束之後，聶衛平在微博上評論稱：「柯潔雖然下得很努力，但畢竟對手太強了，人類棋手能和AlphaGo比賽是一種錯覺。以後希望我們能夠多多學習人工智慧圍棋的優點，共同進步。」

本次比賽採用了三番棋賽制，無論輸贏雙方必須下滿三盤。每場比賽，雙方各有3小時限定時間，用時結束后將有5次1分鐘讀秒。在5月23日、25日舉行的前兩場比賽中，柯潔首賽以四分之一子惜敗AlphaGo；第二場比賽於中盤投子認輸，AlphaGo再度贏得比賽。

按照比賽規定，柯潔仍可獲得30萬美元的參賽費。此前主辦方稱，如果柯潔取勝，將獲得150萬美元的獎勵。

值得一提的是，5月26日下午，AlphaGo參與了一場團體賽，與周睿羊九段、陳耀燁九段、時越九段、羋昱廷九段、唐韋星九段五位組成的團隊對弈，不過世界冠軍組合仍不敵AlphaGo，至中盤投子認輸。

AlphaGo是由谷歌旗下人工智慧公司DeepMind研發的計算機圍棋程序。據谷歌大中華區總裁石博盟（Scott Beaumont）介紹，AlphaGo所應用的原理，是在過往圍棋人工智慧通常採用的蒙特卡洛法之外，加入了策略網路（policy network）和價值網路（value network）兩種神經網路演算法。2016年3月，AlphaGo以四比一的成績戰勝韓國世界圍棋冠軍李世石，引起廣泛關注。

在賽事期間舉行的人工智慧峰會上，AlphaGo 首席研究員 David Silver介紹， AlphaGo在和李世石對戰之後，進行了更新迭代，「與李世石對戰的AlphaGo 在雲上有50個TPUs在運作，搜索50個棋步為10000個位置/秒，而打敗柯潔的AlphaGo Master則在單個TPU上進行遊戲，AlphaGo成為自己的老師，它從自己的搜索里學習，有著更強大的策略和價值網路。」David Silver介紹，新版的AlphaGo和「前任」對戰，可以讓其三子。■