Zi 字媒體

「人機大戰」開幕：柯潔將與AlphaGo對決

2021/12/25

已經升級到2.0版本的Google圍棋人工智慧AlphaGo將與人類選手對戰。5月23日10點30分，第一場比賽正式開始。

5月23日至27日，這場人機大戰將在烏鎮舉辦。「烏鎮·圍棋峰會」由圍棋協會、浙江體育局以及谷歌公司三方協力舉辦。此次圍棋峰會將有五場賽事，除去柯潔與AlphaGo之間的三場對戰外，還包括一場人機配對賽（5月24日）和一場團隊人機賽（5月26日）。

其中，人機配對賽將由連笑和古力與AlphaGo組隊，了解人類如何與AI配合。而團隊人機賽則是由羋昱廷、時越、唐韋星、周睿羊、陳耀燁五位棋手組隊，聯手向AlphaGo發起挑戰。

柯潔97年出生，在微博的自我介紹時表示，自己暫時是「世界圍棋第一人」，正式比賽時曾單盤8：2碾壓李世石，世界冠軍曾獲得過三次。柯潔的世界等級分排名第一，九段棋手。

去年AlphaGo對戰韓國棋手李世石時，Google提供了100萬美元的比賽獎金，今年獎金達到了150萬美元。

AlphaGo 是第一個擊敗人類職業圍棋選手並戰勝圍棋世界冠軍的程序，是圍棋史上最具實力的選手之一。2016 年 3 月，在全世界超過一億觀眾的關注下，AlphaGo 經過5局對弈，最終以 4 比 1 的總比分戰勝了圍棋世界冠軍李世石，這場比賽成為了人工智慧領域的一個重要里程碑。

過去曾有專家預測人工智慧需要十年的時間才有可能戰勝人類職業選手，在這場比賽之後，AlphaGo 憑藉其「充滿創意而又機智」的下法，躋身圍棋界最高職業稱號——職業九段行列，成為歷史上首個獲得這一榮譽的非人類棋手。

近期，AlphaGo的2.0版本以"Master/Magister"的稱謂與世界頂級的圍棋選手進行了60場線上快棋對局，並取得了全勝戰績。當時在AlphaGo仍然匿名時，就有不少人猜出這種連勝局背後可能有人工智慧存在。

一直以來，圍棋就被認為是傳統遊戲中對人工智慧最具挑戰性的項目。這不僅僅是因為圍棋包含了龐大的搜索空間，更是因為對於落子位置的評估難度已遠遠超過了簡單的啟髮式演算法。

AlphaGo如何進行訓練？根據Google提供的資料，為了應對圍棋的巨大複雜性，AlphaGo 採用了一種最新的機器學習技術，結合了監督學習和強化學習的優勢。通過訓練形成一個策略網路（policy network），將棋盤上的局勢作為輸入信息，並對所有可行的落子位置生成一個概率分佈。

然後，訓練出一個價值網路（value network）對自我對弈進行預測，以 -1（對手的絕對勝利）到1（AlphaGo的絕對勝利）的標準，預測所有可行落子位置的結果。

這兩個網路自身都十分強大，而 AlphaGo將這兩種網路整合進基於概率的蒙特卡羅樹搜索（MCTS）中，實現了它真正的優勢。最後，新版的AlphaGo 產生大量自我對弈棋局，為下一代版本提供了訓練數據，此過程循環往複。

AlphaGo如何訓練示意圖

在獲取棋局信息后，AlphaGo 會根據策略網路探索哪個位置同時具備高潛在價值和高可能性，進而決定最佳落子位置。在分配的搜索時間結束時，模擬過程中被系統最頻繁考察的位置將成為 AlphaGo 的最終選擇。在經過先期的全盤探索和過程中對最佳落子的不斷揣摩后，AlphaGo的搜索演算法就能在其計算能力之上加入近似人類的直覺判斷。

AlphaGo如何落子

職業棋手樊麾認為，AlphaGo最強大的地方，並不體現在具體某一手棋或者某個局部變化中，而是它在每一局棋里所展現出來的獨特視角。

雖然AlphaGo的棋風本身並不容易總結，但是總體來說，AlphaGo更傾向於使用一種自由、開放式的行棋風格。在它的世界里，沒有什麼先入為主的概念，也沒有什麼必須要遵守的規則，這讓它得以打破常規，發現當前棋局中最高效的一手。在接下來的兩局棋里，AlphaGo這種獨特的對局哲學，常常讓它下出違反第一感、但卻極具威力的一手棋。

雖然圍棋是圍地盤的遊戲，但事實上最具決定性的部分在於如何平衡棋盤上的各個局部。在這一點上，AlphaGo展現出了卓越的能力。尤其值得一提的是，AlphaGo對於外勢的把控可以說到達了出神入化的地步，具體來說，它可以近乎準確地判斷棋盤上現有棋子能給周圍區域帶來多大的影響力。

雖說棋子的影響力本身很難衡量，但是AlphaGo強大的價值網路讓它能夠把棋盤上所有的棋子當作一個整體來考慮，因此它的判斷幾近精確。AlphaGo的這種能力，使得它能夠把局部棋子的影響力，轉變為全局的優勢。

在市場上，多名AI工程師認為AlphaGo獲勝的概率超過柯潔。英語學習 App 英語流利說首席科學家林暉博士表示：「本次人機對戰採用的『慢棋』賽制，相對於之前在 Master 在網路上打遍天下無敵手的「超快棋」，目前的賽制對人類棋手會有一定利好。但預估柯潔贏面仍低於 10%，AlphaGo 將獲得本次升級版人機大戰的最終勝利」。

另一位人工智慧專家孫懌博士對於人工智慧的信心更為強烈，他認為：「除非 AlphaGo 出現致命程序錯誤，AlphaGo 將取得三盤全勝的戰績」。

他強調：「AlphaGo2.0 相對於 1.0，由於人工智慧可以無時無刻進行對弈訓練，AlphaGo2.0 在演算法和經驗上都比對陣李世石時提升不少。今年年初 AlphaGo 2.0 以 Master 為化身，在快棋的賽制中，以 60 戰不敗成績完勝包括柯潔在內的世界頂尖棋手也印證了這一點」。

在比賽前，柯潔態度狀態輕鬆，不僅在烏鎮發自拍，還發表了一篇名為《最後的對決》微博表達情緒。柯潔平時也是一名在微博上十分活躍的棋手。

附柯潔微博全文：《最後的對決》

@棋士柯潔

決戰前夕，感慨萬千...

在這個特殊的時間，我有些話想和熱愛圍棋、關注圍棋、關注我的朋友們說:

無論輸贏，這都將是我與人工智慧最後的三盤對局

很多人可能會問為什麼？

其實私底下我已經與朋友家人說了很多次這樣的想法，現在的AI進步之快遠超我們的想象。像國產的絕藝、日產的ZEN雖然和AIphago還有著較大差距，但已經表現出超強的實力了...我相信未來是屬於人工智慧的。

可它始終都是冷冰冰的機器，與人類相比，我感覺不到它對圍棋的熱情和熱愛。對它而言...它的熱情——也只不過是運轉速度過快導致CPU發熱罷了。

我會我用所有的熱情去與它做最後的對決，不管面對再強大的對手——我也絕不會後退！至少這...最後一次...

拼盡全力后，無論結果...管他口中是是非非，來一首《滄海一聲笑》..豈不美哉、快意？我淡然笑到...

不眠夜，且看且珍惜，請大家欣賞我最後的三盤人機大戰。

桃園 qq 地點貓咪桃園市 taoyuan xuan 根部尾巴有大桃園旅遊景點