Zi 字媒體

柯潔「約戰」AlphaGo：我抱著必勝的信念！

2021/12/25

新華網北京4月11日電（記者陳聽雨）「雖然AlphaGo給我們帶來了極大的震撼，但也不是不可戰勝的。我抱著必勝的信念而來，絕不會說人機大戰勝負無所謂這樣的話，我會全力以赴，爭取打破AlphaGo的不敗戰績！」4月10日，20歲的圍棋天才，被認為當今全球人類圍棋第一人的柯潔九段在新聞發布會上說。

柯潔（右一）。

4月10日，圍棋協會與浙江省體育局共同舉辦新聞發布會宣布，5月23日至27日將在烏鎮舉辦「烏鎮·圍棋峰會」。屆時AlphaGo將與頂尖棋手以及來自人工智慧界的專家齊聚一堂，共同探索圍棋與人工智慧背後的深遠奧秘。

一年前，世人共同見證了人工智慧領域的一個重大里程碑： AlphaGo戰勝了傳奇圍棋選手李世石。

事實上，人工智慧的加入並沒有像一些人所擔心的那樣使這項遊戲式微，反而讓人類棋手變得更加強大而富有創造力。儘管圍棋可能是歷史上被研究、推敲得最為透徹的一項遊戲，許多職業棋手以及業餘愛好者仍然是通過對AlphaGo創新著法的深入研究，學到了嶄新的知識和策略。

「AlphaGo下棋讓人感覺更自由一些，沒有什麼著法是完全不能下的。現在大家都更多地在嘗試以前沒有下過的一些下法。」周睿羊九段曾表示。

圖為：柯潔（最右）與聶衛平（右二），樊麾（站立者）和古力（最左）於去年在北京聶衛平圍棋道場，憑記憶復盤 AlphaGo與李世石第一局的開局。

此次「烏鎮·圍棋峰會」旨在通過頂尖人類棋手與極具創造性的人工智慧對手之間的合作，使人們得到關於圍棋和人工智慧的更多新啟示。

據主辦方介紹，此次峰會特別設計了AlphaGo與頂尖棋手的三種比賽形式，具體包括：首先，人機配對賽：職業棋手將與另一名職業棋手對弈。每一方棋手都將有AlphaGo作為自己的隊友與他們交替落子，真正體現共同學習的真諦。

其次，團隊賽：由五位頂尖棋手組隊與 AlphaGo進行對弈，共同測試 AlphaGo在面對組合風格時所展現的創造力和適應性。

第三，柯潔對陣 AlphaGo：AlphaGo 與世界排名第一的棋手柯潔進行的三番棋對弈將成為萬眾所矚目的焦點。柯潔會將 AlphaGo的能力推向甚至超越極限。

柯潔是金立智能手機的品牌文化大使。金立認為，圍棋，並不在於計較一子一目的得失，更需要放眼全局的取捨和戰略，是一種長距離的「超級續航」般的較量。圍棋表達了一種靜默的思考，充滿了寵辱不驚的氣度，是人類智慧的傑作。圍棋人工智慧的最高水平與人類最高水平之間的對決，比賽本身的意義就已非同凡響。人工智慧代表著科技的未來，也是人類的未來，人機之戰，是人類智慧的延伸，是人類對極限、對未來的一次勇敢探索。金立支持柯潔勇戰AlphaGo。

除動人心魄的比賽之外，峰會還將舉辦一場有關人工智慧未來的論壇。來自人工智慧的頂尖專家將共同探索AlphaGo如何為圍棋這項古老的遊戲帶來了全新的認知，並進一步探討人工智慧與機器學習是如何幫助人類為世界上一些重大難題帶來解決方案。

據介紹，AlphaGo背後的部分機器學習方法已經被應用到實際生活中，並在一些重大問題中發揮了作用，比如減少能源使用。機器學習技術也已經開始應用於一系列醫療研究項目中。

延伸閱讀

AlphaGo是什麼？

AlphaGo 是第一個擊敗人類職業圍棋選手、第一個戰勝世界冠軍的電子計算機程序，是圍棋史上最具實力的選手之一。2016 年 3 月，在全世界超過一億觀眾的關注下，AlphaGo經過5局對弈，最終以 4 比 1 的總比分戰勝了圍棋世界冠軍李世石，這場比賽成為了人工智慧領域的一個重要里程碑。過去曾有專家預測，人工智慧需要十年的時間才可能戰勝人類職業選手，在這場比賽后，AlphaGo憑藉其「充滿創意而又機智」的下法，躋身圍棋界最高職業稱號——職業九段行列，成為歷史上首個獲得這一榮譽的非人類棋手。近期，AlphaGo的升級版本以"Master / Magister"的稱謂與世界頂級的圍棋選手進行了60場線上快棋賽，並取得了全勝的出色戰績。

AlphaGo如何訓練？

一直以來，圍棋就被認為是傳統遊戲中，對人工智慧而言最具挑戰性的項目。這不僅是因為圍棋包含了龐大的搜索空間，更是因為對於落子位置的評估難度已遠遠超過了簡單的啟髮式演算法。為應對圍棋的複雜性，AlphaGo採用了一種新穎的機器學習技術，結合了監督學習和強化學習的優勢。通過訓練形成一個策略網路（policy network），將棋盤上的局勢作為輸入信息，並對所有可行的落子位置生成一個概率分佈。然後，訓練出一個價值網路（value network）對自我對弈進行預測，以 -1（對手的絕對勝利）到1（AlphaGo的絕對勝利）的標準，預測所有可行落子位置的結果。這兩個網路自身都十分強大，而 AlphaGo將這兩種網路整合進基於概率的蒙特卡羅樹搜索（MCTS）中，實現了它真正的優勢。最後，新版的AlphaGo 產生大量自我對弈棋局，為下一代版本提供了訓練數據，此過程循環往複。

AlphaGo 如何決定落子？

在獲取棋局信息后，AlphaGo 會根據策略網路（policy network）探索哪個位置同時具備高潛在價值和高可能性，進而決定最佳落子位置。在分配的搜索時間結束時，模擬過程中被系統最頻繁考察的位置將成為 AlphaGo 的最終選擇。在經過先期的全盤探索和過程中對最佳落子的不斷揣摩后，AlphaGo的搜索演算法就能在其計算能力之上加入近似人類的直覺判斷。

桃園 qq 地點貓咪桃園市 taoyuan xuan 根部尾巴有大桃園旅遊景點