Zi 字媒體

人工智慧戰勝人類頂尖的圍棋選手后又在《Dota2》中打敗人類冠軍

2021/12/25

人工智慧挑落人類頂尖選手的故事可不再僅限於國際象棋和圍棋，這次，淪陷的項目是《Dota2》。

在剛剛結束的第七屆《Dota2》國際邀請賽（TI）中，8月11日的正式比賽結束后，一場表演賽開始了。一方是人類選手Dendi——烏克蘭傳奇選手，第一屆TI的冠軍獲得者。而另一方來自一段AI，這個由OpenAI開發的人工智慧程序在表演賽中出場，試圖驗證自己的實力。

這仍是一場人為設定規則的簡化版對抗：Dendi和AI只能從中路出擊；在雙方同時使用一個英雄雄影魔（Shadow Fiend）的情況下，沒有中立生物，沒有神符，以及不能使用一些關鍵裝備。減少了隨機性的同時，讓比賽看起來更像是類似圍棋般的硬實力對抗。

「你覺得你對抗的是一個真人嗎？」在第一局比賽過程中主持人向Dendi問道。Dendi的回答是：「不。」在過往的遊戲練習中，Dendi也在少數時候被《Dota》的內置機器人（bot）擊殺，OpenAI控制的對手看起來並沒沒有人類選手操作得那麼有「流暢感」，甚至在前往中路的時候，OpenAI有時候還被己方小兵所卡住。

但這樣仍不妨礙結果的一邊倒，第一場比賽中OpenAI僅用10分鐘就擊敗Dendi。而在第二局，當AI打出一個漂亮的越塔擊殺后，Dendi爽快GG認負。

「它太強大了。」比賽結束后Dendi接受採訪時說，「也許我得再多練習一段時間，才能發現如何擊敗它。」

Dendi的自我評價尚算中肯。實際上從現場直播來看，這位前世界冠軍在比賽中可不是非常走心：主持人不時在比賽過程中向Dendi追問，干擾其操作。而後者的表現更像是「玩票」，一直和主持人談笑風生。也許Dendi在遊戲中的ID「HF（Have Fun，玩得開心）」更能體現他對這次比賽的態度。

而OpenAI卻體現了一名職業玩家的應有素養。把握好出招時機后，OpenAI的正補、反補恰到好處，或是以一個合適的距離攻擊Dendi。這讓Dendi的英雄血量時常處於尷尬的貧血階段。

很難想象，如果這不是一場表現賽，而Dendi又收起自己的戲謔態度全力應對的話，誰又會是最後的勝利者。

但至少在OpenAI開發人員眼裡，這場勝利是一次順理成章的成功。

「對AI來說，《Dota》是一個非常適合的對抗性遊戲，遊戲本身很複雜，也擁有高強度對抗場景。這意味著你需要一種新技術，來努力擴展、推進AI的邊界。」OpenAI的首席技術官Greg Brockman（下稱Brockman）透露。這也是他們為何選擇《Dota》作為AI訓練主戰場的原因。

Brockman表示，在《Dota》中取勝更依賴於選手的直覺，而這已經通過AI學會了：通過自我對弈（Self-play）進行高強度訓練，預測其他玩家的下一步操作，提高應對陌生環境的表現，幫助友軍單位取勝。在經過僅僅兩周的實時訓練后，AI就達到了目前專業選手的水準。

最終，從對於自己所處的世界全無認識，再經歷過大量和自身拷貝的對戰後（這意味著它和對手永遠是旗鼓相當的），AI的遊戲技巧有了一日千里的進步。按照Brockman介紹，OpenAI在此之前已經戰勝了現役的Arteezy、SumaiL等多個世界冠軍級的《Dota》選手。

「OpenAI第一次打敗了世界上最好的電競選手。」

當然， OpenAI作為由矽谷大亨Elon Musk投資創立的非營利科研機構，其目的並非局限於遊戲，Brockman透露，通過遊戲中的訓練，OpenAI希望幫助機器人建立系統性學習複雜技能的能力，這有助於幫助AI應對現實世界中的任務，如外科手術。

願景很偉大，至少Elon Musk本人對這場比賽的結果還是很滿意的，他專門發布了一條推特消息，稱「OpenAI第一次打敗了世界上最好的電競選手。電競比象棋、圍棋這樣的傳統棋盤遊戲要複雜得多。」還順便小小嘲諷了一下對手AlphaGo。

DeepMind將研究重心放到了《星際爭霸2》上。

不過，AlphaGo的擁有者DeepMind，也早已經將AI研究方向轉移到遊戲上了，幾個月之前，他們選擇了《星際爭霸2》作為圍棋之後的下一個測試對象。8月初，DeepMind開源了《星際爭霸2》研究訓練平台SC2LE。據《財富》報道，DeepMind的目標是讓計算機擊敗最頂級的人類《星際爭霸》玩家。

我們已經進入了一個AI研究的遊戲化時代。AI巨頭紛紛選擇遊戲作為研究入口，已經成為AI研究領域的重要風向。《經濟學人》評論認為，電子遊戲受追捧有幾個原因：將遊戲作為現實世界的訓練場；不同的遊戲需要不同的認知技能，遊戲可以幫助他們了解如何把智能問題分解成更易處理的小模塊；基於以上兩種原因，認為遊戲可以幫助他們發展出一套合適的人工（甚至自然）智能理論。

甚至電子遊戲還可以簡化現實AI研究中機器人的維護、調試過程：虛擬機器人沒有重量，無需維護，改變規格也只要在鍵盤上敲幾下就足夠了。

而在明年，OpenAI的《Dota》選手將更加「名副其實」，開發團隊計劃在TI8前做出可以參加5V5比賽的AI，並且規則與人類比賽規則相同，可以預料，到時候這場人類與AI的遊戲大戰會更加精彩和戲劇化。

桃園 qq 地點貓咪桃園市 taoyuan xuan 根部尾巴有大桃園旅遊景點

人工智慧戰勝人類頂尖的圍棋選手后 又在《Dota2》中打敗人類冠軍

人工智慧戰勝人類頂尖的圍棋選手后又在《Dota2》中打敗人類冠軍