Zi 字媒體

馬斯克的AI機器人擊敗人類頂級電競玩家

2021/12/25

在世界規模最大電子競技賽事之一Dota2國際邀請賽上，埃隆·馬斯克的非營利人工智慧公司Open AI機器人在Dota2一對一比賽中壓倒性擊敗了人類頂級職業玩家Dendi。

對於這一戰果埃隆·馬斯克也表現得頗為自信，第一時間在個人社交平台上表示，「Open AI第一次打敗了世界上頂級電競選手，這比圍棋難多了。」的確在兩者的交鋒過程中，Open AI機器人只用了不到10分鐘就將人類頂級玩家打敗，拿下第一局，如此強勢的技術使得Dendi在第二局對戰中退出並拒絕再戰第三局。

一時間AI攻陷電競言論四起，Open AI也被神化得不可一世。「這是一個令人印象深刻的成就，但並不是一次AI上的突破。」谷歌大腦團隊前成員Denny Britz發表評論回應這一事件，「事實上，過度炒作人工智慧的進步才是真正危險的事情。」

AI還不能統治電競界

一方面從比賽形式來看，Open AI參與的是更加簡單的1V1模式，在這種模式下沒有配合一說，且大部分情況下都是正面對抗了解對手的狀態。「非完美博弈問題在其中並不嚴重，1V1的執行路徑和狀態空間也小了很多。」第四範式資深機器學習架構師塗威威指出。

Facebook人工智慧組研究員田淵棟在知乎上也表示，一對一相對容易，真實的Dota2 5V5的遊戲是一個更有挑戰性的問題。5V5是一個多智能體的問題，需要通過智能體之間的配合才能獲取勝利，是一個非完美信息博弈的問題，由於遊戲裡面的「戰爭迷霧」，玩家不能知道遊戲的全部信息，有非常龐大的狀態空間，需要非常長的執行路徑才能獲得遊戲結果。

事實上，Open AI也希望在明年《Dota2》賽期，可以用 5V5 的方式再次上台挑戰，但5V5狀態AI戰勝人類的難度遠遠大於1V1，也大於圍棋難度。與馬斯克觀點不同，塗威威認為，Open AI擊敗電競和圍棋人機大戰是不可比的，這是兩種不一樣的任務。

目前AI技術很難在兩個或兩個以上的任務上工作得很好，AlphaGo是為19×19的圍棋任務設計的，同樣版本的AlphaGo目前甚至不能同時在19*19和20*20的棋盤上很好地工作。目前AlphaGo和Open AI 也不能交換彼此的任務，也就是說這些人工智慧技術目前不具備遷移能力。

塗威威認為，Dota2 5V5遊戲難度要遠遠大於圍棋的難度。「 Dota2 5V5是多智能體的協作遊戲，而圍棋只是1V1的遊戲;前者的狀態數遠遠大於圍棋的狀態數，且是非完美信息博弈，而圍棋是完美信息博弈。Dota2 5V5需要更長期的策略，往往要在成千上萬次操作之後才能獲得成果。在技術貢獻和社會意義上，目前Open AI的機器人還不能和AlphaGo相提並論。」

同時在英雄選擇上Open AI選擇了影魔，該英雄本身沒有控制技能，更多需要的是選手對距離細節等精準判斷和細微操作。塗威威表示：「這恰恰是人類不擅長，機器擅長的，人類選手solo慣用影魔英雄是因為人類不擅長這樣的事情，這樣的英雄solo玩好了才能更容易地體現與其他玩家的差距。所以即便Open AI在1V1上贏得了人類，離解決5V5的問題也很遙遠。」

Open AI 的「不成熟」也在隨後被驗證，比賽結束后已經有50多名玩家擊敗了這個被神化的AI，例如一些玩家通過勾引地方小兵背離正常路線，讓對方的AI陷入判斷追殺你還是守塔的猶豫狀態，進而贏得比賽。「Dota中的AI缺乏戰略層面的東西，攻擊、偵查、協助等決策。」竹間智能機器學習科學家王璈說道。

盯上電競的AI巨頭

事實上對電競感興趣的並非Open AI一家，在烏鎮圍棋峰會上，DeepMind CEO哈薩比斯就表示，星際爭霸將成為AI進步的下一個大考驗。隨後DeepMind與暴雪在《星際爭霸2》上展開研究實驗，並於近日開源了該訓練平台，同時這款遊戲也吸引了Facebook和阿里巴巴的人工智慧團隊加入。

這款即時戰略遊戲環境複雜多變，考驗AI對大量環境信息空間、時間和數據變化的理解能力。同時又考驗協作性，即混戰下對多個單位、建築、編隊的協同運作能力，需要玩家做出高級戰略決策，這也是這些巨頭將《星際爭霸2》作為訓練目標的原因。

雖然目前已經提取了上千場比賽近百萬的比賽錄像訓練AI程序，但暴雪方面表示，該AI尚處於初級階段，一些預判戰術和協作能力只能在小地圖中完成，且花費大量的運算時間才能進行下一步。

對當下的電競產業而言，AI更為直接且現實的意義則為「代練」功能。弗若斯特沙利文全球合伙人兼大中華區總裁王昕認為：「一方面AI可以學習他人的比賽經驗，培養新手玩家，另一方面電競教學也需要大量實戰，AI與人類玩家相比，不會受情緒、時間影響，反應速度也更快。」在比賽結束后，Dendi表示在看回放的過程中學到了一些內容。

但巨頭開發人工智慧的意義遠不是下棋或者打遊戲，而是為了更好地將AI應用到現實決策。在不完美且複雜信息情況下，如何做出預測和判斷，將決策所帶來的價值最大化，是AI發展的關鍵。

在此前德撲人機大戰中，創新工場創始人李開復也曾向第一財經闡述「不完整信息」下人工智慧的現實意義，「世界上大部分信息還不是公開的，面臨不完全或者誤導信息時的推理能力，未來能夠解決在決策、外交、商務合作、談判方面的不確定性，成為人類的『參謀』。」

【新浪財經股吧】討論

桃園 qq 地點貓咪桃園市 taoyuan xuan 根部尾巴有大桃園旅遊景點