search
尋找貓咪~QQ 地點 桃園市桃園區 Taoyuan , Taoyuan

人工智慧戰勝人類頂尖的圍棋選手后 又在《Dota2》中打敗人類冠軍

人工智慧挑落人類頂尖選手的故事可不再僅限於國際象棋和圍棋,這次,淪陷的項目是《Dota2》。

在剛剛結束的第七屆《Dota2》國際邀請賽(TI)中,8月11日的正式比賽結束后,一場表演賽開始了。一方是人類選手Dendi——烏克蘭傳奇選手,第一屆TI的冠軍獲得者。而另一方來自一段AI,這個由OpenAI開發的人工智慧程序在表演賽中出場,試圖驗證自己的實力。

這仍是一場人為設定規則的簡化版對抗:Dendi和AI只能從中路出擊;在雙方同時使用一個英雄雄影魔(Shadow Fiend)的情況下,沒有中立生物,沒有神符,以及不能使用一些關鍵裝備。減少了隨機性的同時,讓比賽看起來更像是類似圍棋般的硬實力對抗。

「你覺得你對抗的是一個真人嗎?」在第一局比賽過程中主持人向Dendi問道。Dendi的回答是:「不。」在過往的遊戲練習中,Dendi也在少數時候被《Dota》的內置機器人(bot)擊殺,OpenAI控制的對手看起來並沒沒有人類選手操作得那麼有「流暢感」,甚至在前往中路的時候,OpenAI有時候還被己方小兵所卡住。

但這樣仍不妨礙結果的一邊倒,第一場比賽中OpenAI僅用10分鐘就擊敗Dendi。而在第二局,當AI打出一個漂亮的越塔擊殺后,Dendi爽快GG認負。

「它太強大了。」比賽結束后Dendi接受採訪時說,「也許我得再多練習一段時間,才能發現如何擊敗它。」

Dendi的自我評價尚算中肯。實際上從現場直播來看,這位前世界冠軍在比賽中可不是非常走心:主持人不時在比賽過程中向Dendi追問,干擾其操作。而後者的表現更像是「玩票」,一直和主持人談笑風生。也許Dendi在遊戲中的ID「HF(Have Fun,玩得開心)」更能體現他對這次比賽的態度。

而OpenAI卻體現了一名職業玩家的應有素養。把握好出招時機后,OpenAI的正補、反補恰到好處,或是以一個合適的距離攻擊Dendi。這讓Dendi的英雄血量時常處於尷尬的貧血階段。

很難想象,如果這不是一場表現賽,而Dendi又收起自己的戲謔態度全力應對的話,誰又會是最後的勝利者。

但至少在OpenAI開發人員眼裡,這場勝利是一次順理成章的成功。

「對AI來說,《Dota》是一個非常適合的對抗性遊戲,遊戲本身很複雜,也擁有高強度對抗場景。這意味著你需要一種新技術,來努力擴展、推進AI的邊界。」OpenAI的首席技術官Greg Brockman(下稱Brockman)透露。這也是他們為何選擇《Dota》作為AI訓練主戰場的原因。

Brockman表示,在《Dota》中取勝更依賴於選手的直覺,而這已經通過AI學會了:通過自我對弈(Self-play)進行高強度訓練,預測其他玩家的下一步操作,提高應對陌生環境的表現,幫助友軍單位取勝。在經過僅僅兩周的實時訓練后,AI就達到了目前專業選手的水準。

最終,從對於自己所處的世界全無認識,再經歷過大量和自身拷貝的對戰後(這意味著它和對手永遠是旗鼓相當的),AI的遊戲技巧有了一日千里的進步。按照Brockman介紹,OpenAI在此之前已經戰勝了現役的Arteezy、SumaiL等多個世界冠軍級的《Dota》選手。

「OpenAI第一次打敗了世界上最好的電競選手。」

當然, OpenAI作為由矽谷大亨Elon Musk投資創立的非營利科研機構,其目的並非局限於遊戲,Brockman透露,通過遊戲中的訓練,OpenAI希望幫助機器人建立系統性學習複雜技能的能力,這有助於幫助AI應對現實世界中的任務,如外科手術。

願景很偉大,至少Elon Musk本人對這場比賽的結果還是很滿意的,他專門發布了一條推特消息,稱「OpenAI第一次打敗了世界上最好的電競選手。電競比象棋、圍棋這樣的傳統棋盤遊戲要複雜得多。」還順便小小嘲諷了一下對手AlphaGo。

DeepMind將研究重心放到了《星際爭霸2》上。

不過,AlphaGo的擁有者DeepMind,也早已經將AI研究方向轉移到遊戲上了,幾個月之前,他們選擇了《星際爭霸2》作為圍棋之後的下一個測試對象。8月初,DeepMind開源了《星際爭霸2》研究訓練平台SC2LE。據《財富》報道,DeepMind的目標是讓計算機擊敗最頂級的人類《星際爭霸》玩家。

我們已經進入了一個AI研究的遊戲化時代。AI巨頭紛紛選擇遊戲作為研究入口,已經成為AI研究領域的重要風向。《經濟學人》評論認為,電子遊戲受追捧有幾個原因:將遊戲作為現實世界的訓練場;不同的遊戲需要不同的認知技能,遊戲可以幫助他們了解如何把智能問題分解成更易處理的小模塊;基於以上兩種原因,認為遊戲可以幫助他們發展出一套合適的人工(甚至自然)智能理論。

甚至電子遊戲還可以簡化現實AI研究中機器人的維護、調試過程:虛擬機器人沒有重量,無需維護,改變規格也只要在鍵盤上敲幾下就足夠了。

而在明年,OpenAI的《Dota》選手將更加「名副其實」,開發團隊計劃在TI8前做出可以參加5V5比賽的AI,並且規則與人類比賽規則相同,可以預料,到時候這場人類與AI的遊戲大戰會更加精彩和戲劇化。



熱門推薦

本文由 yidianzixun 提供 原文連結

寵物協尋 相信 終究能找到回家的路
寫了7763篇文章,獲得2次喜歡
留言回覆
回覆
精彩推薦