Zi 字媒體

OpenAI狂虐Dota大神Dendi AI稱霸遊戲界？

2021/12/25

據悉，在上周五Dota 2國際邀請賽上，Open AI的機器人在Dota2 1v1比賽中戰勝了Dota人類頂級職業玩家Dendi。至此，繼橫掃人類國際象棋大師和圍棋大師后，人工智慧如今又將風靡全球的電子競技遊戲Dota2攻陷。

上周五晚，埃隆·馬斯克的OpenAI團隊在電子競技領域一鳴驚人，躍居成為世界上最偉大的選手之一。

據悉，在上周五Dota 2國際邀請賽上，Open AI的機器人在Dota2 1v1比賽中戰勝了Dota人類頂級職業玩家Dendi。至此，繼橫掃人類國際象棋大師和圍棋大師后，人工智慧如今又將風靡全球的電子競技遊戲Dota2攻陷。

比賽期間，Open AI公司的機器人表現是非常「強悍」的，不僅會卡兵、s補刀，還會s掉技能抬手，其進攻性超強，連續兩局狂虐Dendi。如此「強悍」的Open AI機器人手法嫻熟，出手「快」、「准」、「狠」，刀刀斃命，這不禁令Dendi求饒：「請放過我吧。」

針對此戰情，馬斯克很快就歡呼著發了推文，慶賀勝利。他寫道：「OpenAI在競爭激烈的電子競技領域中首次擊敗了世界上最優秀的選手。Dota 2比傳統的棋類遊戲複雜得多。」馬斯克暗指自己的OpenAI機器人比AlphaGo更勝一籌。儘管OpenAI這款機器人絕對是了不起的——它展示了一種對職業玩家的統治地位，但機器人並不會取代Dendi在團隊中的位置。

什麼是Dota2？

《DOTA 2》是一款由Valve開發免費的多人在線戰鬥競技類遊戲，其前身是魔獸爭霸三及擴展版本冰封王座中的一張自定義遊戲地圖。截至目前，Dota2是steam平台上活躍人數最多的遊戲之一，最高在線人數超過120萬。Dota2的遊戲比賽在兩個隊伍間進行，每個隊伍有五名玩家，每個隊伍都有一條優勢路。每個隊伍的遊戲目標是摧毀對面要塞中的遠古遺迹。每個玩家從113位能力風格技能迥異的英雄中選擇一位進行操控。在比賽中，玩家在相互對抗的過程中為各自的英雄收集金錢、經驗及道具。

雙方玩家將在一幅地圖上爭奪地盤，殺死對方小兵和電腦控制的其他遊戲單位，以增強他們的力量，並試圖殺死對方以給自身隊伍帶來益處。這些角色的特技不同，比如進攻、防守和支持，但是複雜多變的因素意味著人類棋手在幾十種不同的風格、策略和角色中都只能扮演一個英雄。

戰況回顧

然而，在1v1的模式中，兩位玩家都被分配到同一個英雄——暗影惡魔（簡稱「影魔」），一個廣受歡迎的進攻性英雄，被許多世界上最好的中路角色玩家所青睞。勝利的規則很簡單——殺死對方兩次或摧毀一座防禦塔的玩家則獲勝。「影魔」並不是Dendi玩的最好的英雄，但他仍然是這個角色的頂級玩家。本周早些時候，OpenAI報道稱，他們的機器人擊敗了目前的1v1冠軍Sumail（美籍巴其斯坦遊戲玩家，曾獲得過DOTA2第五屆國際邀請賽冠軍），以及世界上最好的中路玩家——Arteezy。

在這種格局的遊戲中，OpenAI的機器人完全佔據了主導地位。雙方交鋒過程中，在第一場比賽期間，主持人問Dendi：「你感覺它像一個『人類選手』嗎？」Dendi回答說：「不，這傢伙真的很可怕。」他不停地說著，面對機器人放狠招，他還一度大叫「請放過我吧！」第一局比賽中，第一局Open AI機器人僅用10分鐘就擊敗了Dendi（Dendi試圖殺死機器人的同時，機器人殺死了他二次）。第二場比賽中，機器人在開場的幾分鐘內無情地痛打了他一頓，他便投降了主動放棄了比賽,並拒絕進行第三場比賽。

OpenAI的這款機器人頻繁展示高超的戰術，阻止較小的單位，引誘著Dendi進入陷阱，並積極地採用戰略並利用它來懲罰Dendi。之前，Dota 2的計算機控制演算法可以與人類選手相抗衡，但它們的編程卻相對初級。在某種程度上，大多數專業人士都足夠優秀，能夠找到機器人遊戲風格的策略和弱點，這樣他們就可以輕鬆地開發和擊敗機器人。但是，這次的OpenAI機器人在上場之後幾乎找不到弱點。

機器人構建

OpenAI機器人運行了一種改良版的機器學習演算法，這意味著它會隨著它的運行而進化和學習，並拋棄其代碼的低級版本（該公司並沒有具體地使用它的語言，但據一名程序員透露，這是一種遺傳演算法）。該機器人學會了玩遊戲，不過這個遊戲是要打敗它自己。OpenAI Dota 2團隊的負責人Greg Brockman說，在早期階段，決鬥的暗影惡魔只是在地圖上毫無目的地四處亂跑直到他們死去，但慢慢地，他們學會了一些策略，讓他們更接近設定的獲勝目標。幾周之後，他們就變得十分強大，足以擊敗專業選手。「這款機器人可以從零開始，在兩周的時間內變得很強大，」他說。

「自我博弈」（self-play）是OpenAI研發的關鍵所在。據悉，這是一種用於學習和解決機器複雜任務的有效方法：與太強或者太弱的都手過招，它都無法從中學到任何東西，但是可以將自身作為競爭對手。這次的機器人完全是在自我博弈下進行針對訓練的，並沒有使用模仿學習或樹搜索。

未來5V5不是「夢」

據悉，Dota 1v1是含有隱藏信息的複雜遊戲，智能體需要通過學習計劃、進攻策略，並從中學會誤導對手。玩家技巧和手速的關聯性也不那麼強烈了。而實際上，OpenAI的手速一般，和普通人類玩家大致相當。而要想在Dota中取勝，要求玩家培養出敏銳的直覺，並採取相應的應對措施。視頻中，我們可以看到，該機器人已經通過自我博弈學會了預測其他選手的動作，並在不熟悉的場景下即興發揮，刀刀斃命。面對Dota繁瑣複雜的遊戲規則，該機器人並沒有絲毫的「怯場」，應用自如。在訓練之初，AI對於自己的所處的世界一無所知，從零開始學習，進行自我博弈，這其實意味著它和它的對手永遠旗鼓相當，並不斷取得進步，進而達到職業選手的水平。

當然，1v1模式的Dota並不是真正的Dota。但這是一個次要問題，就像棒球里的全壘打一樣。你可以製造一個俯仰的機器人，它可以一直扔出完美的快速球，但是，要想建立一個機器人棒球運動員團隊是完全不同的事。無論是在編程方面，還是在最高級別的協調、溝通和戰略方面，都面臨著嚴峻的挑戰。在完整的5v5版本遊戲中，有成千上萬的不定因素，那遠比精簡版的多很多——所以馬斯克的勝利之聲是在混淆實際的成就。不過，OpenAI並沒有就此止步。該公司表示，「下一步是創建一個Dota 2機器人團隊，這些機器人可以與頂尖的人類團隊進行競爭和協作」。這意味著，如果它採用同樣令人印象深刻的技術，明年的TI8可能會有一個完整的機器人挑戰者團隊。

真實的世界

當然，這其中的含義是，能夠掌握複雜視頻遊戲的機器人也可以有其他的用途。「我們所建立的是一個普遍的學習系統，儘管它在很多方面仍然受到限制，但它仍然能擊敗最優秀的人類專家，」Brockman說，「這是朝著向建立更通用的系統邁出的關鍵一步，它可以學習真正複雜的、重要的現實世界里的任務，比如做一名外科醫生。」

向來以建設安全可靠的通用人工智慧為己任的OpenAI，通過「自我博弈（Self-Play）」從零開始訓練這款電子競技機器人。賽前，Open AI CTO Brockman對外透露了該款機器人在Open AI的指導下經歷了一千次比賽的訓練。Brockman 還聲稱這個 bot 已經打敗多個世界級職業玩家。接下來，該公司表示將要轉戰研究5V5，未來戰勝人類世界級玩家不是「夢」。

OpenAI是我們工作的公司，其目標是確保這些強大的系統對我們所有人都是有益的。這也是馬斯克計劃的一部分。他的想法是，最終人工智慧將比人類更聰明，而且人工智慧必須在安全、受監管的情況下進行。「沒有人喜歡受到監管，但所有對公眾構成威脅的東西（汽車、飛機、食品、藥品等）都必須要受到監管。人工智慧也應該是這樣的。」上周五晚，馬斯克發表推文說道。

人工智慧目前可能不會對社會造成多大威脅，但在Dota2的比賽中，它確實很可怕。

返回雲掌財經科技關注更多

桃園 qq 地點貓咪桃園市 taoyuan xuan 根部尾巴有大桃園旅遊景點