search
尋找貓咪~QQ 地點 桃園市桃園區 Taoyuan , Taoyuan

OpenAI狂虐Dota大神Dendi AI稱霸遊戲界?

據悉,在上周五Dota 2國際邀請賽上,Open AI的機器人在Dota2 1v1比賽中戰勝了Dota人類頂級職業玩家Dendi。至此,繼橫掃人類國際象棋大師和圍棋大師后,人工智慧如今又將風靡全球的電子競技遊戲Dota2攻陷。

上周五晚,埃隆·馬斯克的OpenAI團隊在電子競技領域一鳴驚人,躍居成為世界上最偉大的選手之一。

據悉,在上周五Dota 2國際邀請賽上,Open AI的機器人在Dota2 1v1比賽中戰勝了Dota人類頂級職業玩家Dendi。至此,繼橫掃人類國際象棋大師和圍棋大師后,人工智慧如今又將風靡全球的電子競技遊戲Dota2攻陷。

比賽期間,Open AI公司的機器人表現是非常「強悍」的,不僅會卡兵、s補刀,還會s掉技能抬手,其進攻性超強,連續兩局狂虐Dendi。如此「強悍」的Open AI機器人手法嫻熟,出手「快」、「准」、「狠」,刀刀斃命,這不禁令Dendi求饒:「請放過我吧。」

針對此戰情,馬斯克很快就歡呼著發了推文,慶賀勝利。他寫道:「OpenAI在競爭激烈的電子競技領域中首次擊敗了世界上最優秀的選手。Dota 2比傳統的棋類遊戲複雜得多。」馬斯克暗指自己的OpenAI機器人比AlphaGo更勝一籌。儘管OpenAI這款機器人絕對是了不起的——它展示了一種對職業玩家的統治地位,但機器人並不會取代Dendi在團隊中的位置。

什麼是Dota2?

《DOTA 2》是一款由Valve開發免費的多人在線戰鬥競技類遊戲,其前身是魔獸爭霸三及擴展版本冰封王座中的一張自定義遊戲地圖。截至目前,Dota2是steam平台上活躍人數最多的遊戲之一,最高在線人數超過120萬。Dota2的遊戲比賽在兩個隊伍間進行,每個隊伍有五名玩家,每個隊伍都有一條優勢路。每個隊伍的遊戲目標是摧毀對面要塞中的遠古遺迹。每個玩家從113位能力風格技能迥異的英雄中選擇一位進行操控。在比賽中,玩家在相互對抗的過程中為各自的英雄收集金錢、經驗及道具。

雙方玩家將在一幅地圖上爭奪地盤,殺死對方小兵和電腦控制的其他遊戲單位,以增強他們的力量,並試圖殺死對方以給自身隊伍帶來益處。這些角色的特技不同,比如進攻、防守和支持,但是複雜多變的因素意味著人類棋手在幾十種不同的風格、策略和角色中都只能扮演一個英雄。

戰況回顧

然而,在1v1的模式中,兩位玩家都被分配到同一個英雄——暗影惡魔(簡稱「影魔」),一個廣受歡迎的進攻性英雄,被許多世界上最好的中路角色玩家所青睞。勝利的規則很簡單——殺死對方兩次或摧毀一座防禦塔的玩家則獲勝。「影魔」並不是Dendi玩的最好的英雄,但他仍然是這個角色的頂級玩家。本周早些時候,OpenAI報道稱,他們的機器人擊敗了目前的1v1冠軍Sumail(美籍巴其斯坦遊戲玩家,曾獲得過DOTA2第五屆國際邀請賽冠軍),以及世界上最好的中路玩家——Arteezy。

在這種格局的遊戲中,OpenAI的機器人完全佔據了主導地位。雙方交鋒過程中,在第一場比賽期間,主持人問Dendi:「你感覺它像一個『人類選手』嗎?」Dendi回答說:「不,這傢伙真的很可怕。」他不停地說著,面對機器人放狠招,他還一度大叫「請放過我吧!」第一局比賽中,第一局Open AI機器人僅用10分鐘就擊敗了Dendi(Dendi試圖殺死機器人的同時,機器人殺死了他二次)。第二場比賽中,機器人在開場的幾分鐘內無情地痛打了他一頓,他便投降了主動放棄了比賽,並拒絕進行第三場比賽。

OpenAI的這款機器人頻繁展示高超的戰術,阻止較小的單位,引誘著Dendi進入陷阱,並積極地採用戰略並利用它來懲罰Dendi。之前,Dota 2的計算機控制演算法可以與人類選手相抗衡,但它們的編程卻相對初級。在某種程度上,大多數專業人士都足夠優秀,能夠找到機器人遊戲風格的策略和弱點,這樣他們就可以輕鬆地開發和擊敗機器人。但是,這次的OpenAI機器人在上場之後幾乎找不到弱點。

機器人構建

OpenAI機器人運行了一種改良版的機器學習演算法,這意味著它會隨著它的運行而進化和學習,並拋棄其代碼的低級版本(該公司並沒有具體地使用它的語言,但據一名程序員透露,這是一種遺傳演算法)。該機器人學會了玩遊戲,不過這個遊戲是要打敗它自己。OpenAI Dota 2團隊的負責人Greg Brockman說,在早期階段,決鬥的暗影惡魔只是在地圖上毫無目的地四處亂跑直到他們死去,但慢慢地,他們學會了一些策略,讓他們更接近設定的獲勝目標。幾周之後,他們就變得十分強大,足以擊敗專業選手。「這款機器人可以從零開始,在兩周的時間內變得很強大,」他說。

「自我博弈」(self-play)是OpenAI研發的關鍵所在。據悉,這是一種用於學習和解決機器複雜任務的有效方法:與太強或者太弱的都手過招,它都無法從中學到任何東西,但是可以將自身作為競爭對手。這次的機器人完全是在自我博弈下進行針對訓練的,並沒有使用模仿學習或樹搜索。

未來5V5不是「夢」

據悉,Dota 1v1是含有隱藏信息的複雜遊戲,智能體需要通過學習計劃、進攻策略,並從中學會誤導對手。玩家技巧和手速的關聯性也不那麼強烈了。而實際上,OpenAI的手速一般,和普通人類玩家大致相當。而要想在Dota中取勝,要求玩家培養出敏銳的直覺,並採取相應的應對措施。視頻中,我們可以看到,該機器人已經通過自我博弈學會了預測其他選手的動作,並在不熟悉的場景下即興發揮,刀刀斃命。面對Dota繁瑣複雜的遊戲規則,該機器人並沒有絲毫的「怯場」,應用自如。在訓練之初,AI對於自己的所處的世界一無所知,從零開始學習,進行自我博弈,這其實意味著它和它的對手永遠旗鼓相當,並不斷取得進步,進而達到職業選手的水平。

當然,1v1模式的Dota並不是真正的Dota。但這是一個次要問題,就像棒球里的全壘打一樣。你可以製造一個俯仰的機器人,它可以一直扔出完美的快速球,但是,要想建立一個機器人棒球運動員團隊是完全不同的事。無論是在編程方面,還是在最高級別的協調、溝通和戰略方面,都面臨著嚴峻的挑戰。在完整的5v5版本遊戲中,有成千上萬的不定因素,那遠比精簡版的多很多——所以馬斯克的勝利之聲是在混淆實際的成就。不過,OpenAI並沒有就此止步。該公司表示,「下一步是創建一個Dota 2機器人團隊,這些機器人可以與頂尖的人類團隊進行競爭和協作」。這意味著,如果它採用同樣令人印象深刻的技術,明年的TI8可能會有一個完整的機器人挑戰者團隊。

真實的世界

當然,這其中的含義是,能夠掌握複雜視頻遊戲的機器人也可以有其他的用途。「我們所建立的是一個普遍的學習系統,儘管它在很多方面仍然受到限制,但它仍然能擊敗最優秀的人類專家,」Brockman說,「這是朝著向建立更通用的系統邁出的關鍵一步,它可以學習真正複雜的、重要的現實世界里的任務,比如做一名外科醫生。」

向來以建設安全可靠的通用人工智慧為己任的OpenAI,通過「自我博弈(Self-Play)」從零開始訓練這款電子競技機器人。賽前,Open AI CTO Brockman對外透露了該款機器人在Open AI的指導下經歷了一千次比賽的訓練。Brockman 還聲稱這個 bot 已經打敗多個世界級職業玩家。接下來,該公司表示將要轉戰研究5V5,未來戰勝人類世界級玩家不是「夢」。

OpenAI是我們工作的公司,其目標是確保這些強大的系統對我們所有人都是有益的。這也是馬斯克計劃的一部分。他的想法是,最終人工智慧將比人類更聰明,而且人工智慧必須在安全、受監管的情況下進行。「沒有人喜歡受到監管,但所有對公眾構成威脅的東西(汽車、飛機、食品、藥品等)都必須要受到監管。人工智慧也應該是這樣的。」上周五晚,馬斯克發表推文說道。

人工智慧目前可能不會對社會造成多大威脅,但在Dota2的比賽中,它確實很可怕。

返回 雲掌財經科技關注更多



熱門推薦

本文由 yidianzixun 提供 原文連結

寵物協尋 相信 終究能找到回家的路
寫了7763篇文章,獲得2次喜歡
留言回覆
回覆
精彩推薦