search
尋找貓咪~QQ 地點 桃園市桃園區 Taoyuan , Taoyuan

馬斯克的AI機器人擊敗人類頂級電競玩家

在世界規模最大電子競技賽事之一Dota2國際邀請賽上,埃隆·馬斯克的非營利人工智慧公司Open AI機器人在Dota2一對一比賽中壓倒性擊敗了人類頂級職業玩家Dendi。

對於這一戰果埃隆·馬斯克也表現得頗為自信,第一時間在個人社交平台上表示,「Open AI第一次打敗了世界上頂級電競選手,這比圍棋難多了。」的確在兩者的交鋒過程中,Open AI機器人只用了不到10分鐘就將人類頂級玩家打敗,拿下第一局,如此強勢的技術使得Dendi在第二局對戰中退出並拒絕再戰第三局。

一時間AI攻陷電競言論四起,Open AI也被神化得不可一世。「這是一個令人印象深刻的成就,但並不是一次AI上的突破。」谷歌大腦團隊前成員Denny Britz發表評論回應這一事件,「事實上,過度炒作人工智慧的進步才是真正危險的事情。」

AI還不能統治電競界

一方面從比賽形式來看,Open AI參與的是更加簡單的1V1模式,在這種模式下沒有配合一說,且大部分情況下都是正面對抗了解對手的狀態。「非完美博弈問題在其中並不嚴重,1V1的執行路徑和狀態空間也小了很多。」第四範式資深機器學習架構師塗威威指出。

Facebook人工智慧組研究員田淵棟在知乎上也表示,一對一相對容易,真實的Dota2 5V5的遊戲是一個更有挑戰性的問題。5V5是一個多智能體的問題,需要通過智能體之間的配合才能獲取勝利,是一個非完美信息博弈的問題,由於遊戲裡面的「戰爭迷霧」,玩家不能知道遊戲的全部信息,有非常龐大的狀態空間,需要非常長的執行路徑才能獲得遊戲結果。

事實上,Open AI也希望在明年《Dota2》賽期,可以用 5V5 的方式再次上台挑戰,但5V5狀態AI戰勝人類的難度遠遠大於1V1,也大於圍棋難度。與馬斯克觀點不同,塗威威認為,Open AI擊敗電競和圍棋人機大戰是不可比的,這是兩種不一樣的任務。

目前AI技術很難在兩個或兩個以上的任務上工作得很好,AlphaGo是為19×19的圍棋任務設計的,同樣版本的AlphaGo目前甚至不能同時在19*19和20*20的棋盤上很好地工作。目前AlphaGo和Open AI 也不能交換彼此的任務,也就是說這些人工智慧技術目前不具備遷移能力。

塗威威認為,Dota2 5V5遊戲難度要遠遠大於圍棋的難度。「 Dota2 5V5是多智能體的協作遊戲,而圍棋只是1V1的遊戲;前者的狀態數遠遠大於圍棋的狀態數,且是非完美信息博弈,而圍棋是完美信息博弈。Dota2 5V5需要更長期的策略,往往要在成千上萬次操作之後才能獲得成果。在技術貢獻和社會意義上,目前Open AI的機器人還不能和AlphaGo相提並論。」

同時在英雄選擇上Open AI選擇了影魔,該英雄本身沒有控制技能,更多需要的是選手對距離細節等精準判斷和細微操作。塗威威表示:「這恰恰是人類不擅長,機器擅長的,人類選手solo慣用影魔英雄是因為人類不擅長這樣的事情,這樣的英雄solo玩好了才能更容易地體現與其他玩家的差距。所以即便Open AI在1V1上贏得了人類,離解決5V5的問題也很遙遠。」

Open AI 的「不成熟」也在隨後被驗證,比賽結束后已經有50多名玩家擊敗了這個被神化的AI,例如一些玩家通過勾引地方小兵背離正常路線,讓對方的AI陷入判斷追殺你還是守塔的猶豫狀態,進而贏得比賽。「Dota中的AI缺乏戰略層面的東西,攻擊、偵查、協助等決策。」竹間智能機器學習科學家王璈說道。

盯上電競的AI巨頭

事實上對電競感興趣的並非Open AI一家,在烏鎮圍棋峰會上,DeepMind CEO哈薩比斯就表示,星際爭霸將成為AI進步的下一個大考驗。隨後DeepMind與暴雪在《星際爭霸2》上展開研究實驗,並於近日開源了該訓練平台,同時這款遊戲也吸引了Facebook和阿里巴巴的人工智慧團隊加入。

這款即時戰略遊戲環境複雜多變,考驗AI對大量環境信息空間、時間和數據變化的理解能力。同時又考驗協作性,即混戰下對多個單位、建築、編隊的協同運作能力,需要玩家做出高級戰略決策,這也是這些巨頭將《星際爭霸2》作為訓練目標的原因。

雖然目前已經提取了上千場比賽近百萬的比賽錄像訓練AI程序,但暴雪方面表示,該AI尚處於初級階段,一些預判戰術和協作能力只能在小地圖中完成,且花費大量的運算時間才能進行下一步。

對當下的電競產業而言,AI更為直接且現實的意義則為「代練」功能。弗若斯特沙利文全球合伙人兼大中華區總裁王昕認為:「一方面AI可以學習他人的比賽經驗,培養新手玩家,另一方面電競教學也需要大量實戰,AI與人類玩家相比,不會受情緒、時間影響,反應速度也更快。」在比賽結束后,Dendi表示在看回放的過程中學到了一些內容。

但巨頭開發人工智慧的意義遠不是下棋或者打遊戲,而是為了更好地將AI應用到現實決策。在不完美且複雜信息情況下,如何做出預測和判斷,將決策所帶來的價值最大化,是AI發展的關鍵。

在此前德撲人機大戰中,創新工場創始人李開復也曾向第一財經闡述「不完整信息」下人工智慧的現實意義,「世界上大部分信息還不是公開的,面臨不完全或者誤導信息時的推理能力,未來能夠解決在決策、外交、商務合作、談判方面的不確定性,成為人類的『參謀』。」

【新浪財經股吧】討論



熱門推薦

本文由 yidianzixun 提供 原文連結

寵物協尋 相信 終究能找到回家的路
寫了7763篇文章,獲得2次喜歡
留言回覆
回覆
精彩推薦