Zi 字媒體

通過遊戲讓 AI 更智能，科技巨頭為什麼都在這麼做？

2021/12/25

人工智慧演算法正從3D視頻遊戲中獲益良多。——Davide Castelvecchi，《自然》雜誌

José Hernández-Orallo 是一名計算機專家，主要研究機器智能基準測量方法，他的孩子喜歡玩3D虛擬遊戲《我的世界》，後來他發現這個遊戲不是簡簡單單地打怪獸，而是引導玩家解決各種問題，於是，他把《我的世界》引入到他的研究中。

2014年，微軟買下了《我的世界》視頻遊戲。起初，微軟研究院僅向微軟內部的研究人員發布了該遊戲的一個新版本，這個新版本允許電腦程序和研究人員探索和按需定製3D環境。後來，微軟邀請了一小部分包括 Hernández-Orallo 在內的外部研究人員下載這個遊戲的定製版本。為了加速人工智慧的發展進程，2015年7月，微軟把這個遊戲的定製版本向所有人免費開放。

現在，很多巨頭也受到了微軟的啟發。12月3號，DeepMind 為方便外部開發人員下載和定製3D環境，向這些開發人員開放了他們自己的虛擬3D世界——DeepMind研究院。谷歌起初開發這個3D世界是為了訓練他們自己的AI程序。緊接著兩天後，OpenAI——由企業家Elon Musk在加利福尼亞州舊金山市創立的科研公司，發布了一個「元平台（meta-platform）」系統，這個平台使人工智慧程序可以輕鬆地鏈接上許多3D遊戲、瀏覽器以及手機程序。

微軟、谷歌和OpenAI提供的開放測試環境，在最初的完全不可見的情況下，為研究者和開發者們的程序測試提供了更簡便的方式。同時使程序在對類似現實世界場景的全新虛擬環境的探索中獲取更多的新技能。西雅圖華盛頓大學的機器學習研究者Pedro Domingos表示：「這樣的開放環境對人工智慧未來的發展意義重大」。

ATARI 演算法

遊戲作為人工智慧的「測試床」已經有數十年了，但通常演算法都是按照預定義的步驟來「玩」遊戲的。近幾年，研究焦點轉向了能夠從自身經驗中完成自學的機器上。2015年初，DeepMind公布了一個演算法，能在沒有任何遊戲目標的情況下，通過一次次實驗和錯誤，教自己如何玩經典的Atari遊戲，並且比所有人類玩家玩得都好。（譯者註：Atari為一家美國遊戲機廠商）

但是這些遊戲都只是簡單的2D遊戲。第一人稱的3D視頻遊戲，比如《我的世界》，這些在視覺上使玩家身臨其中的遊戲，是更接近現實世界的，所以也是更加複雜、精細的「測試床」。

《我的世界》能讓用戶操縱遊戲中的虛擬磚塊，來建造虛擬建築，除此之外還能在遊戲中遊歷的預置建築，並與之互動。現在，向開發人員開放的遊戲版本——Malmo，使演算法同樣能做到如此。舉個例子來說，Hernández-Orallo正使用Malmo來探究一個環境能否用於為機器智能創建檢驗基準。演算法之間會在把虛擬磚塊堆砌成某個特定的建築物的相似度上或是走出一個迷宮的速度上相互競爭。這相較於僅關注AI能否像人類一樣聊天的「圖靈測試」來說，這種測試方法考驗了AI更多的技能。

將《我的世界》遊戲改造成人工智慧測試床的優勢之一，就是它已經支持玩家間通過文字消息交流。Katja Hofmann——微軟研究院的計算機專家，同時也是Malmo團隊領導者對這一文字交流模式評價道：「這就使得人工智慧可以與現實世界中的人類互動與合作。」

機器人的智能部分

Hofmann還表示，虛擬世界對開發那些最終註定要操控機器人的人工智慧同樣非常有用。因為這樣的環境與現實世界相比，定製成本更低，並且操作更加安全、快捷。而且，虛擬世界還允許機器人研究人員僅關注方程式中的智能部分，因為機器人機械部分的實現難題往往會使研究人員分心。

除Hernández-Orallo之外，微軟研究院與許多使用Malmo項目的研究院都有合作。但是Hofmann估計，除了與微軟合作的研究院以外，實際還會有更多（數量大約在100間）研究院都在使用Malmo。

DeepMind研究院同樣也允許其研究人員在測試場景中建造類似迷宮的建築，他們的演算法能夠收集遊戲獎勵並且進行迷宮導航。DeepMind的一位女發言人說，他們現在還在嘗試將更多的大自然元素（比如高低起伏的地形或是不同種類的植物）整合進他們的平台中。這位發言人還表示，現在既然業內整體環境和資源更加開放了，谷歌希望其他研究人員能夠幫助設計對演算法來說更具挑戰性的環境。「通過開放資源，我們希望更多研究團體能參與共同打造這個更富挑戰性的測試環境」。

值得一提地是，OpenAI發布的「元平台」做到的遠不止開放環境。通過為同一個人工智慧系統設置多個、完全不同的測試環境，OpenAI可以幫助攻克AI領域內最困難的問題之一——創建一個在面臨新問題時，能夠靈活運用之前經驗的演算法。舉個例子來說，儘管深度神經網路（一種模仿人腦視覺皮質工作機制的演算法）能非常訊速地學會導航一個3D迷宮，但是它並不能把這個導航的經驗轉換至另一個3D迷宮的導航中。Hernández-Orallo說「就算你只改變了迷宮的顏色，系統也會在迷宮中徹底『迷路』，最先進、智能的科技對此也無能為力。」

微軟現在正努力讓Malmo在全世界普及。OpenAI的創始人和首席技術總監Greg Brockman也提出：「一個開放的生態平台將會加速人工智慧的發展。」

桃園 qq 地點貓咪桃園市 taoyuan xuan 根部尾巴有大桃園旅遊景點