3C科技 娛樂遊戲 美食旅遊 時尚美妝 親子育兒 生活休閒 金融理財 健康運動 寰宇綜合

Zi 字媒體

2017-07-25T20:27:27+00:00
加入好友
騰訊互娛前沿技術中心 揭南豐「那麼,深度學習究竟如何應用在遊戲上呢?」——在2017 GDC的一個深度學習小講座上,一位戴黑框眼鏡的聽眾待主講人話音剛落便迫不及待地問道。如此沒逼格、直白得近乎在釣魚的問題自然是引得眾人一陣狂笑。可惜演講者顯然對此準備不足,只能籠統地打了兩圈太極。視角再度轉回台下觀眾,他們的臉上大多都寫著各國語言的失望……沒錯,其實即便嘴上不說,大家也都差不多是帶著同樣的問題來參會的。2017年初,當VR(低端硬體)市場驟然降溫時,眾投資人和分析師們便試圖說服大家:既然「VR元年」已過,那麼今年的關注點就應該自然而然地轉移到人工智慧技術上。這種熱點切換理論究竟有沒有道理?人工智慧對遊戲產業是否存在立竿見影的決定性作用?通過本屆遊戲開發者大會(Game Developers Conference, GDC),很多人已經找到了自己的答案。1. GDC,集大成1.1 目標,舊金山!太平洋時間2月27日清晨,一年一度的GDC展會如期在美國舊金山的Moscone 會展中心召開。在這場雲集了全球遊戲產業開發商的盛會上,人們帶著成就心得,帶著疑慮遐想,於三個會場、數十個禮堂以及上百個展台內熱切地握手、交流、磋商、簽協議……圖 1 Moscone會展中心的西區不過GDC並不同於普通的展會,其最重要的議程並不是廠商擺攤子讓人買票進來逛,而是數百場專業的峰會講座。在官方網站、參展手冊上和大堂內,都能找到這些令人眼花繚亂的開課信息。它們時間相互衝突,領域五花八門——或討論編程、引擎,或關注音頻、策劃,或研究手游、端游,或點撥社區、營銷,授課者亦無不是有豐富經驗的資深從業人員。要說人們參加GDC最大的遺憾,大抵都是分身乏術,無法同時兼顧多門感興趣的課程了吧。圖 2 GDC的周一「課程表」。注意每個時間段(紫色標題分割)均提供了大量互斥的課程1.2 AI在哪裡?本屆GDC的峰會照舊提供了「AI Summit」。不過,這可和當今炙手可熱(貶義詞無誤)的AI,即以深度學習為代表的機器學習技術不是一回事。我們不妨來看幾個演講的題目:AI Arborist: Proper Cultivation and Care for Your Behavior Trees(AI樹藝家:給予你親愛的行為樹以恰當的栽培和關愛)Beyond Framerate: Taming Your Timeslice Through Asynchrony(幀率之外的故事:如何用非同步方式調教時間片)Behavior is Brittle: Testing Game AI(行為無法承受之輕:遊戲AI測試)Bring Hell to Life: AI and Full Body Animation in DOOM(人間煉獄:《毀滅戰士》中的AI和全身動畫)看起來,這裡所談論的「AI」更傾向於傳統遊戲設計和開發流程中所涉及的自動行為與刺激反饋系統。在認真聽了數個AI峰會講座后,我最終還是未能從中嗅到一絲機器學習的氣息……儘管頂著「AI」名號的講座卻沒當今語境中的人工智慧,但GDC官方所籌辦的課程也並非完全沒照顧前沿內容。有一堂名為「Math for Game Programmers」的系列講座,在一個會廳里從早上到晚,並涵蓋了這麼一些議題:Noise-Based RNG(基於雜訊的隨機數生成器)Dark Secrets of the RNG(隨機數生成器暗藏玄機)Predicting Projectiles(預測拋體)Ranking Systems: Elo, TrueSkill and Your Own(三套排名匹配演算法:Elo、TrueSkill以及Your Own)The Math of Deep Learning(深度學習之數學)Harmonic Functions and Mean-Value(諧波函數與均值)注意到沒,在這堆讓不少人看名字就不太想去的講座中,堂而皇之地安排了一門深度學習之數學基礎三十分鐘速成班。不愧是遊戲業集大成的頂級盛會!而那堂課也毫無懸念地提前二十分鐘就排起了大長隊:隊列延伸出走廊,在大堂里擺出不知哪種寫法的「回」字來。絡繹不絕加入隊尾的人們也交頭接耳不斷:-「這是深度學習那堂課的隊列嗎?」-「Holy shit!」-「大家為啥都來聽這個啊?」-「這麼多人排隊,姑且進去瞧瞧吧……」圖 3 「The Math of Deep Learning」小講座a)主講人Alex Champandard;b) 深度學習與神經網路之關係圖; c) 深度網路中的局部極值依然具有效力;d) 不同優化演算法的收斂速度比較。30分鐘的小講座在攢動的人頭和高舉著拍照的手機中一晃而過。一言以蔽之,我可能上了一堂假的數學課。這門定位模糊的講座全程沒呈現出一個公式,也不涉及任何邏輯推導,但卻直接抬出了不少凸優化的結論。試圖速成的初心者難以跟上其節奏,懂模式識別的聽眾又找不到痛點。誠然,用短短半小時來介紹「深度學習之數學」這樣的命題完全不切實際,但蜂擁而至的GDC聽眾與本文導語所描繪的答疑環節,又毫無疑問地展示出了組織者的良苦用心:既然大家都對大紅大紫的深度學習技術充滿了殷切的期盼,那麼2017年不開設個相關的官方議程的確有些說不過去——哪怕,稍有常識的人都會看出,將深度學習嫁接至遊戲設計和開發的流程中還真是塊有待開墾的疆域。不過,用功的幸運掘金者總是有的。2. 綠色帝國之嬗變2.1 核武野心家GDC的金字招牌在吸引全世界玩家和遊戲開發者的同時,也無形中為硬體廠商們打造了一套價廉物美的宣傳平台。不過,真正有野心的公司是決不會滿足於在GDC的規劃展區里扔個幾平米的小隔間的。財大氣粗的NVIDIA,此次不僅贊助了16個議程,還將戰線推向了毗鄰Moscone會展中心的馬奎斯萬豪酒店,在二樓包場開課。就遊戲顯卡而言,儘管本人從RIVA 128一直用到了現在的GeForce 1070,但卻從來都不是個N粉。然而不得不承認,NVIDIA的確是一個非常會捕捉市場機會的硬體公司。Tegra移動片上系統(SoC)也好,基於Intel Atom處理器的離子平台也好,每次出手哪怕不能引領未來潮流,也至少都會將市場格局狠狠攪合一番——基於顯卡大規模并行運算的統一計算架構(Compute Unified Device Architecture,CUDA)當然也不例外。圖 4 以C語言為例,CUDA引入了新的并行編程理念遊戲顯卡的流處理單元數以千計,浮點運算能力又是強項,故在上面動點「歪腦筋」並不奇怪。於是早在2007年,NVIDIA就提出了CUDA的概念,以期能將這種功耗和發熱都非同小可的「核彈」硬體推向科學計算領域。而回過頭看,NVIDIA之所以能貫徹這份壯志,除了自身的奮鬥,也和歷史的行程不無干係。2011年前後,由比特幣引領的區塊鏈技術曾掀起過一番藉助顯卡運算獲取數字貨幣牟利(挖礦)的狂潮。這也是基於顯卡的并行運算首次從學術領域走向商品化、市場化。而至於這第二波機遇,則正是本文主要探討的深度學習技術。事實上,深度學習就是上世紀70年代所提出的人工神經網路的延續和推廣。這種包含大量隱藏層的分類器胃口極大,需要百萬以上量級的訓練樣本數,才能獲得甚高的預測精度和泛化能力(詳見第三節)。而類似卷積神經網路(Convolutional Neural Network,CNN)所涉及的卷積和矩陣運算,簡直就是為GPU量身打造的;使用GPU來訓練深度網路,其運算效率能達到CPU的數十倍。換言之,如果顯卡運算的潛能從未被發掘,則無法實現這一量變到質變的過程,深度學習的這波浪潮大概還得再等十年。嗅覺敏銳的NVIDIA,為此也特別成立了深度學習研究院(Deep Learning Institute,DLI),以便在促進技術進步的同時,鞏固、擴張市場,多多推銷自家坐地起價的專業運算顯卡。圖 5 NVIDIA Tesla P100運算專用顯卡($5000~$9000/片)的性能介紹2.2 深度課堂一方面是倡導顯卡加速運算、推動深度學習發展的急先鋒,另一方面又是在遊戲技術領域耕耘了二十餘載的頂級硬體公司,這兩份資質重疊在一起,便成就了當前NVIDIA在遊戲領域不遺餘力推廣深度學習技術的勤奮姿態。本次舊金山之行,我有幸參加了DLI組織的深度學習講習班(DLI Workshop)。授課的環境很輕鬆,難度也不大。前半部分為門外漢講解深度學習的來龍去脈和基本概念,後半部分則是上機實驗:利用即見即所得的深度學習GPU訓練系統(Deep Learning GPU Training System,DIGITS,https://developer.nvidia.com/digits),以互動式、即見即所得的界面操作MNIST手寫體數字的樣本分類,並順帶灌輸數據預處理和網路參數調節的概念。圖 6 DLI組織的深度學習講習班現場圖 7 純網頁交互界面的NVIDIA DIGITS(圖為MNIST數據集的訓練結果)在四小時左右的研習課上,NVIDIA的老師還提及了多項在遊戲設計上普及深度學習工具的可能思路:預測。推斷對手的下一步行為。操控。指揮載具的運動。進攻/逃逸選擇。在RPG遊戲中用正向和負向行為訓練神經網路,以實現自動決策。威脅評估。根據當前信息預測威脅狀況,並採取適當的行動。反作弊。鑒別行為和事件是否構成作弊或濫用。用戶畫像。根據多元的用戶數據甄別不同類型的玩家。信息審查。判斷玩家是否出言不當。此外,課上也穿插介紹了一些深度學習之於遊戲應用的具體案例,其中有數年前的舊聞,也有近期的新資訊:將八個移動方向和按鍵作為輸入,用深度強化學習訓練玩Atari和FC遊戲的AI,並最終成為遠勝人類玩家的絕頂高手。利用生成對抗網路(Generative Adversarial Network)設計背景資源和遊戲地圖。《閃電戰3》(Blitzkrieg 3)的AI玩家「Boris」。是為全球首個基於神經網路開發的即時戰略遊戲AI。可見,NVIDIA的確是帶著一顆遊戲之心來經營的這堂研習課,即便沒有森羅萬象,也算是從理論到實踐面面俱到了。而推廣DIGITS傻瓜式系統的目的,自然亦是為了最大限度降低深度學習的上手門檻,以便讓缺乏模式識別理論基礎的開發者能將其作為一個能信手拈來的工具使用,從而把更多精力投入到系統設計上。當NVIDIA逐漸從與ATi/AMD的對標絞肉競爭中抽身出來之後,行業嗅覺敏銳的「戰術核顯卡」廠商便很快將觸手伸向了深度學習、自動駕駛等領域,以前沿技術積極倡導者的姿態完成了自身進化。然而,對於普通遊戲從業者而言,這些幾經包裝的新技術真的就是那麼觸手可及嗎?或許應該換個問法:所謂的「人工智慧」技術,現階段對遊戲產業的影響力究竟能延伸到哪個層面?3. 智能的本願3.1 新瓶裝舊酒其實對於很多人而言,「人工智慧」、「機器學習」和「深度學習」這三個詞,都是從AlphaGo擊敗李世乭之後才開始高頻接觸的。由於新聞媒體的知識結構和水平有限,在傳播時又刻意誇大內容的衝擊力,最終便導致了報道上的偏差,以致概念誤用混用。實際上,人工智慧是個很大的概念,可不嚴格地劃分為強人工智慧(General AI)和弱人工智慧(Narrow AI):強人工智慧:可自主推理和解決問題、擁有類似或超越人類智慧的機器(如終結者,目前尚不存在)。弱人工智慧:能模仿或超越人類執行特定任務的技術(如人臉識別、自然語言處理等)。而機器學習,是一種實現人工智慧的方法,且當前還只隸屬於弱人工智慧的範疇。至於深度學習、強化學習、遷移學習等,則僅僅是機器學習中的技術子集。圖 8 人工智慧等概念的關係圖(從外到內依次是人工智慧、機器學習、表徵學習、深度學習)於是在咬文嚼字三百字之後,便可理解為什麼在GDC的AI峰會上沒有跟風設立深度學習的相關議程,而有所涉及的內容也只談「Deep Learning」了。而在繼續討論深度學習對遊戲產業的作用域之前,我們最好再花點時間來梳理一下深度學習的技術細節和長短板。如前所述,深度學習實質上為人工神經網路的延續和推廣。得益於高度非線性的特質,神經網路被譽為萬能擬合器;只要給予了足夠的訓練樣本,神經網路通常都能達到很高的預測精度。而隱藏層越多,模型的非線性程度就越高,所能處理的特徵維度和問題複雜程度也相應獲得提升。圖 9 典型的人工神經網路結構。其中,輸入和輸出層之間的三層均為隱藏層,全網共包含23328個參數不過,在相當長的一段時間內,囿於演算法與硬體算力的限制,神經網路的潛力無法徹底釋放。彼時,人們更青睞奧卡姆剃刀法則,主動降維,以模型解釋優雅的分類器(如支持向量機)處理各類模式識別問題。人總是實際的。如果暴力真的能解決好問題,甚至獲得令人稱奇的結果,那麼高傲的自尊遲早會被捨棄掉。2010年後逐漸興起的深度學習說白了就是這麼一回事。藉助廉價而算力暴漲的計算機硬體,以巨量樣本訓練幾十、幾百層的神經網路,調節數以億計的權值參數值,最終獲得出色的預測精度與泛化性能。該不等式由Blumer等人於1989年提出,它揭示了模型複雜度(VC維)與樣本量(m)和錯誤率(ε)之間的關係。過於複雜的模型在有限的樣本下會出現維數災(Curse of Dimensionality),但足夠大的樣本量將允許甚高複雜度的模型。這也就意味著,在機器學習的方法學上,短短十年間就出現了重大的思考範式轉移:當然,比起以前針對不同場景慎重選擇、比較分類演算法的「奇技淫巧」,如今相對通用的深度學習工具,其總體指導思路從某種意義上來說的確足夠簡單清晰:多就是好,大就是美,億萬的節點,億萬的光輝。反正無論如何都在深度學習框架下實現,於是預測精度不夠高大概率是模型設計不夠複雜的錯,而且更可能是樣本量不足的鍋。現各大廠商都視自家的大數據樣本為至高機密,便是一佐證。但機器學習中也有一個頗具哲理性的論斷,即沒有免費午餐定理(No Free Lunch Theorem)。其正規解釋是,不存在某種演算法,對所有問題都最適合;若一演算法對某些問題能解決得非常出色,那麼必存在另一些問題,使該演算法甚至不如隨機猜測。深度學習自然不會例外。當它被戴上「人工智慧」的寶冠大受追捧時,肯定會有具體應用拔下皇帝的新衣。同理,假以「人工智慧」盲目地在遊戲產業的方方面面嘗試深度學習演算法,也註定會被用戶譏諷道——3.2 甚矣,汝之不惠深度學習,或者說神經網路最為人詬病的一點,便是其極端的非線性性所導致的黑箱效應。使用者只能把它當作一個魔盒來對樣本變戲法,獲取高分類精度,而無法反推樣本中是何種因素導致了這樣的預測效能。簡而言之,知果不知因,知其然而不知其所以然。例如,基於深度網路去處理遊戲中的用戶消費數據,並得到了分析結果,我們卻很難從中獲知究竟是哪些維度的知識對結果產生了如此至關重要的影響,因而也無法促進遊戲的營收(這裡只講因果分析,不談推薦演算法)。然而,目前整個業界似乎都被「人工智慧」鋪天蓋地的宣傳所沖昏了頭腦,以至於對這種不求甚解都報以得過且過的態度。誠然,對於特定類型的任務(如生物特徵識別),給定輸入后能提供精確的分類輸出就足夠了,但這並不能讓我們自己變得更聰明。AlphaGO在戰勝頂級圍棋大師后,人們也很難從其落子規律中找到提升自身棋力的方法。諷刺的是,當每個神經網路的科普講座都試圖從神經元細胞的生理結構來自證這種類腦計算的合理性時,可曾想到過有上千年歷史的神經科學一刻都未停止過對人腦智慧根源的孜孜探求。要知道,即便當前最複雜的深度網路節點數已達百萬量級,而人腦可是有千億量級的神經元總數啊。圖 11 一張簡單描述左腦外側皮層部分功能分區的示意圖當我們清醒地審視當前的計算機系統時,就會發現這一切其實並沒那麼特別。縱使深度學習的解決方案乃至專用運算晶元的效率再高,它們依然是運行在電子元器件上的人類編寫好的程序。它們或許在特定認知任務上執行得比人類更好,但歸根結底還停留在單一目標的層面上。它們沒有情感、缺乏自我意識,充斥著人類和機器的雙重缺陷。至少,在可預見的很長一段時間內都還將是如此。所以,我們不妨先省省力氣,少談點人工智慧。遊戲從業者如果需要執行極高精度的分類任務,或自動化地構建高質量的圖形資源,那麼盡可以採用成熟的卷積神經網路、生成對抗網路等技術。而倘若只需要對行業數據、用戶數據等進行定量分析,並同時關注輸入變數的重要誘因維度,那麼也完全可以使用傳統、易解釋的模型——說不定一個線性分類器就夠格了。總之,按需選擇最稱手的工具即可。對深度學習的未來大可暢想,但毋神話。言已至此,我們不妨再回過頭重新審視一下GDC 2017。在總共五天的「課程表」上,前兩天都是去年廣受好評的虛擬現實開發者大會(Virtual Reality Developers Conference,VRDC)。相對於國內甚囂塵上的「VR寒冬論」(對低端硬體而言),從矽谷到GDC會場內都感受不到任何蕭條衰敗。人們積極地總結、討論、交流VR的開發細節和新興玩法,對未來充滿了熱切的期盼。今年的GDC遊戲頒獎典禮,甚至還新設了「最佳VR遊戲獎」。事實上,VR更多的是一套完整的體驗型商品,和現階段僅僅作為工具存在的深度學習完全不是一個層面的內容;比較其熱度,在概念上就沒有意義。VR產品自然會涉及到語音識別、手勢識別等深度學習的運用場所,但兩者之間很難說存在相互促進依存、或相互對立不調的並列關係。VR在硬體、標準和協議上還大有文章可做,而其內容生產更是一片藍海。因此,諸如2016年器重VR、2017年關注深度學習、2018年又是AR之流的非此即彼的熱點切換理論且不說在全球範圍內沒有嚴格的數據支撐,從技術投資的角度來講也難站住腳。圖 12 VRDC期間專用於探討VR/AR遊戲相關議題的Moscone會展中心北區135號廳在科幻作品中,虛構的人工智慧總是表現出人類一般的思維模式和談吐,它們或與人和諧共處,或致力於清算舊世界。但此等光鮮形象的背後,實際上卻也是人類勞動的代替踐行者——無論是正向還是負向的工具。是的,工具,這便是人工智慧的本願。當人們在2017年就迫不及待地將科幻作品中尚屬小兒科的深度學習進行圖騰化膜拜時,憧憬的列車遲早會在技術鋪就的鐵道上脫軌。而智者對智能的探索,肯定是貫徹始終的理性思考與穩步前行。至於關注深度學習的遊戲從業者,還有一個更現實也更有趣的目標等著他們。瞄準舊金山,我們2018年的GDC展會再見。

本文由yidianzixun提供 原文連結

寫了 5860316篇文章,獲得 23313次喜歡
精彩推薦