Zi 字媒體

星戰里的R2-D2與現實里的AI

2021/12/25

yidianzixun

R2-D2在1977年由特效設計師Tony Dyson創作出來，距今已有將近40年。隨著AI相關研發進入日新月異階段，是時候就將星戰電影里的R2-D2與現實的科技進程做一對比，看看科幻作者的想象力是有多超前……

說起R2-D2，喜歡星戰電影的朋友們一定並不陌生這個圓滾滾的小胖子機器人。別看R2-D2的個子小，它的影響可不小：R2-D2和它的好哥們機器人C3PO是僅有的兩位在七部星戰電影都有出鏡的角色。

R2-D2憑藉著呆萌的造型和在歷代星戰電影中出彩表現，逐漸成為最受大眾歡迎的機器人角色之一，而且它的影響還超出了電影，在2003年更被入選卡耐基梅隆大學主辦的機器人名人堂 (Robot Hall of Fame)。

按照星戰電影小說里的設定，R2-D2是宇航技工機器人（Astromech Droid），主要功能是為星際飛船做維修保養，同時內置導航系統來存儲和計算宇宙超空間跳躍的坐標。

雖然R2-D2的本職工作是做飛船維護，但在電影里的它實際承擔了主角身邊的萬能機器人的任務，萌但不笨，屢建奇功。比如在《星球大戰VI：絕地歸來》，R2-D2就在救援主角天行者盧克的過程中起了至關重要的作用。

R2-D2 1977年設計原圖，圖片來源於推特

1. 計算機視覺

R2-D2有一個可以360度旋轉的鏡頭來觀察周圍的環境和識別身邊的人物，具有計算機視覺能力。

計算機視覺是一門研究如何使機器「看」的科學，用攝影機和計算機代替人眼對目標進行識別、跟蹤和測量等機器視覺，並進一步做圖像處理，用計算機處理成為更適合人眼觀察或傳送給儀器檢測的圖像。

如今，人們已掌握部分解決具體計算機視覺任務的方法，如臉孔、指紋、文字、醫學圖像等，但是「泛用型」的電腦視覺目前在民用領域還是非常有限。

畢竟，讓計算機可以看並不是一個簡單的工作，就拿一個最簡單識別貓的任務來說，幼兒通過幾張照片就可以理解貓是什麼，計算機卻需要上百萬的圖片來進行訓練才能達到堪比人眼識別的準確率。

不過，計算機的優勢在於可以發現圖像的細節，找出人眼不易察覺出的區別，比如讓計算機區分不同種類的同一科生物（比如貓、魚），就比人眼識別要精確很多。

目前主要的機器視覺方法還是需要依賴人類的指令來進行監督，計算機科學家需要告訴計算機這些圖片上的物體是貓，計算機才能依此來學習貓的特性。

在宇宙中探險的R2-D2，遇到許多奇奇怪怪不同的生物和機器人，有些是前所未見的，因此，它除了要能識別預先訓練過的圖像或物體，還要有對未見過的物體進行識別和產生概念的能力，而這種能自行學習併產生概念的計算機視覺能力目前依然還是難題。

2012年，Google X實驗室由Andrew Ng及Jeff Dean領導的實驗小組使用了16000個計算機處理器建構了一個有10億個節點的虛擬大腦，通過分析1000萬幀Youtube上的無標籤剪輯圖片，自動學習和產生了貓的概念，並從接下來輸入的2萬張圖片的測試中準確識別了貓。

Google虛擬大腦自己構建產生的貓的概念圖片，圖片來源於Google Blog

總體而言，目前技術還做不到R2-D2那麼聰明的如人類般的視覺概念認知能力，也做不到那麼小巧（畢竟這需要大量的處理器參與模擬神經網路），要跟上科幻作者的想象力，還有很多困難需要克服。

2. 即時定位與地圖構建

即時定位與地圖構建（Simultaneous localization and mapping或簡稱SLAM）是機器人領域的一個難題，主要是指機器人從未知環境的未知地點出發，在運動過程中通過重複觀測到的地圖特徵（比如，牆角，柱子等）定位自身位置和姿態，再根據自身位置增量式的構建地圖，從而達到同時定位和地圖構建的目的。

電影里的R2-D2雖然內置有一些飛船或星球的地圖，但是很多時候它也需要在陌生的環境中學習適應，才能夠自由探索和行動，這時候就需要SLAM技術的幫助。

當然R2-D2也有慌不擇路的時候……

現在非常普及的家政掃地機器人就是一個非常好的例子，它們就需要解決一個在2D平面的SLAM的問題，在一個室內的空間環境，它們可以探測出地面環境並且工作。

如今，SLAM方法已被應用於廣泛無人機、無人車、AR、無人潛艇、行星探測車等多個領域。

Google無人車外部實景和計算機實時生成的外部環境對比

目前火熱的MR技術，比如微軟的HoloLens、谷歌的Project Tango和Magic Leap，都要用到SLAM方法。只有這樣，MR設備才可以通過感測器計算設備自身的精確位置，同時又能將周圍的三維空間進行實時重建，從而實現和身邊空間的MR互動。

HoloLens使用者在真實空間的MR互動

對比電影里的R2-D2,，我們可以驕傲地說，如今的SLAM技術已經可以基本實現R2-D2在未知空間里探測和移動的功能。

3. 自然語言處理

電影里的R2-D2可以聽懂主角們的講話，但是它自己並不具備說人類語言的能力，而是說一種其他機器人可以理解的語言——一系列滴滴嘟嘟的聲音所代表的機器二維碼。

閃閃發亮滴滴嘟嘟的R2-D2在很努力地說話

由於R2-D2最初的設計主要是負責飛船的修復維護，它也主要和其他機器人交互，所以並沒有安裝人類語言的模塊。在電影里，我們看到主角需要用專門的翻譯器，或者必須通過能說人類語言的機器人C3PO才可以明白R2-D2在講什麼。

自然語言處理（Natural Language Processing，或簡稱NLP）是人工智慧和語言學領域的分支學科，主要研究計算機如何和人通過自然語言進行交互。在這此領域中的難點，比較主要的有自然語言理解，也就是解決如何讓計算機聽或讀，把自然語言轉化為計算機程序更易於處理的形式；也有自然語言生成，也是如何讓計算機說或寫，把計算機信息轉化為自然語言。

自然語言處理的應用已然深入到了我們平常生活的很多方面，比如文字、語音的多語種機器翻譯，文字和語音的相互轉換，還有時下非常流行的智能個人助理。

時下大部分的智能個人助理，比如Google Assistant、Amazon的Alexa、Apple的Siri以及微軟的小娜，都可以很好地用於解決生活工作中的具體任務，包括管理日曆行程、查詢天氣等等。值得一提的是，微軟的小冰似乎走了一個完全不同的獨特路徑，她更關注於對話和聊天本身，而不是解決任務。相比之下，小冰更像一個情感的伴侶，可以說是諸多智能助理里最像人的智能助理。

筆者和小冰的一段有趣對話

當然目前的智能助理還有不少問題需要解決，比如多人同時對話時如何確認對話對象、聊天時語境的變換等等，還不能完全達到R2-D2那樣自如理解主角的語言。不過很多智能助理已經可以「說話」，這一點可以說打敗了只能講機器語言的R2-D2。

隨著技術的迭代，加上越來越多的用戶參與使用和訓練，相信這些智能助理也能越來越人性化，早日實現與科幻電影的機器人一樣流暢的對話能力。

這篇文章的緣起，是筆者2015年在西雅圖華盛頓大學科技政策實驗室主辦的WeRobot會議上旁聽了由R2-D2設計者Tony Dyson做的關於機器人的主旨講話。沒想到Tony Dyson先生於2016年初不幸辭世，西雅圖的短暫相逢愈發顯得珍貴。

在那次講話里，有現場聽眾給Tony Dyson老先生提問：「R2-D2最大的心理問題是什麼？」

老先生想了想，很爽快地回答說，「應該是拯救了銀河系但沒有因此被欣賞和承認吧！」

沒受到表揚的R2-D2應該會是這個反應吧？

若你也讚許R2-D2為銀河系做過的巨大貢獻、愛過這個萌且非常努力的小機器人，就請轉發點贊吧，我覺得它那富有想象力的爸爸Tony Dyson先生會感受到的……(End)

新華網·融媒體未來研究院（FMCI）是直屬於新華網、致力於前沿科技與產業應用的央媒智力與技術研究機構。主要針對傳媒行業未來發展的產品、技術與模式開展研究。根據國家賦予的職責要求，開展傳媒「硬體+軟體+服務」的探索與創新。

【FMCI未來研究院】

更多相關文章，請點擊閱讀原文~

敢不敢點開閱讀原文啊？

桃園 qq 地點貓咪桃園市 taoyuan xuan 根部尾巴有大桃園旅遊景點