Zi 字媒體

從IBM、谷歌、亞馬遜看當下AI的泛化

2021/12/25

曾幾何時，AI（人工智慧）成為了諸多企業的口頭禪，不管這個企業身處什麼產業，是什麼樣的企業，好像不帶上AI就落伍了，媒體更是天天充斥著各種AI的報道，我們也是聽得耳朵磨出了糨子。在此我們不妨以業內公認的AI或技術或市場中的代表IBM、谷歌和亞馬遜為例，看看AI的技術和市場究竟如何？

IBM「沃森」（IBM Watson）：被疑為噱頭商業化成本高企無實效

提及沃森，這個自從 6 年前在美國答題秀節目Jeopardy 中打敗人類選手，就佔據了無數的新聞頭條，並最早商業化（主要用於醫療領域癌症的檢測和預防）的所謂AI系統。不過，隨著時間的推移，近期沃森卻屢屢遭受業內的質疑。

例如華爾街投行傑富瑞分析師詹姆斯•基斯納（James Kisner）發布的關於IBM人工智慧「沃森」（IBM Watson）的研究報告就稱：IBM對沃森的投資很難給股東帶來價值回報，並用案例說明了IBM沃森存在的廣泛問題，即該案例來自IBM沃森與MD安德森癌症中心之間的合作，即在向沃森項目浪費了6000萬美元之後，MD安德森癌症中心最終停止了與IBM在這方面的合作，並承認這項技術尚未準備好臨床使用。而MD安德森癌症中心的情況並非個案。多名人工智慧領域的創業者都表示，他們在金融服務和生物科技領域的客戶在與IBM打交道時都有過類似經歷。

與華爾街投行的分析相比較，今年五月，在CNBC的金融市場觀察欄目「Closing Bell」上，風險投資人Chamath Palihapitiy更是語出驚人：「實話實說，Watson就是個笑話。我認為，IBM非常擅長利用銷售和營銷手段，來誘導信息不對稱的人掏腰包。」

而美國認知科學會創始人 Roge Schank認為沃森根本不是認知計算系統，IBM 有誇大吹噓嫌疑，並做了如下論證，即為了展示沃森的超凡智能，IBM 從 2015年以來在熱播電視節目中投放了沃森的廣告。在廣告中，沃森程序與搖滾靈魂人物鮑勃•迪倫進行了對話。

對此，Schank 指出，這個廣告恰恰說明沃森完全沒有理解迪倫的作品。儘管「時間流逝」之類的辭彙在迪倫的作品中時常出現，但所有熟悉迪倫作品的人都知道，迪倫是一位抗爭歌手，他的歌曲最關心的是民權、反戰這些主題。不過，迪倫歌的歌詞里並沒有直白地寫著「反戰歌曲」、「民權運動」。沃森只根據詞頻統計等方式找到「時間流逝」、「愛情凋零」，而沒有真正理解迪倫作品的真正主題。

谷歌DeepMind：除了圍棋技術與商業化類「沃森」前景不明

至於谷歌，去年AlphaGo依賴人工智慧挑戰號稱最難的人類遊戲圍棋大獲成功，讓人工智慧背後的「深度學習」廣為人知，也把谷歌此前收購的AI科技公司DeepMind推到了公眾面前。對此，就像前微軟亞洲研究院常務副院長芮勇所言，想要實現真正的人工智慧還有很長的路要走，今天所有的人工智慧幾乎都是來自於人類過去的大數據，沒有任何一個領域的能力源自自我意識，不管是象棋還是圍棋，計算機都是從人類過去的棋譜中學習。假如讓AlphaGo去下跳棋，它就會完全傻掉。甚至說把圍棋的棋盤稍作修改， AlphaGo都招架不住，但是人類就沒有問題。AlphaGo可以打敗三十多歲的李世石，但它的學習能力不及一個5歲的小孩，這二者是有很大區別的。

與沃森相比，DeepMind則剛剛進入商業領域的應用。去年七月，谷歌宣布DeepMind已找到方法將谷歌數據中心的製冷用電量減少2/5。它的演算法先分析數據中心的操作日誌來理解任務，然後通過反覆模擬運行來優化過程。同樣，DeepMind也已經進入醫療行業。去年11月，公司獲得了首個付費項目，與NHS公立醫院皇家自由倫敦醫院（Royal Free London）簽下五年的合同，為其處理170萬份病歷。此外，DeepMind還獲得了訪問其它倫敦醫院兩個資料庫的許可權，即DeepMind利用AI軟體分析了約100萬份視網膜掃描報告成功找到了退行性眼疾的早期徵兆，或通過頭頸部癌症圖像讓AI軟體學會區分健康和癌組織之間的不同。

從上述DeepMind的商業化看，與沃森類似，均需要首先獲取現實世界的大數據，即使擁有大量數據的可供挖掘的谷歌，運用AI及機器學習技術改進醫院、電網及工廠等系統時，獲取其具體操作數據也非常重要。原因很簡單，沒有人類提供的背景數據，哪怕極為簡單的挑戰，現有的AI技術也無法勝任。因此，當前的AI技術實際上並不「智能」，也不是解決問題的萬能手。

提及數據，在人機大戰前，DeepMind耗費了數年時間學習圍棋。參加《危險邊緣》問答的沃森，研發人員輸入了數TB有關問答節目和自然語言實例的數據，來幫助它理解這一節目的問答模式。只有靠人類這樣有針對性的密集「訓練」，這些機器才能表現得如此出色。會議安排助手X.ai這類看似簡單的應用程序卻花費了數年時間學習與會議安排相關的事項，才達到可投入商用的水平。而它們運作的過程，更類似於基於計算力提升之下的大數據分析和輸出，遠沒有創造性的推理。而眾所周知的事實是，在數據的處理（其實就是一種高速的運算），機器的能力早已經遠遠超過人類。

對此，有分析稱，DeepMind未來可能無法單單通過利用AI程序解決複雜問題的方式創造大量營收，但DeepMind AI軟體通過分析數據所獲取的有用信息已經足夠讓谷歌為當初的競標所投入的巨資值回票價。看到這裡，相信業內應該知道DeepMind的本質以及谷歌打著AI旗號的真實目的了吧。

亞馬遜Alexa：仍屬快速信息檢索涉及自然語言識別折戟沉沙

最後看亞馬遜。其所謂的AI是隨著採用智能語音技術Alexa的Echo音箱的熱銷而為業內所知，某種程度上也代表了亞馬遜AI的水平。但從其應用看，智能語音服務範圍大都是在信息檢索，幫助用戶獲得資訊。絕大多數的內容是不牽涉「推理」（對用戶自然語言的理解）的查詢類信息服務。如果用戶問到在基礎信息以上，一旦牽涉推理的問題，不僅是Alexa，幾乎所有的智能語音識別（包括谷歌、微軟）都無能為力。

以亞馬遜的Alexa為例，去年一名六歲的女孩在跟Echo內置人工智慧語音助手Alexa聊天時，意外訂下了價值170美元的玩具和一盒重達四磅的餅乾。雖然孩子的媽媽在收到一個不知打哪來的訂單確認電話后立刻進行了取消操作，但該訂單卻已經被處理，且一個跟孩子身高几乎相同的玩偶就在隔天送來了。最後，他們無奈地決定將這一玩偶捐贈給當地兒童醫院。

又如亞馬遜Alexa誤聽指令向孩子提供成人內容，即小孩向亞馬遜Alexa下達指令：「Alexa，請播放『Digger digger（一首兒童歌曲）』。」之後，亞馬遜個人助手通過演算法進行識別，竟然認為孩子想聽情色內容。稍後，孩子的父母才意識到發生了什麼事，可惜他們已經無法阻止Alexa繼續播放聲音。

上述說明自然語言（真正的AI能力）的「難題」離最終的解決依然存有差距。因為不同的應用（問答、情感分析、機器翻譯、部分語音標籤）需要有不同的模型架構：強監督式記憶神經網路、樹形長短記憶網路、雙向LSTM限制隨機域（CRF）、動態記憶網路等。即使在研究中出現一些非常有潛力的新想法，設計、工程合成、可擴展的對話系統與這些想法的結合依然處於非常複雜的狀態，離商用還很遙遠。所以，當被問及何時才能通過自然語言與數字助理交流，並得到滿意的答案時，就連吳恩達這樣的頂尖科學家也無法給出確切答案。即便是對最高水平的神經網路學家而言，這項技術仍然有很多謎團尚待解開。有很多工作只能通過不斷試錯來改進，沒有人敢保證某項技術調整可能產生什麼樣的後果。根據現有的技術和方法，這一過程大約要耗費數年時間。

正是在這些科技大佬的鼓動下，AI正有走向泛化的趨勢。據統計，到去年年底，在財富500強企業中，就有180家對外宣稱自己要啟動相關的人工智慧項目。甚至有廣告研究公司大膽預估，到了 2020 年，人工智慧技術可能會出現在幾乎所有的新科技產品的宣傳之中。另據Gartner 在研究了 1000 家宣稱自己使用了人工智慧的技術供應商后發現，大部分所謂的人工智慧技術，採用的依舊是基礎的、基於規則的機器學習和分析技術（例如上述的IBM的沃森和谷歌的DeepMind）。這些技術，早在人工智慧這個概念被熱炒之前，就已經出現並被業內所使用。更為關鍵的是，這些技術的能力遠遠未達到可以被稱得上「人工智慧」的程度。

恰逢國務院《新一代人工智慧發展規劃》頒布之際，在彰顯政府對於科技產業前瞻性和勢在必得決心的同時，也應該警惕當下產業界AI泛化的趨勢，尤其是在每逢大的利好的產業政策或者綱要出台，總是泥沙俱下的，切莫讓真正的AI淹沒在AI的泛化中。

‍

桃園 qq 地點貓咪桃園市 taoyuan xuan 根部尾巴有大桃園旅遊景點