search
尋找貓咪~QQ 地點 桃園市桃園區 Taoyuan , Taoyuan

哲學家的論斷,巫師的法力,由智能語音來實現

哲學家的論斷,巫師的法力,由智能語音來實現

2017-08-30 招商觀察

哲學家福柯說過:話語即權力

我們人類是相信語言的力量的。很多人小時候都被教導:陌生人叫你不要應聲哦,那是精怪要攝你的魂——一叫、一應,魂就沒了。佛家的六字真言包涵諸佛無盡的加持和慈悲,念誦便是修行。從頭戴羽冠的神廟祭司對著檞寄生喃喃低語,到哈利波特對伏地魔喊出「除你武器!」,無論是對命運、禍福、生死,抑或是對物件的控制,全都可以由語言來實現。難道你不曾在寒冷的冬夜裡幻想用一句「關燈」熄滅卧室的燈光,而不是需要把手伸出暖烘烘的被窩?

智能語音的出現,為人類用語言驅動世界創造了機會,真正擴大了人類的「話語權」——它就這樣把科技和巫術奇詭地模糊了起來。

前天七夕,你是怎麼度過的?

相較於以往的「略過」,不少人又解鎖出新的「過法」,比如:

不過,當你還抱著手機調戲Siri或被Siri調戲時,科技互聯網圈已經憑藉獨特的智能語音產品及技術的商業化應用,將智能語音這一細分的領域開闢成一片新「紅海」。

未來顯學——智能語音

為什麼聲學、語音產業會沿襲移動互聯網的道路,成為科技發展的重頭戲?

先看一下歷史。縱觀整個 「晶元-PC-互聯網」 的發展過程,大部分的商業模式都是圍繞著兩件事情發生的:

第一件: PC成為大眾所熟悉、所能夠使用的工具。做這件事情的公司叫微軟。微軟通過降低電腦的使用難度,把電腦變成了人手一台、並且每個人都長時間大規模使用的工具。

第二件:鍵盤成為 PC與生俱來的、相匹配的硬體輸入設備。鍵盤輸入是電腦天生帶來的輸入法。因為有了電腦,人們才會去使用鍵盤。

第一部計算機的構建基於電子管這一基礎元件;以穿孔卡片作為輸入(或輸出)設備,操作繁瑣,不夠簡便;鍵盤的出現在操作方面得到很大的提高。

後來所有基於互聯網技術所產生的商業模式,都是圍繞著鍵盤所產生的大量信息誕生的,包括如何組織、使用、消費這些信息,以及如何提高信息使用的效率——代表公司有 Google、Facebook 以及 Yahoo等。

於是,我們做一個有趣的映射:什麼工具會像 PC 一樣,成為最重要、並且最廣泛使用的個人生產工具呢?答案是智能手機。

圖:智能手機

那麼,作為PC之後最重要、最廣泛使用的個人生產工具——智能手機,它相對應的硬體輸入法是什麼?什麼是智能手機與生俱來所匹配的輸入法?

肯定不是鍵盤。事實上,智能手機是一個非常典型的對鍵盤不友好的設備。發展到今天,智能手機上都已經沒有實體的鍵盤了。

智能手機所匹配的新的輸入設備、或者稱之為新的信息生產方式,只可能是三種:麥克風、攝像頭與 GPS。

舉個例子,為什麼打車軟體能夠在智能手機時代如此流行?可以回想一下,在沒有打車軟體的時候,人們是怎麼溝通打車這件事情的。

乘客打個電話,說自己在某某大廈、過 15 分鐘之後下樓、穿一件黑色的衣服,然後問司機大概多久能來接,目的是哪裡,諸如此類。司機會在電話里回答說,我現在在哪一條路上,距離多遠,大概多久到,開了什麼車。

打車軟體誕生在移動互聯網上,GPS 成為了信息的輸入方式。於是乘客和司機之間不再需要那一通電話來溝通,而是打開打車 app,利用 GPS 就可以清楚相關信息。

圖:uber界面。可以發現四周有多少車輛,在幾分鐘之內能接到乘客。

其他例子不用再贅述。可以看見,在智能手機這個終端上,天然地能夠提高信息生成效率、成就有效表達的,不再是鍵盤,而是語音、攝像頭,以及其他感測器。

那麼同樣的,可以預測,在往後 10 年或者 15 年,在智能終端這個領域中,最大的商業模式一定會圍繞著如何去有效地分析、組織和使用語音、圖像以及其他感測器所產生出來的數據和信息而產生。

可以這樣認為,語音技術以及和語音技術相關的應用、圖像技術以及相關應用,在今天變得格外重要。圍繞著語音、圖像以及其他感測器所產生的數據,以及這些數據的生產、分析、組織和消費,在以後很長的時間裡,註定會成為智能終端領域中最重要的發展方向,下一代人機交互底層智能語音操作系統,是巨頭直接對壘的舞台。

巨頭對壘

在國外,亞馬遜谷歌蘋果微軟都已經投入巨大的人力來推動這個時代的變革。來自eMarketer的數據顯示,在今年一季度美國語音助手市場中,Amazon Echo的市場份額達到70.6%,Google Home則佔到23.8%,而其他廠商(包括蘋果、聯想、LG等)分食剩下的市場份額,為5.6%。自2014年發售以來,亞馬遜Echo音箱及另外兩種語音產品累計銷售量接近1000萬-1100萬台,銷售額達到8億-10億美元。市場研究機構Strategy Analytics預計,到2022年,北美1/3的家庭會配備智能音箱。

在,京東2015年聯合科大訊飛研發推出叮咚音箱小米2016年聯合科大訊飛推出小米音箱,接著,阿里巴巴天貓精靈X1來了,背後則是智能語音操作系統AliGenie對壘百度 DuerOS的更大野心。

圖:智能音箱

天貓精靈X1,面向家庭用戶,定價只有499元。在多數業內人看來,一台硬體設備並不是最終目的,阿里的想法在於支撐天貓精靈的中文人機交流系統AliGenie。

據阿里巴巴人工智慧實驗室介紹,AliGenie目前涵蓋包括音樂音頻、家居控制、購物充值、兒童教育、技能市場的功能。可以或正在拓展的行業解決方案包括兒童領域、酒店領域、家庭場景、toB其他商業場景、線下零售場景與其他顯示設備結合的場景。

這看起來與App或者操作系統所謂的開放平台並無太大區別,蘋果iOS和安卓皆成名於此,微信甚至也想用小程序打造輕模式的開放生態。區別的重點依舊是語音,這是阿里能夠掌握的「核心科技」。依靠阿里雲的機器學習技術和計算能力,AliGenie能夠不斷進化成長,越用越聰明,成為人類貼心的智能助手。

語言是人與人之間最主要的溝通方式,也應該是人與另外一種智能進行交流的主要方式。雲端一體化帶來的趨勢是高度智能化,智能終端需要一個比手機觸屏更強大的人機交互方式。

據悉,考慮到中文語義環境的複雜性,阿里人工智慧實驗室通過眾包平台等方式,針對生活中的各種生活場景所需要用到的語義問法進行了徵集,僅天氣預報就能夠理解786種中文問法。通過深度機器學習,天貓精靈X1已覆蓋20個領域的中文自然語義理解,能夠理解人類80%的意圖。

百度DuerOS不遑多讓。讓一個只會說英文的音箱學會說話需要多久?答案是1分鐘。在百度AI開發者大會上,百度工程師僅用17行代碼,1分鐘時間,就讓搭載了Alexa系統的Anker音箱,從只會講英文變成聽得懂且說得好話。百度的語音識別率達到97%以上,百度的Deep Speech是2016年MIT十大突破性技術之一。

合縱連橫

只要是操作系統,就不是一個人在戰鬥。阿里人工智慧實驗室借著發布天貓精靈公布了首個硬體開放合作夥伴——將與國際玩具巨頭美泰合作,探索其旗下主要核心IP,如費雪芭比托馬斯和朋友等智能玩具的合作開發機會。

目前AliGenie支持100多個品牌,包括接入阿里智能聯盟塗鴉科技broadlink等智能家居方案的產品,更多智能家電也正在接入中。

百度DuerOS則與中信國安廣視聯想美的海爾HTC小魚在家等合作夥伴展開廣泛合作。百度稱,依託三款DuerOS開發套件和一款硬體參考設計,「只要接一個電源,接一個麥克風,就可以讓你身邊的家電設備『說話』了。」

圖:百度DuerOS

面對巨頭遞出的橄欖枝,各中小企業做出了兩手準備。喜馬拉雅是百度DuerOS的合作夥伴,該公司副總裁、硬體事業部總經理李海波認為,喜馬拉雅擁有非常優質的互聯網音頻內容資源,極大地豐富了DuerOS的內容體系。同時,音頻內容與智能語音技術有著天然的相似點,雙方都希望通過聲音的形式與人進行互動。

就在不久前,喜馬拉雅聯合獵戶天空(獵豹移動投資的語音人工智慧公司)推出了智能音箱小雅

TCL多媒體科技控股有限公司也是DuerOS的合作夥伴,該公司副總裁李昕認為,DuerOS在人工智慧領域的優勢與TCL在電視領域的積累相結合,一定會打造出與眾不同的電視產品

7月3日,TCL公告稱,旗下互聯網品牌雷鳥與騰訊簽訂股權合作合同,騰訊以4.5億元投資互聯網電視雷鳥,獲得16.67%的股權,成為雷鳥第二大股東。

分析人士指出,互聯網企業和硬體企業的關係已經不能單純用「站隊」來描述,作為產業鏈的上下游,互聯網企業逐漸成為底層平台方,提供多種介面,而硬體企業依賴製造和供應鏈優勢,可以在多個平台做出選擇,甚至可以不同型號不同選擇。

人和設備自由溝通是科技進步的重要標誌,如同Windows圖形界面取代DOS命令系統,蘋果觸屏交互取代滑鼠鍵盤輸入,終有一天,萬物互聯,萬物有聲。

彙編自:虎嗅網、深藍DeeperBlue、北京商報

【相關閱讀】

(1)「不要走,決戰到天明」——AI+智能手機

(2)AI:拔掉電源也攔不住我進擊的腳步

(3AI紅得發紫,風投卻不買賬,這演的是哪齣戲?

(4)狂拽酷炫,AI企業數量僅次於美國!

(5)物聯網:六十四路煙塵漸起,你往哪逃?

(6)萬物有[靈],萬物互聯 [ 物聯網:下一個招商風口]

編者按:本文由「招商觀察」官方出品。任何媒體及公眾號若要轉載本文,請提前告知本號,獲得授權后請清晰標註出處為「微信號:招商觀察」。



熱門推薦

本文由 yidianzixun 提供 原文連結

寵物協尋 相信 終究能找到回家的路
寫了7763篇文章,獲得2次喜歡
留言回覆
回覆
精彩推薦