search
尋找貓咪~QQ 地點 桃園市桃園區 Taoyuan , Taoyuan

智能音箱成了巨頭寵愛的玩具,但我們是不是都想錯了?

科技雲報道原創。

毫無疑問,智能音箱是今年全球人工智慧領域最熱的「風口」之一。2014年,亞馬遜在官網低調地上線了一款搭載智能助手Alexa的智能音箱—— Amazon Echo,沒有高調宣傳,甚至沒有發布會。

請點擊輸入圖片描述

亞馬遜沒有想到,一次嘗試性的產品和銷售舉動,引發了「蝴蝶效應」,不僅吸引Google、Apple等巨頭入局,如今Facebook也姍姍來遲,其智能音箱產品將於2018年第一季度量產上市。

更有甚者,這股熱潮又從大洋的西岸吹到了東岸。幾乎半年之內,智能音箱成為百度、阿里、京東、小米等一眾重量級科技公司寵愛的「大玩具」。

Echo的路徑讓人們意識到,智能音箱憑藉天然的語音交互優勢,已成為最貼近消費者生活的人工智慧「入口」。但關於這一輪發生在智能音箱身上的熱潮,或許人們都「想錯了」。

智能音箱大躍進 大洋兩岸冰火兩重天

亞馬遜在2014年推出Echo之時,並未引起更多關注。直到最近兩年的人工智慧高速發展,亞馬遜Echo成功拿到消費類AI的首張船票。2016年,Echo賣出了超過650萬台;2017年,其銷量有望超過千萬。繼亞馬遜之後,谷歌發布Google Home智能音箱,蘋果也發布了HomePod智能音箱。

請點擊輸入圖片描述

亞馬遜、谷歌、蘋果等全球科技公司對於智能音箱的態度,似乎讓國內科技公司找到了新的方向,國內的阿里、京東、小米、聯想、喜馬拉雅等也紛紛入局。

但根據海外市場研究公司Counterpoint Research的一份報告顯示,今年將會有200萬台智能音箱進入市場,但比起美國的1400萬台還是較遜色。

與國外一片火熱的景象相反,國內智能音箱市場卻始終不溫不火,科大訊飛年報顯示,國內銷量最高的京東叮咚音箱也不過10萬台。

請點擊輸入圖片描述

在很多人看來,在智能音箱可能是臆想出來的市場。許多剛剛進入中產階級的人,以前從來不用音箱,更不用說數字助理。

Echo的成功有其相應的文化土壤,歐美人大多有自己獨立的生活空間,而且本身對音樂音質有所追求。相比而言,國人的生存空間比較擁擠,私密性不夠,多數人對音質也沒有特別要求,況且國人並沒有使用音箱的生活習慣,這也是導致大洋兩岸對智能音箱態度迥異的根本原因。

Echo歪打正著? 偶然的成功難以複製

或許人們沒有想到,Echo在市場上成功的偶然性大於必然性。亞馬遜最初在將這款產品推向會員用戶時,目的是希望消費者可以通過語音方式嘗試在亞馬遜網站上購物。

但根據亞馬遜透露的數據,Echo上最受人們歡迎的功能並非購物,而是播放音樂和控制燈光,分別有34%和30%的用戶嘗試過這兩項功能。至於使用場景,超過50%的用戶表示會在廚房中使用Echo。

請點擊輸入圖片描述

這也成為國內大多數類似產品在設計時沿用的思路。阿里巴巴、京東等公司推出的智能音箱都強調了其背後內容生態的豐富和強勢。阿里巴巴推出的天貓精靈搭載「聲紋支付」購物功能,可以方便不同家庭成員通過天貓精靈進行語音購物——這和Echo推出市場時的路徑如出一轍。

請點擊輸入圖片描述

小米的「小愛同學」則打造了一個人工智慧生活助理和智能設備控制中心:提供新聞、天氣、鬧鐘、倒計時、備忘、提醒、翻譯等幾十種功能,同時還可控制電視、盒子、掃地機器人、電飯煲、空氣凈化器、電風扇、空調、智能燈等多種小米及米家設備。

請點擊輸入圖片描述

但功能越多其實就會越造成用戶的負擔,這不得不讓人重溫喬布斯對於產品設計Less is More的思路:為什麼我們認為簡單就是好,因為對於一個有形的產品來說,我們喜歡那種控制它們的感覺;深刻把握產品的精髓,從而判斷出哪些不重要的部件是可以拿掉的。

現在看來,至於誰能真正複製亞馬遜的成功,難以預料。

硬體與軟體兩手都要硬 智能音箱廠商九死一生

儘管國內廠商都在覬覦智能音箱這塊蛋糕,但與國外產品相比,國內的智能音箱廠商還面臨著很大的挑戰。

首先,是如何讓語音識別技術熟悉不同的語言、口音和方言,這一點在市場體現得尤為明顯。為了收集各地的方言數據,百度在今年推出了方言對話項目。公司向用戶承諾,如果他們為該項目做出貢獻,今後便可使用自己的方言與百度展開互動。短短兩周內,百度就錄製了超過1000小時的方言數據。

其次,語音識別技術如何在嘈雜的環境中識別語音指令。為此,微軟在Xbox上部署了一款名為Voice Studio的應用,專門收集人們在玩遊戲或看電影時的對話信息。為了吸引用戶貢獻自己在玩遊戲過程中的對話內容,該公司為參與其中的用戶提供了各種各樣的獎勵,包括點卡和遊戲道具。

最後,是自然語言理解。許多圍繞對話交互界面的突破都要追溯到自然語言處理的概念。我們不會有意識地以一種結構化的方式來理解語言,所以用於從大規模、非標籤的數據中進行推理的新數據方法看起來非常適用於自然語言理解。這些技術極大提升了計算語言的能力,並且不需要具體對語言的原理進行編碼。

儘管如此,自然語言的難題距離最終的解決依然存有差距。像問答、情感分析、機器翻譯、部分語音標籤等不同應用場景,需要有不同的模型架構:強監督式記憶神經網路、樹形長短記憶網路、雙向LSTM限制隨機域(CRF)、動態記憶網路等。即使在研究中出現一些非常有潛力的新想法,設計、工程合成、可擴展的對話系統與這些想法的結合依然處於非常複雜的狀態。

現在大家都認為,智能音箱是下一個流量入口,但其實智能音箱是一場真正的智能家居生態競爭。從硬體層面的麥克風陣列到軟體層面的語音識別和自然語言理解,一個個門檻都在考驗參與者的實力。當然只有技術是不夠的,技術必須要落地到場景中、反饋到用戶的需求上,因此生態的價值也同樣十分重要。這麼來看,智能音箱目前還只是大廠們玩得起的玩具。

【科技雲報道原創】

微信公眾賬號:科技雲報道



熱門推薦

本文由 yidianzixun 提供 原文連結

寵物協尋 相信 終究能找到回家的路
寫了7763篇文章,獲得2次喜歡
留言回覆
回覆
精彩推薦