search
尋找貓咪~QQ 地點 桃園市桃園區 Taoyuan , Taoyuan

智能音箱能改變一切嗎?究竟是「提升效率」還是「沒什麼卵用」

騰訊董事會主席兼首席執行官馬化騰在2017騰訊雲+未來峰會上強調,雲已經成為產業革新的源動力,而人工智慧正是雲交互的強載體。

在騰訊雲+峰會的分論壇上,我們仔細聽了兩個人的演講——數字家圓創始人兼CEO唐波和騰訊物聯雲語音雲總經理毛華:騰訊雲小微正式發布了,而數字家圓的第三代產品親見H2宣布已擁有騰訊雲小微的語音交互的能力,變成一個類似於亞馬遜Echo Show的家庭智能語音助手。

在最近的一些第三方報告中,僅僅是在市場,語音交互硬體設備從今年開始已經有多達幾十家的產品。

在新一波的創業浪潮之下,不同平台的優勢又是什麼?為什麼這麼多人創業做語音音箱,為什麼很多消費者還說「這根本沒什麼卵用」,目前語音交互有沒有矛盾?

我們和硬體方的數字家圓創始人兼CEO唐波以及技術平台方的騰訊物聯雲語音雲總經理毛華聊了聊語音交互的那些事兒。

語音交互下的技術壁壘,和現在的智能終端不同,它需要開放的合作

一個橫跨硬體和軟體技術的產品,就需要多方緊密合作。

這也是為什麼國外諸如Google、Apple、Amazon等巨頭在技術和硬體方面都採用inhouse的方案,這點在智能手機生態方面也極其明顯。不過唐波認為:語音交互時代的壁壘,和現在的智能終端已經不同,它需要開放的合作。

語音交互硬體的市場下,是不能閉門造車的。

有很多案例證明這一點。

幾個月前,小魚在家成為百度AI平台落地的第一個產品;京東叮咚也早就和科大訊飛合作;幾天前,就連我們熟悉的喜馬拉雅FM也從電台的角度切入了語音對話音箱產品。實際上,它們都是通過技術合作的方式。

數字家圓創始人兼CEO唐波

唐波則提到,「家庭入口級的這種智能終端,它跟手機最大的不同就是,它是一個非常開放平台。終端有終端的話語權,比如它的預裝,它有很強的話語權。應用市場有應用市場的話語權,APP也有它的話語權。手機的生態和今天我們新的這個生態完全不一樣。這個生態要求,合作更緊密,大家的能力互補性更強。」

唐波認為,基於AI的智能音箱產品的鏈條其實很長,任何一家創業公司要把它從頭做到尾,要做好的話需要很長時間,而現在整個市場正是快速發展的時候,所以更多的是大家優勢互補,強強合作。

硬體廠商的核心能力是把硬體做好,把用戶的核心需求做好,比如UI、分析用戶的行為習慣等等,唐波認為這是硬體廠商該做的事情。而AI的能力,其實不單單是演算法、還有平台以及大數據的問題。

騰訊雲小微的殺手級應用——微信QQ?

「幫我定個鬧鐘、播放周杰倫的音樂、今天有什麼大新聞?」

大部分的語音對話音箱、陪伴式機器人都能完成這樣的需求,這也算是對話音箱的基本需求。而對於騰訊雲小微語音助手,這些能力也全部集中在平台上——包括睡眠起床、鬧鐘、音樂、視頻、新聞、音樂、歷史上的今天,學英語等等能力。

不同的是在親見H2這款產品上,它擁有屏幕,可以實現視頻對話;甚至騰訊雲小微還可以解鎖騰訊的QQ、微信的好友關係,讓你可以在使用騰訊雲小微語音助手的硬體上(比如親見H2))視頻,發送語音消息等等,就像最新的Echo Show一樣。

這讓QQ和微信手次跳出了手機落地到用戶的家裡,或許真的可能成為這個語音助手的殺手級應用?

如果讓騰訊物聯雲語音雲總經理毛華總結,騰訊雲小微開發平台的護城河就是——騰訊的版權、內容以及連接。

毛華提到,AI很強大,但後方的內容仍然是重點——騰訊音樂、騰訊視頻擁有的眾多版權,構成了內容的護城河;而連接則是QQ、微信。他強調,騰訊一直是一家強調連接的公司。

騰訊物聯雲語音雲總經理毛華

連接,側面的理解就是開放,這也體現在騰訊雲小微的開放平台上。

毛華告訴PingWest品玩(),騰訊雲小微是由三個部分組成:

第一,小微硬體開放平台,硬體合作方只需要一個SDK即可接入硬體,非常簡單。毛華還拿出了一個蘋果耳機盒大小的硬體說,「這其實就是一個具備小微能力的硬體,它的成本只有20塊,連上音箱就擁有了全部的小微AI能力」;

第二,小微Skill開放平台,這裡提到的就是騰訊旗下的版權——音樂、視頻、有聲讀物、漫畫等。當然三方開發者也可以通過API自建Skill,比如提交一個品玩的Skill,它就可以實現「播放品玩的科技新聞」;

第三,智能解決服務方案的平台,這裡指的是B端那些智能回復機器人,它通過觀察人工客服的回復來學習如何和顧客大交道,最後實現完全替代。

騰訊雲小微助手和艾拉物聯的演示

唐波提到騰訊雲小微下放到親見H2技能有30多個,未來一年可能就會達到300個,3000個。他還提到,做成Echo的模式要做成四個基本要素,第一個是要構成強悍的硬體能力,麥克風陣列的設計;第二個就是AI的能力,能不能識別語音、語義的理解;第三個是內容和服務的資源,AI很強大但後邊沒有東西不行;第四個是產品最後能不能形成規模。

語音交互的矛盾——深耕需求以及廣泛的能力

我在用這種語音對話音箱產品的時候,其實自己總結出一個觀點——那就是語音交互在很多時候提升了效率;但一些時候,其實他還沒有我打開手機的效率更高。

這就需要談到一個核心需求的問題。

很多語音交互音箱意圖在形成用戶的核心習慣:

比如HomePod其實更多的是一個音箱,連接上Apple Music解決聽歌的核心需求還是有人會用的;亞馬遜Echo則一開始導流了購物,它根據你的帳號知道你要什麼;

對於的語音對話音箱製造廠商來說,它們都或許或少提到「養成用戶的行為習慣」這個話題,大體上是再說,先讓用戶習慣每天去問它「我要聽音樂」、「今天天氣怎麼樣?」這些確實可以提高效率的需求。

我在用語音交互音箱的時候,大體上也都是這些操作。

雖然語音交互用上了深度學習,在自然語言處理的過程中,能夠與人更自然的對話,更聰明的理解人的意圖。

但並不代表它就萬能了,你看,具體處理到「我要吃肉夾饃」這些問題的時候,就會衍生出一系列的複雜選項——從哪個平台定,是不是還要關聯帳號?從哪個飯店定;哪家飯店更便宜?

遇到這種問題的時候,其實語音交互的效率遠遠不如你打開手機、滑出「美團外賣」、三兩下就把飯訂好了。

唐波認為,語音交互就應該被重新審視,並不是在任何時候都需要用上語音交互——語音交互說到底是為了提升效率,要亦繁亦簡。其實這個問題親見這款產品上能看得出來。

數字家圓發布親見H1的時候,沒有語音交互的能力,其實它就是打造一個家庭場景下的核心視頻需求,比如外地的父母為了看姥姥姥爺帶孩子。

而在新品上的考慮,唐波所提到的簡,就是要將交互效率要提升到十倍以上——「比如傳統打開qq音樂,你需要打開藍牙、打開手機、播放音樂大概需要幾十秒;而使用語音的話,可能就兩秒。這是交互效率的提升,交互效率的提升之後,用戶就更願意用這個東西;繁,就是我們相信作為一個家庭互聯網的入口的話,後面的內容和服務是要豐富的,用於滿足家庭場景下的不同需求。」

毛華告訴PingWest品玩,並不是所有的需求適用在語音交互的領域。「你剛剛提到的訂外賣、購物其實就面臨了好多級的選擇,如果不做需求簡化就不合適做到語音交互里去。」

所以,「提升效率」和「沒什麼卵用」的區別就在這吧。



熱門推薦

本文由 yidianzixun 提供 原文連結

寵物協尋 相信 終究能找到回家的路
寫了7763篇文章,獲得2次喜歡
留言回覆
回覆
精彩推薦