search
尋找貓咪~QQ 地點 桃園市桃園區 Taoyuan , Taoyuan

深度解讀語音技能市場——平台廠商的下一個必爭之地丨語音智能特稿

當我們試圖解讀「語音技能市場」的時候,就如同 9 年前解讀的「應用程序市場」:蘋果 2008 年發布了針對 iPhone 的應用開發包,向開發者開放 App Store;同年,Google 發布了針對 Android 手機的應用市場 Android Market,後來改名為 Google Play,Google Play 是一個由 Google 為 Android 設備開發的在線應用程序商店。

如果非要有一個邏輯清晰的定義,我們這樣來描述「語音技能市場」這一概念:

語音技能是配合語音這一新型人機交互形式而使用的第三方應用。與觸控交互條件下,這些軟體應用集合在軟體操作系統下的應用程序商店,如 Google Play,Apple Store 等。語音技能市場即是在語音交互條件下的第三方應用的集合,目前主要有 Alexa Skills Kit,Action on Google 等主流 SDK 開發平台下的語音技能應用。

下圖是一個對 PC、手機以及語音交互下的硬體設備、操作系統、語音助手、典型應用、應用程序市場的一個概述表格(主要包含了 Google、亞馬遜、蘋果等在內的大公司):

2/ 語音技能市場的興起,先從亞馬遜 Echo 智能音箱說起

全球語音技能生態發展最成熟的一個市場,當屬亞馬遜的 Alexa Skills。

2015 年,搭載 Alexa 語音助手的 Echo 智能音箱上市。在美國這樣一個基本各家各戶都是「big house」的環境下,憑藉智能語音交互的新形式以及出色的遠場語音識別能力,Echo 獲得了市場不錯的反響,並且創下了亞馬遜自家硬體銷量成績的新高(此前是 Kindle)。

起初的 Alexa 並不被亞馬遜列為重點項目,雖然在 2014 年底才被公布,搭載 Alexa 的 Echo 項目早在 2010 年就開始啟動了。看似亞馬遜的「無心插柳」,背後的付出卻遠遠超出了我們的想象。Echo 全球的銷量在2017 年 1 月已超過 700 萬台,預計今年將突破 1100 萬台。

正因為 Echo 出人意料的成績,Alexa 在公司內部的戰略地位也得到了提高,團隊擴充到了上千號人,對產品體驗也有著極致要求,例如就為給 Alexa 反應時間降低 2 秒這件事情上,就花去了團隊先後近兩年的時間。基於大量的用戶基礎和資源實力,Alexa 的語音識別度也得到大大的提高。

進入 2017 年,亞馬遜對 Alexa 的重視程度越發的高漲,從對接各類智能家居產品(掃地機、智能門鎖、智能燈泡、智能恆溫器等)再到嵌入車載系統、開放 API 接入第三方硬體(手機、機器人、智能手錶等)。在今年,亞馬遜更是陸續推出 Echo LookEcho Show 等新形式硬體產品。

Echo Show 與 Echo

3/ 從 Alexa 到語音技能開放平台 Alexa Skills Kit

除了硬體的打造和接入,Alexa 還有一項浩大的工程,那就是建設語音技能生態€€€€Alexa Skills Kit(ASK)。Alexa Skills Kit (ASK) 是一個由自服務 API、工具、文件和實例代碼的集合,可輕鬆構建你自定義的 Alexa Skills,然後發布。就跟那些為 iPhone SDK 或 Mac 開發的應用程序相類似。但不同於手機、平板,這些 Alexa skills 所對應的服務都由語音交互來完成。

2015 年,Alexa Skills Kit 正式開放,起初的Alexa Skills 僅有播放音樂、設置鬧鐘、設置提醒、讀電子書、遙控智能燈等功能。到了 2015 年底,Alexa 的技能達到了 135 項。

2016 年 6 月,在亞馬遜發布 ASK 一周年之際,Alexa 技能數量突破 1000 大關。到了 2016 年底,這個數字漲了 5 倍。2017 年第一季度,Alexa 技能量首次打破了四位數的局面,突破 10000 並成為一個重要的里程碑。

▲ Alexa Skills 發展情況(2015~2017)

Alexa Skills 的不斷豐富增加了 Echo 智能音箱等硬體的使用範圍,除了日常的指令外,Alexa 目前已接入多家商鋪的服務,如汽車、星巴克、披薩店等,另外還有各種娛樂遊戲。現在,用戶登陸 Alexa 賬號進入技能應用網頁,就像當年逛 Apple Store 和 Google Play 應用商店一樣。

▲ Alexa Skills 應用商店

總體來說,Alexa 的技能大致分為兩類,一類是輔助、娛樂類功能,另一類則是商業化應用,而這也是開發者進行商業利潤轉化的一個重要戰地

另外,在鼓勵豐富內容生態的這件事上,亞馬遜也為 Alexa Skills 應用商店提供了類似 Amazon Underground 這樣的服務,為消費者提供免費 app,開發者則基於用戶使用該應用時長來獲得利潤反饋。

一位資深智能硬體從業者告訴深圳灣,「亞馬遜 Echo 和 Alexa 成功的關鍵,其實更在於較早的語音技能生態的布局。這個階段很像 Android 上線后,從 1 萬個技能發展到 10 萬個技能的階段。Alexa 正處在快速發展的階段,在語音識別、麥克風陣列、降噪、語義理解,均已經實現全站語音交互。目前,Alexa 已有 12000 項技能,並主要致力於做開發者生態。這是其他玩家現階段無法比擬的,或者需要很長一段時間才能追趕上。」

作為開啟語音技能生態的先行者,Alexa 已有大量的用戶基礎作為鋪墊,再加上 B 端、D 端(開發者端)的打通,搶佔語音技能應用市場的優勢已顯而易見。

4/ 在蘋果、微軟等巨頭組團圍剿亞馬遜,後勁最猛的要數 Google Assistant

4.1 最早推語音的蘋果慢了不止半拍

除了 Alexa 之外,蘋果 Siri、微軟 Cortana、Google Assistant 這些由科技巨頭打造的智能語音助理中,Siri 雖最早搭載在硬體上且相對封閉,目前尚未有任何打造語音技能生態的相關消息,而蘋果打造的語音智能音箱 HomePod 已在前不久的 WWDC 上亮相

深圳灣第一時間對 HomePod 做了深度解讀,這裡就不再贅述。我們揣測,本應最有競爭實力蘋果,其實是無心競爭亞馬遜。

▲ 蘋果在今年 6 月份的 WWDC 大會上公布搭載 Siri 的語音智能音箱 HomePod

4.2微軟則搭上了 Alexa 這條順風車

微軟方面,則在今年 5 月份 Build 2017 大會中公布了其與哈曼卡頓共同打造內嵌 Cortana 語音助手的 Invoke 智能音箱。另外,在去年 12 月份,微軟已將 Cortana 開放給家電、汽車、音箱等相關的第三方硬體廠商。

與此同時,在語音技能 Cortana skills 這項工程上,微軟則採取一個比較省事的辦法€€€€提供 Cortana Skills Kit(CSK)套件,讓開發者能夠將開發的 Alexa Skills 輕鬆的移植到 Cortana 上,並且這一技術能夠實現完全跨平台、跨設備操作

為鼓勵開發者,微軟在今年 3 月份向 Alexa skills 開發者發送的郵件聲明中表示:「從 Windows10、Android、iOS 和 Xbox 等平台中統計,目前 Cortana 的月活躍度達到了 1.45 億用戶」,旨在讓開發者樹立起對 Cortana 的信心。

4.3Google 應該是最上心的了

要在這幾個巨頭中找一個跟 Alexa 步伐離得最近,那就數 Google Assistant 了。在 2016 年的 Google I/O 大會上,由 Google Now 衍生而來的 Google Assistant 被搭載在 Google Home 智能音箱首次亮相。

雖相比亞馬遜同類產品 Echo 面世的時間晚了一年半的時間,Google Home 在進入消費者市場,連接各個智能家居廠商設備上的動作與 Echo 十分的相似。Google Home 搭載的 Google Assistant 也被安插在安卓手機、車載等硬體當中,且節奏把握的十分緊湊。

即便如此,Google Home 還是沒能比下 Echo,根據 eMaketer 最近的預測報告,亞馬遜已經佔領了美國智能音箱 70.6% 的市場份額,而 Google Home 僅佔下了 23.8%。不過比起那些需要瓜分剩餘 5.6% 的小廠商們來說,其處在的地位已相當可觀了。

作為後來者,Google 追趕的步伐則顯得更為緊迫。在一年後的 Google I/O 2017,Google Assistant 迎來眾多功能更新,包括在顯示端中加入文字、圖像溝通等新形式,新增日程創建和提醒功能,開發 iOS 版本 app 上線蘋果 App Store。

▲ Google Assistant 加入文字、圖像等新型溝通方式

同時,Google 還開放 Google Assistant SDK,供硬體廠商、開發者將語音助手部署到其旗下的硬體產品中,如家電、機器人、手錶等。這一舉措旨在對標亞馬遜的 AVS(Alexa Voice Service)。

在對標亞馬遜「Alexa Skills Kit」這件事上,Google 則加深了 Actions on Google 的應用範圍。對開發者獎賞更是撥了一大筆預算:Google 當時還在 Google I/O 2017 大會上面向全球開發者宣布了 Google Assistant 應用開發挑戰賽 (Actions on Google Developer Challenge) ,其中,一等獎可獲得2018年 Google I/O 大會門票、Google 總部參觀機會(包往返旅費)和 1萬美元獎金;二、三等獎也有 7500 美元和 5000 美元獎金加 Google Home 。

早在 2016 年 10 月,Google 就宣布了 Actions on Google 計劃,讓開發者能夠在 Google Assistant 上創建應用。不過在那時候,開發者只能基於 Google Home 進行應用的開發

在今年的 Google I/O 開發者大會上,Google 宣布,將 Actions on Google 的應用延展至 Android 和 iOS 平台。開發者可以通過 Actions on Google 開發自己的人機對話應用,並接入到 Google Assistant 中,並且可以被所有支持 Google Assistant 的設備使用( Google Allo、Google Home、Google Pixel 手機、Android 手機(6.0 以上)、Android Wear、Android Auto、Android TV 和 iOS,另外,通過 Google Assistant SDK 創客們還可以將 Google Assistant 功能帶到自己的自定義設備上,如樹莓派、自動售貨機等。

與亞馬遜 Alexa skills 操作方式大不相同的是,用戶在使用 Google Assistant 的 Actions 時,並不需要事先做特別的操作,僅需要發出「OK,Google,Speak/Talk to(Action 名稱)(to do sth)」這樣的指令即可。

而相比之下,Alexa 在 skills 調動的步驟則顯得更複雜些,用戶需要在手機應用端/網頁端或語音指令來激活這些應用。在用戶體驗這一點上,Google Actions 似乎顯得更有勝算。

巨頭之間的語音技能生態之戰,似乎就在亞馬遜和 Google 之間展開,而兩者也各有優勢,一個入局時間早且有相當的積累的,另一個則奮起直追並且有著先前 Google Play 的豐富經驗,雖在技能數上並未佔優勢,但後勁卻不容小覷。就目前而言,兩者還是難以相較高下。

5/ 國內語音技能市場發展情況:多是投資人支持下的初創企業在布局,BAT 暫無聲響

就國內情況而言,「語音識別技術發展的起步較晚,除了 BAT 之外,大部分語音技術公司專註於平台和產品的打造,產品化尚不夠成熟。從實驗階段的技術,到工程化、產品化,再到開放給第三方合作夥伴、廣大開發者,再到培育開發者和技能市場,Alexa 用了 5 年時間,國內即便是百度 Duer OS 也還有不小的差距。」曾經創辦了聚熵智能、現已轉型義語智能的李傳豐說道。

而對於小型的語音技術創業公司而言,並沒有像大公司那般有豐厚的資源以及經濟實力在語音技術產品化后同時做到將技術開放給第三方、消費大眾,而要像 Alexa 那樣達到上萬個語音技能應用,則意味著更長的時間。

以下是一些布局語音技能應用的國內語音技術公司及其發展概況:

5.1 硬體產品線布局豐富的出門問問

出門問問的創始人李志飛是 x-Googler,創業后也與 Google 合作緊密:曾獲得 Google Venture 投資,為 Android Wear 提供中文語音搜索服務等。

從成立到現在,出門問問一直沿著「AI + 硬體」這條道路展開產品開發和業務拓展,最近的發布會,出門問問推出了全球首個多場景全覆蓋的及時聯動能力的「問問」虛擬個人助理。

新品「問問」虛擬助理(VPA)已全線覆蓋在出門問問旗下硬體產品,包括問問手錶 Ticwatch 、問問耳機 Ticpods、智能車載產品 Ticmirror、Ticeye 以及在今年 4 月份發布與 Echo 同品類的智能家居產品問問音箱 Tichome。另外,問問音箱 Tichome 的海外版本也即將搭載 Google Assistant 操作平台。

在今年 4 月份的發布會中,出門問問宣布,其 AI 免費開放平台(ai.chumenwenwen.com)已向硬體廠商、開發者開放,旨在為更多硬體產品「賦能」

與 Alexa,Google 等走的路子相似,在給自家硬體、第三方硬體「賦能」之後,出門問問的語音技能商店也即將上線,開發者將可基於問問虛擬個人助理創建各種新技能:

5.2 義語智能 DeepBrain(前身為聚熵智能)

成立於 2012 年的聚熵智能是國內最早一批專註於自然語言處理(NLP)的公司。成立之初,聚熵智能推出了國內第一款中文語音助手€€€€智能 360,官方稱已有千萬級別的用戶。

在 2012 年下半年智能家居興起之際,聚熵智能決定組建硬體團隊,並最終在 2015 年 1 月推出「小智智能音箱」,甚至比 Echo 的推出時間還要早半年。

接著在 2015 年 11 月,聚熵智能繼續推出硬體產品€€€€小智管家機器人,同時發布「機器人界的 Android 系統」€€€€ S OS 以及內置私人助理應用、音樂應用和家庭物聯應用 SmartKit 開放平台。

根據聚熵智能的說法,對於初創型的語音技術公司而言,做硬體事實上是一件「耗錢且一定會持續虧損」的事情,認識到這一點之後,小智決定轉型為 Home AI 技術方案提供商。

聚熵智能的這一主要表現就在於推出的 DeepBrain,DeepBrain 是聚熵團隊成立的新公司€€€€義語智能旗下主打產品,致力於打造國內第一款機器人 SaaS 平台,對標亞馬遜 Alexa。

目前,DeepBrain 接入廠商移動端用戶超過 2000 萬,其他 AI 硬體用戶超過 20 萬,簽約合作廠商包括華為、聯想、三星、驊星玩具、君正、炬力電子、樂鑫等超過 100 家。

另外,目前 DeepBrain 的線上語音技能超過 1000 種,正處在快速增長階段,據聚熵智能官方預計,該平台的技能數將在年底將超過 3000。與國內其他公司相比較而言,DeepBrain 算得上是國內語音技能生態布局的最早且內容最豐富的一個平台。

5.3 Rokid

Rokid 成立於 2014 年,創始人為阿里背景,公司集結了一波強有力的人工智慧技術相關的博士、專家。

2015 年下半年,Rokid 正式推出其打造的第一款桌面機器人產品。

今年 5 月份,時隔兩年,Rokid 推出第二代產品 Rokid€€Pebble,具備更親民的價格,目的在於接近消費者。

與此同時,在其舉辦的一次線上「知乎 live」活動中,Rokid 公布了其已建立社區,並在 6 月份向開發者開放 Rokid 的軟、硬體平台這一消息。從該公司官網可看到,Rokid 已打開供開發者創建技能的入口:

Rokid 官方曾經表示,該開發項目也將開放給中小企業,與 Google Home、Echo 的布局策略相似。Rokid 目前已與不少物聯網和智能家居企業合作,在 to B 端的市場積極探索。

當 Rokid 的 AI 平台可以讓開發者實現快速開發,從而提供給 C 端用戶更加豐富的語音技能應用,Rokid 就能在 to B、to C、to D 三維一體中打造屬於 Rokid 的語音技能生態。

5.4 海知智能

成立於 2015 年的海知智能是行業內不多的專註於中文語義理解環節的創業公司。今年 3 月份,海知智能推出了其歷時 3 年打造的 ruyi.ai 平台,ruyi.ai 是一套自然語言理解和知識圖譜開放技術平台,可以為智能硬體、智能機器人和企業智能化提供機器人大腦服務。

搭載 ruyi.ai 個性化機器人大腦平台的有張小盒、墨馨、娃娃親親等為代表的智能機器人產品,以及在今年 3 月份亮相新華社新聞報道現場的機器人實體機器人見習記者 i 思(英文全名:Inspire)、過去曾為網紅的賢二機器僧。

目前,據相關人士透露,海知智能已正在布局類似語音技能開發的開放平台。

5.5 圖靈機器人

圖靈機器人是以語義技術為核心驅動力的人工智慧公司,致力於「讓機器理解世界」,產品服務包括機器人開放平台、機器人 OS 和場景方案。

2015 年 11 月,圖靈機器人正式發布一款人工智慧級機器人操作系統€€€€ Turning OS。Turning OS 是一款機器人專屬操作系統,能夠讓機器人具備和人類一樣的思維能力、情感能力和學習能力,並讓機器人採用擬人的方式與人類進行交流。其與傳統操作系統不同的是,Turning OS 提供多模態交互方式,運行思維強化引擎、情感計算引擎和自學習引擎。

在 2016 年 7 月的首屆圖靈機器人創新大會上,圖靈機器人 CEO 俞志晨發布了 Turing OS 的升級版本 Turing OS 1.5,增加了 11 項機器人視覺能力,在運動控制和硬體模塊實現增強。

據悉,Turning OS 已經有 50 多萬企業和開發者用戶。

附:國內語音技術公司發展情況一覽表

▲ 信息量較大,點擊查看高清大圖

5.6 必須要提的 BAT

國內大公司體系內,涉及智能語音技術的主要有 BAT,搜狗等互聯網高科技公司。而其中最有可能布局語音技能的就是百度、騰訊。

2015 年 9 月,李彥宏在百度世界大會中正式推出其旗下智能語音助手度秘,並宣布讓這個語音助手「無處不在」的願景。

在 2017 年 1 月 CES 大會期間,百度推出了人工智慧操作系統 DuerOS,並公布首款搭載該系統、由小魚兒科技打造的「小魚在家」。

目前,DuerOS 已經具備 7 大類目 70 多項能力,廣泛支持手機、電視、音箱、汽車、機器人等多種硬體設備,除了能實現語音控制、聊天功能,該系統還直接提供多種 O2O 服務等的智能化轉變。

騰訊則在今年 4 月份推出智能語音助手「騰訊叮噹」,服務於騰訊生態下的軟、硬體體系,包括旗下各大應用軟體,以及智能手錶、耳機、電視以及各類形態的機器人。

在這其中,騰訊則可以繼續發揮「連接、賦能」的作用和優勢,從整體上提升軟、硬體的智能化體驗。

而「騰訊叮噹」接入其中也是順理成章的事情,Actions on Google 的技術套路似乎更適合騰訊這樣應用豐富的大平台。

就目前情況而言,BAT、搜狗等互聯網大公司尚未有明確開放開發者平台的消息,而對於這些手上掌握大量資源且聚集大量人才的大平台公司而言,要做語音技能生態並不是難事。至於目前沒有任何聲響,或許是時機未成熟,也或許暗地裡已有計劃和布局。

6/ 思考:語音技能生態的喜與憂

儘管不少人認為,語音交互將成為下一代革命性的人機交互形式,語音交互的潛力會不斷被挖掘且成為一種趨勢,但目前這個市場仍還存在一些擔憂和問題。

據了解,亞馬遜 Alexa Skills 平台上雖然有上萬種技能,但存在同類功能的應用達到上百上千個的情況,甚至有部分技能處於「無人問津」的狀態。在用戶使用率並不高情況下,用戶留存率更是這些應用面臨的難題。

Alexa Skills 各個類型應用佔比圖

Skills 對於語音技能系統來說,就像 Android、iOS 系統里的軟體應用一樣,而豐富、實用/有趣的技能是吸引用戶使用該語音系統的重要因素。

在和幾位智能硬體老司機的交談中,我們獲得了一個很重要的觀點:語音技能平台發展起來的原因並不在平台本身,而在於有好用的 skill,而這跟目前的 app 平台相似。好的 skill 並不單單隻存在某個平台上。另一方面,平台的繁榮也依賴於設備端,就如當年的 iPhone 一樣。

其中一家較早布局語音技能開放平台的公司則表示,他們也曾在開放的路上走過不少彎路,而開放平台成功的關鍵也不在於做的是否足夠早,也不在於擁有多少開發者,而是如何將技術進行商業化落地。

總的來說,語音技能生態建設任重而道遠,可能遠比 Android、iOS 所經歷的坎坷多。(本文作者:Jes@深圳灣)

2017 年 7 月,深圳灣將揭開 WARE 2017 語音智能平台與應用峰會第二章的大幕。

本屆峰會,設有語音智能影響力、智能音箱探索者、語音智能設備與應用創新、語音智能解決方案四大論壇,從行業發展趨勢、市場格局、平台技術,應用場景、核心案例幾個方面,為語音智能行業從業者和探索者解讀!

大會「盲定票」已經限量開售,長按圖片掃碼,提前預定本次大會!關注深圳灣(公眾號 ID:shenzhenware),回復關鍵詞「WARE 2017 + …」把你希望了解語音智能相關的話題和團隊告訴我們。期待你的互動。



熱門推薦

本文由 yidianzixun 提供 原文連結

寵物協尋 相信 終究能找到回家的路
寫了7763篇文章,獲得2次喜歡
留言回覆
回覆
精彩推薦