search
尋找貓咪~QQ 地點 桃園市桃園區 Taoyuan , Taoyuan

【智能音箱的理想國】靈伴科技:專註語音的我們為什麼不做智能音箱?| 創業

智能音箱作為語音智能當下的主流前沿,包括 BAT 在內的互聯網公司都在這一市場一決雌雄。而專註語音識別的 靈伴科技 作為技術型公司劍走偏鋒,聚焦 B 端市場,獨創的 AIssS(人工智慧及服務)理念,將人工智慧轉化為勞動力。

不急於嘗鮮智能音箱領域

前幾天,朋友圈熱傳了一篇名為《創業公司做智能音箱為什麼九死一生》的文章,其中闡述的觀點正中靈伴科技 CEO 陳博的下懷,他認為創業公司若要落地智能音箱產品,基本等同於「冒死」、「躺槍」和「做炮灰」。

兩年前,陳博說過,脫離了噱頭和概念才是未來太多的產品,如今看來,在人工智慧初期階段,這種浮躁現象並未得到改善。「BAT 為了布局,是可以長期燒錢的,而一些公司為了躋身智能音箱領域,拿別家的技術東拼西湊,安上自己的殼子,用戶體驗不理想。」

從人機交互的技術角度來看,語音識別、語音合成和語音理解三要素缺一不可,「用戶對智能音箱的需求不只是用來播放音樂,他可能會問天氣怎麼樣,幫我查一個地址或訂單」。那麼,智能音箱語音交互的第一步驟就是識別聲音源,需要麥克風陣列的支持,「亞馬遜 Echo 的用戶體驗好,主要是在麥克風陣列的突破。」

陳雄提到,國內成熟的麥克風陣列產品和提供解決方案的公司並不多,有些公司正處於技術攻關階段。特別是傳統技術的很有限,要保證識別準確率,這就意味著不能「吃老本」,必須在核心技術上進行創新。

一直以來,語言理解是語音交互始終繞不過去的話題。陳博解釋說,深度學習會讓機器變得越來越聰明,將大量的語料數據導入后,會針對這些數據進行學習和訓練,但為什麼語言理解仍然不理想,是因為文本數據在不同的場景變化太大,很難靠語料收集達到一個很好的結果,這其中包含大量的語言省略、指代和縮寫的問題,「譬如我說昨天太好玩了,機器肯定不知道我所指代的事情。」

而創業公司的一大硬傷是缺乏資源,「譬如音樂的版權,播放無版權的音樂會不會被對方告。」陳博表示,亞馬遜、Google、蘋果做智能音箱,是因為它們有自己的生態圈,智能音箱只是其中的一個環節,恰恰智能音箱又是人機交互的一個入口,所以會有更多的互聯網公司湧入這個賽道,「可能前兩款產品很弱,第三款產品就完善了,這是一個長期的布局,如果創業公司也這麼玩,可能能在第一款產品就死掉了」。

陳博定義的靈伴科技專註技術而不做產品,他把靈伴看作自媒體,自媒體以內容為王就可以生存下去,因此,「創業公司一定是 To B 的玩法,不是 To C 做音箱這種消費產品,在某一領域創造你的產品價值,深耕這一領域,就必然會帶來現金流。」

靈伴科技 CEO-陳博

摸著石頭過河

2014 年 2 月,陳博帶領團隊在中關村創建了專註語音交互的靈伴科技,其中不乏清華北大的博士,核心研發團隊先後在 2012 年和 2013 年 SIGNAN 中文信息處理國際評測,簡體中文句法分析兩項任務均獲得第一名;「Blizzard Challenge」國際語音合成大賽的第一名。正是對比賽的感悟才促成他們創業的落實,「我們最初參加比賽僅僅是證明自己的技術,後來認為做研發最終還是要服務於產業,如果研發項目不能落地成為產品、成為服務,那你的研發沒有任何意義」。

創業和研發無法相提並論,研發上鑽研演算法即可,而對創業來講,主要依靠產品的綜合能力、市場和渠道的能力。

陳博坦言,靈伴團隊過去走過不少彎路。2016 年年初曾面向 C 端做了一款 App——眾搖。具體說來,用戶在觀看電視廣告時,通過啟動眾搖 App,搖晃手機,系統會自動識別廣告聲音,並向用戶手機再推送一個相關廣告,最後給用戶一個現金紅包作為回報。團隊希望通過大小屏的互動增加商業價值,以此為基礎實現盈利。

「眾搖」可以實現 3 秒內的場景互動,陳博回憶說:「技術團隊當初花了很大精力來做優化,眾搖 App 推廣的 3 個月後,搖動次數的最高峰值是一天 300 萬次,我們平台的支撐做得都很好「。

但團隊的頂層設計過於理想化。

其一,團隊沒有認識到電視在家庭場景中被日益淡化,傳統有線電視節目正在被互聯網電視盒子取代,用戶更偏好於收看點播節目,而非電視直播,造成用戶規模先天不足。

其二,靈伴從廣告商支付的資金拿出一部分,作為紅包來刺激用戶使用,短期內可以支撐,長期來看,創業公司沒有那麼多錢可以揮霍。

其三,創企項目 PK 不過一個生態,搖一搖只是其中一環,最重要的是靠線下商家來做支撐,這需要吸納大量的人力來發力運營,創業公司必須大量融資,向美團、大眾點評一樣去做地推,還要不斷的燒錢,搶佔市場。

最終,短暫上線 5 個月的眾搖 App 被靈伴團隊親自關停,這次的大膽試錯,堅定了靈伴最初的規劃方向。

上線智能社會服務雲平台,正確率達95%

結合自身優勢和企業定位,靈伴科技推出了國內首家「睿思 AlaaS」智能社會服務雲平台,陳博習慣稱之為「呼叫中心」。其通過智能融合「語音交互技術」和「雲呼叫平台」打造的「虛擬勞動集市」,「雇傭」虛擬坐席機器人為客戶提供在線語音交互服務。這套方案已經成功應用於保險公司、銀行、電商平台證券公司等場景。

舉例來說,用戶購買了保險后,虛擬機器人會選擇時間對其進行電話回訪,向用戶確認身份,詢問是否投保,條款是否知曉等等。陳博向記者介紹,保險行業整體的業務量主要集中在第一季度,二三季度是淡季,淡旺季業務量的波峰波谷相差幾十倍,「不可能因為業務量激增進行大規模招聘,到了淡季再進行裁員」,基於這一行業特徵,靈伴順利的與多家合作方簽約,通過上線這項服務,話務員的工作壓力得到明顯削減。

陳博談到,目前智能客服以文本客服為主,但並沒有體現出產品價值,文本客服雖然取代傳統的 FAQ(Frequently Asked Questions)頁面,並且有很大的體量,但文本客服其實是被「激活」出來的,「譬如用戶想要投訴,文本客服就無法解決這一問題,最後還是會打人工客服,所以我們上線呼叫中心,就是切實解決用戶的問題」,這也是產品價值所在。

至於潛在的競爭對手,陳博並不過多擔憂,「呼叫中心」是服務於 B 端的項目,目前 BAT 還沒有涉足該領域」。他同時表示:「這是一個需要深耕的領域,每個行業的呼叫中心都要具備不同的專業知識,而這些專業知識就是這個行業的壁壘,所以我們深耕這一領域,就能實現產品價值。」

近一兩年來,深度學習技術獲得突破以後,行業整體的技術門檻下降,但距離成熟技術相比還有很漫長的路要走。陳博表示,「睿思 AlaaS」目前的正確率達到 90%,針對特定場景進行再優化可以實現 95%的精準度,這一數字已經處於人機交互的行業前列。

靈伴科技目前已和保險、銀行、運營商等展開深度合作,短期主要以出售服務的方式為主,預計公司將在年底實現收支平衡,明年實現盈利。今年下半年,靈伴科技將發布其自主研發的麥克風陣列,產品線定位在 B 端市場,針對不同的產品規格,提供適用於智能機器人、智能音箱等產品的麥克風陣列解決方案。未來,靈伴還將在智能醫療、汽車伴駕、智能硬體等方向展開布局。

歷時 3 年時間,靈伴已成長為技術成熟型公司,近 60 人的團隊,技術崗佔比 80%。眼下,靈伴科技將側重於市場、產品方向,並進行相關崗位的人才招募,是公司的業務拓展和。

資金方面,陳博透露,靈伴將於下半年啟動 B 輪融資,融資金額不會低於 A 輪。2014 年,靈伴獲得了千萬級別的天使投資,2015 年 A 輪融資近億元,具體數字對方暫未透露。

題圖來自 123RF



熱門推薦

本文由 yidianzixun 提供 原文連結

寵物協尋 相信 終究能找到回家的路
寫了7763篇文章,獲得2次喜歡
留言回覆
回覆
精彩推薦