search
尋找貓咪~QQ 地點 桃園市桃園區 Taoyuan , Taoyuan

獨家體驗3款未上市智能音箱:越來越有女人味了!

智東西()

文 | 寓揚

智能音箱產業系列報道導讀最近數月,智能行業第一媒體智東西已深入智能音箱產業鏈,圍繞智能語音交互入口之爭和智能音箱之熱,連發數篇深度報道,該系列還將覆蓋業內數十家關鍵公司、核心操盤手和熱點話題,本文為系列報道之一。

鐺鐺鐺~ 智能音箱體驗大PK第2季來了!!

在上月初,智東西推出了智能音箱體驗大PK的第一季,使用了京東&科大訊飛家的叮咚音箱A1、阿里家的天貓精靈X1、Rokid家的若琪以及國外「老大哥」亞馬遜Echo和谷歌Home,採用中外音箱「混戰」的模式,讓國內外的早期智能音箱「登台打擂」,同時也讓我們感嘆一下人類「智商」的偉大!

(從左依次為叮咚音箱A1、亞馬遜Echo、谷歌Home、天貓精靈X1)

僅過去1個月,國內又有一波新品智能音箱落地,分別為雷軍家的小米AI音箱、京東&科大訊飛家的叮咚2代,以及AI創企出門問問家的問問音箱。

目前小米AI音箱剛開始公測,發售日期尚無,叮咚2代作為叮咚音箱的最新產品也還沒有上市,問問音箱也在眾籌中。不好意思,現在這三款你都買不到!

是不是非常想體驗最新一代的產品究竟如何?沒問題!智東西本次智能音箱體驗大PK就用這三款國內最新音箱,帶你深度體驗!順便「劇透」一句,它們的「智商」正在不斷提升。

一、各家音箱「登台亮相」

下面隆重介紹一下本期智能音箱體驗大PK的三位「選手」,分別為小米家的「小米AI音箱」、京東&科大訊飛家的「叮咚2代」、出門問問家的「Tichome問問音箱」。

(從左依次為小米AI音箱、叮咚2代、問問音箱)

小米AI音箱是小米的首款智能音箱產品,於7月26日發布,並於8月22日正式開啟公測,以299元的超低價格殺入市場,正式上市日期尚未確定。該音箱採用聲智科技的6麥環形陣列,採用Nuance、思必馳等十家語音識別公司的技術,小米大腦、海知智能、三角獸等語義技能和獵戶星空的語音合成技術,算是一個集百家之長的「語音小怪獸」。

(小米AI音箱)

叮咚2代是靈隆科技推出的第二代智能音箱產品,靈隆科技背後站著電商巨頭京東和語音巨頭科大訊飛。叮咚2代價格大約為799元(未上市),體積比叮咚A1小了不少,該款音箱仍然採用8麥環形陣列,並在頂部搭配一塊LED屏,支持聲紋識別和自定義喚醒詞。

(叮咚2代)

問問音箱是出門問問推出的首款智能音箱,於8月24日發布,價格為999元,剛推出不久,產品也還在眾籌中。問問音箱採用科勝訊的2麥克風陣列和聯發科MT2601晶元。由於問問音箱還尚未量產,為了讓大家一睹為快,本次智東西使用的是出門問問的工程機進行測試的,因此在穩定性上可能會存在一定問題,在此說明。

(問問音箱)

為了讓他們更好的PK,我們從開箱感受、配網時間、遠場喚醒率、雜訊喚醒率、音質、端到端響應時間、語義理解、多輪交互、內容豐富性等方面進行實際體驗,看看各家產品性能如何。

本次測試結果均來自特定環境,因此測試結果可能受網路環境等因素的制約,並且該結果不具有決定性的對比意義,僅供我們更深度的體驗產品。

二、開箱感受

小米AI音箱咋一看就是一個縮小版的空氣凈化器Mini,採用塑料外殼,機身設計為立方形,並採用白色的配色,延續了小米產品的簡潔時尚。在「三圍」方面,三款音箱中小米音箱「身高」適中為21.16厘米,比問問音箱(24厘米)略低一點,但「體重」和叮咚2代大約相當,小米音箱為636克,叮咚2代為695克。

小米音箱的「昵稱」為「小愛同學」,當你喚醒它時,它會甜甜的回應你一句「哎」!小愛同學就像一個鄰家女孩,甜美的聲音真是萬千宅男的福利。

叮咚2代和谷歌Home的外觀有一點相似,機身呈圓柱形,配以織網材質,頂部也是一個斜切面,並搭配了一塊LED屏幕,配合聲音進行個性化內容展示。輕輕點擊它的LED屏就能夠喚醒,手掌遮住屏幕就可以讓它「休眠」,滑動屏幕外圍一圈可以調節音量等,提升了交互體驗。

而在聲音方面,已經經過兩年多積澱的叮咚音箱具備多種「發音人」可以選擇,如「親切隨和的女聲」、「甜美的童聲」、「渾厚的男聲」等。

相比另外兩款音箱,問問音箱就顯得身軀龐大了,直徑為11厘米,「身高」為24厘米,體積也更加重,可能源於硬體配置上的不同。問問外觀為橢圓形,採用羊毛混紡材料,手感細膩。頂部採用類似亞馬遜Echo的音量旋鈕配合阻尼滑動,並搭配36顆LED燈珠。

聲音方面,問問音箱採用的更加類似於標準型的女聲,所謂標準就類似於「歡迎收看新聞聯播」這種。

三、一場略感吃驚的實測體驗

話說7月底我們剛剛進行了一場5大智能音箱的實測體驗,並對它們的「智商」深表擔心。這次實測,我已經做好了「虐音箱虐到心累」的預期,結果讓我大吃一驚,儘管只是過去了一個月,這一代音箱在「智商」和體驗上已有明顯提升。如果說上一代智能音箱算是1.0產品,那麼這一代音箱就是2.0產品。

1、配網時間:大幅提升

聯網是用戶進行智能音箱操作的第一步,聯網時間的長短直接影響用戶體驗。本次測試的配網時間包括「開始聯網–輸入WiFi密碼—連接網路並成功」這樣一個過程。

其中小米音箱採用藍牙配網的模式,通過手機藍牙,幫助音箱連接網路,整個過程耗時20.58秒。而問問音箱採用WiFi配網的模式,通過手機自動連接音箱的臨時熱點,進而幫助音箱聯網,整個配網時間28.59秒,在WiFi配網中已是比較快的。

最後要說一說叮咚2代的配網了!相比叮咚A1的聲波配網,叮咚2代則採用了藍牙配網,相比叮咚A1將近1分鐘的漫長配網「歲月」,叮咚2代竟然整個過程13.52秒!三款音箱中配網最快,令人感到眼前一亮。

總體來說,三款音箱的配網時間較上一代的配網時間有大幅提升,一方面相比天貓精靈和叮咚A1的聲波配網,這一代產品更傾向藍牙配網,此外在軟硬體的配合上也有一定的優化。

2、喚醒率:叮咚2代亮了

喚醒是人機語音交互的第一步,即通過喚醒詞(昵稱)將設備喚醒進入工作狀態,這一步直接影響用戶後面的感受。本次喚醒率測試分為安靜環境、噪音環境和超強噪音環境3個環節,分別在2米、4米、6米的距離進行喚醒率測試。

(1)安靜環境下

(圖為安靜環境下5次測試未喚醒次數統計)

在安靜環境下,我們分別在2米、4米、6米的位置,使用同一個聲音大小(相對)對3款智能音箱分別測試5次。各家音箱在安靜環境下表現都十分不錯,僅只有小米音箱和問問音箱在6米距離存在一次未喚醒。

(2)噪音環境下

(圖為噪音環境下5次測試喚醒次數統計)

在噪音環境下,我們將手機音量調整至30%,放置在音箱後面作為背景雜訊,分別在2米、4米、6米的位置,使用同一個聲音分別測試5次。

(3)強噪音環境下

(圖為強噪音環境下5次測試喚醒次數統計)

可是僅僅是這樣,我還不過癮!各家智能音箱的喚醒極限在哪裡呢?為了「虐」他們一把,我又添加了更強的噪音測試,將手機音量調整至50%,作為背景雜訊放在音箱後面,採用上面方式進行測試。(註:這個雜訊相當於十分嘈雜的環境,而非模擬家居環境,僅做極限測試使用)

果不其然,在如此高強度的噪音下,小米音箱只在2米的距離喚醒了3次,其他均「全軍覆沒」。問問音箱也是如此,僅在2米處喚醒了2次,就開啟的「睡大覺」模式。

然而,令我十分吃驚的是叮咚2代的戰鬥力。如此嘈雜的環境下,2米處全部喚醒,4米全部喚醒,僅在6米處有一次未喚醒。不禁感慨,叮咚2代真是下足了功夫,將喚醒打磨到如此穩定。

3、誤喚醒:整體相對穩定

喚醒和誤喚醒是緊密相連的,喚醒的靈敏度提升,也很有可能伴隨誤喚醒的增多。叮咚2代有如此強的喚醒能力,於是我開始懷疑它的誤喚醒率會不會很高呢?

為此,我們將三款智能音箱放在辦公室環境下一天,接觸聲源為辦公室的日常交談聲和大家對三台音箱的調侃聲。發現在一天中僅有小米AI音箱在別人和其他音箱的對話中被誤喚醒了一次,其他音箱均無誤喚醒。

需要說明的是,辦公室場景下的誤喚醒不能代表家庭環境下的情況,因為家庭環境中可能存在電視聲、手機聲、對話聲等更多元的聲音背景,相應的誤喚醒也可能會略有增加。

4、音質:各有側重

好聽的聲音,固然能夠獲得一定用戶的喜愛,比如小愛同學鄰家女孩般的甜美聲。但作為一款音箱,音質同樣也是最基本最重要的功能。

三款音箱在音質表現上無法要求太高,也就是傳統PC多媒體音箱的水平,但也各有特點。我們選取了《渡口》和《偏偏喜歡你》進行高低音的測試。

其中,小米音箱聲音爆發力強,相同音量級別(比如50%)聽起來的聲響是最大的,低音渾厚高音嘹亮,但由於機身較輕,音量開大會有感覺機身震動明顯,不夠「穩」。叮咚2代個頭最小,音效中規中矩,高音、低音都不張揚。

問問音箱按說是發音單元配備最全的,但同樣50%的音量對比同一首歌音量偏小,但調大之後,聲音的縱深感較強,聲場也比較開闊。畢竟價格999元,整體來說還是一分錢一分貨。

5、端到端響應時間:叮咚的屏成了矛盾點

身為一個語音助手,能不能迅速的回答主人的問題是用戶體驗的一個關鍵。在特定的網路環境下,我們對三款智能音箱的就天氣類、百科類、服務類問題進行提問,測試各個音箱的端到端相應時間(這個時間為發出指令結束到智能音箱回答之間的用時)。

在這三類問題中,智能音箱對天氣類的問題相應時間明顯快於百科類和服務類的問題。三款音箱中,小米音箱和問問音箱速度又快於叮咚2代。

具體而言,小米音箱在天氣類的問題中平均用時2.29秒,百科類問題(馬雲是誰?)則平均花了2.63秒,由於目前小米音箱服務類(點外賣)還接入較少,因此服務類應答2.46秒不具有參考價值。

問問音箱在天氣類和百科類用時相差無幾,分別為2.40秒、2.43秒,而在服務類耗時2.73秒。其中,問問在百科搜索方面更具有優勢。

叮咚2代在響應時間上則略慢其他兩家。原因可能在於LED屏幕的使用,目前叮咚2代採用語音和畫面進行配合的多維交互,這種組合的交互能夠調動用戶的視覺聽覺,體驗上會更好一點。但是或許也正是聲音和畫面之間的配合降低了叮咚2代的響應時間。

6、語義理解:問問音箱更勝一籌

所謂的語義理解,就是智能音箱能不能理解主人的意圖,這是一款智能音箱的必備素養。我們選取了天氣類和服務類的問題,每個問題採用多種問法,看智能音箱能不能理解用戶的意圖。

天氣是最基本的問答內容,圍繞「今天天氣怎麼樣」,我們問三款智能音箱「今天氣溫多少度」、「今天有雨嗎」、「今天空氣質量怎麼樣」、「今天熱嗎」等。

在這個基本問題上,三款音箱都能夠識別用戶的意圖「問天氣」,但是小米音箱和問問音箱可以根據不同的問法優化答案,在體驗上更好。而叮咚2代會經常採用同一個答案回答不同的問法,在用戶體驗上還有待優化。

放心,我不會就這麼輕易的就放過它們的!在服務類的問題中,我們圍繞「美食推薦」進行發問,如「我餓了」、「我想吃飯」、「我的肚子咕咕叫」、「附近有什麼好吃的」。

其中,小米音箱目前還不支持外賣、美食推薦服務,會回答你「餓了就吃嘛」、「快去吃飯吧」等。叮咚2代本身是具有美食推薦的,但是它並不夠「友好」,當你問「我餓了」,它會告訴你「我可以幫你查詢附近的美食」,或者就說「餓了就去吃呀」,只有當你讓它推薦附近的美食,它才會告訴你附近有什麼吃的。

而問問音箱在語義理解上表現的較好。無論是你問「我餓了」,還是「我想吃飯」,它都會為你推薦大眾點評附近的美食。

7、多輪交互:問問音箱表現不俗

多輪交互是指智能音箱能夠在理解上下文的背景下和用戶展開多輪次對話。目前通用語下的多輪交互體驗很差,而基於特定任務的多輪交互則是智能音箱競爭的一個關鍵點。

還記得上一季的音箱在多輪交互中表現的一塌糊塗,充分肯定了人類「智商」的偉大。這一次音箱體驗,我本沒有太多期待,但最終對智能音箱的發展速度略感驚訝。

本次多輪交互採取天氣、音樂、百科等幾個用戶使用頻繁的場景。在第一局天氣測試中,我們會對三款音箱連續發問「北京天氣如何」、「那明天呢」、「那上海呢」,在這方面小米音箱和問問音箱都能夠準確的識別天氣中的上下文,理解我的意圖進行回答。

而叮咚音箱則略顯尷尬,普通模式下它並不能夠理解上下文,當你問「那明天呢」、「那上海呢」,它就答非所問。但是當你開啟它的「AIUI」模式時,才能夠「逼著」它理解上下文,準確回答這些信息。

在第二局音樂播放中,我們採取以下任務:「我想聽陳奕迅的《紅玫瑰》」、「換一首他的歌」、「再換一首」,看智能音箱能不能理解我的意圖,準確開展多輪對話。

其中小米音箱可以準確識別「他」,並完成任務;而叮咚2代中間出現一次錯誤,經過一番調教,也算是識別了「他」;問問音箱則在此局出現一點「狀況」,它把識別「他」當成了播放「他」。考慮到問問音箱是工程機,要麼是不太穩定,要麼就是問問還需要對音樂中的語義理解和多輪對話進行優化。

而在第三輪,我準備了最難的八卦百科問答,「李小璐是誰」、「她老公是誰」、「他女兒叫什麼」。小米音箱在這個環節就跟不上節奏了,在第二個問題上就無法應答。叮咚2代也是如此,但這其中發生了一個有趣的小插曲。

還記得上次我們用劉強東來調侃叮咚A1嗎?當我們問它「劉強東是誰」后,再問它「他老婆是誰」,叮咚A1就無法理解了,只能直接問它「劉強東的老婆是誰」,它才回答正確。而這次叮咚2代則很「酷」,直接表示它不關注這類問題。

相反問問音箱的多輪對話則表現不錯。它可以準確回復「她的丈夫是賈乃亮」,而在「他的女兒叫什麼」這個問題上,它回答的是「我猜你要問的是賈乃亮的女兒,她叫賈雲馨」。可見問問音箱在語義理解和多輪對話方面確實表現不俗。

但是,我們也採取了一些其他問法進行複製驗證,發現用「他的孩子叫什麼」時則回答錯誤,可見問問音箱在多輪對話上也不太成熟,仍需繼續打磨。

8、聲紋識別:略顯雞肋

目前小米音箱還不具有聲紋功能,叮咚2代和問問音箱具有聲紋功能。

但由於問問音箱還在沒有正式量產,目前使用的APP版本還沒有聲紋功能,可見聲紋識別方面還不夠成熟,出門問問還在打磨中。

而叮咚2代雖然使用了聲紋功能,但目前還沒有什麼使用場景。設定聲紋后,對它說「你好」,它也可以跟你打招呼「你好XX」。除此之外,目前還沒有看到其他應用。

智能音箱作為一款家庭產品,必然需要聲紋識別,從而提供個性化服務,以及增強安全性。但從目前的發展來看,聲紋識別還需要一定時間的打磨。

9、內容資源:跟進迅速

這三款智能音箱的功能大體相同,主要為播放音樂等有聲讀物、設定鬧鐘提醒、百科問答,以及家居控制等。

目前,叮咚2代的技能已經接近100個,問問音箱和小米音箱也具有40多個技能。相比叮咚音箱已經發展了2年多,問問音箱和小米音箱的內容跟進也比較快。

我們主要測試了三款音箱曲庫的豐富程度,有代表的選擇了10首音樂進行測試,分別為:陳奕迅《浮誇》、趙雷《南方姑娘》、五月天《突然好想你》、劉德華《忘情水》、李宗盛《少年往事》、 Coldplay《something just like this》、Maroon5《maps》、Michael Jackson《heal the world》、 Fools Garden《Lemon Tree》、Muse《Unintended》。

通過測試發現,三款音箱都具有以上中文歌曲,而由於對英文的識別差異或是英文曲庫不同,內容上存在一定的差異。其中小米音箱擁有其中9首音樂,叮咚2代擁有8首音樂,問問音箱擁有7首音樂。

考慮到問問音箱同時接入了QQ音樂和騰訊雲小微,音樂資源應該較為豐富。可能問問音箱在英文識別和合成方面還存在一定的問題,有待進一步打磨。

此外,像新聞播報、查限行、星座運勢、計算器等技能各家音箱也都具備。總體來說,各家音箱跟進很快,在大類別的技能上都已經具備,但具體豐富程度還需要不斷積累。

10、新穎技能

相比上一代智能音箱,本次PK的三款音箱還有一些差異化的亮點功能,值得單獨拿出來介紹一下。

叮咚2代提供了一些比較獨特的功能,目前可以自定義喚醒詞,比如你可以把它的喚醒設定為你男朋友或者女朋友的名字,這樣就可以「百呼百應」了。此外,它還可以直接通過音箱打電話。

小米音箱的內容主要採取和第三方合作的模式,其中一個好玩的功能就是「問聲音」,比如「大象怎麼叫」,小愛同學就會發出大象的聲音。另外小米還推出「AI訓練計劃」,用戶可以自己創建訓練技能,如果這個技能被小米採用,所有的小米音箱用戶都將使用你訓練的技能,果然是會培養冬粉的公司。

問問音箱中的功能則更加實用,其已經和高德地圖、大眾點評、滴滴等合作,它知道你的位置,可以為你叫外賣,也可以給你打車。

四、智能音箱體驗的8點結論

通過實測,首先我最想表達的就是,在「前人開路」的基礎上,無論是產品,還是整個產業鏈都已經基本成熟,后入局的音箱玩家可以通過合作的方式快速跟進,小米音箱就是一個眾玩家合作的代表。

第二,小米AI音箱整體表現不俗,從喚醒、遠場識別、語義理解、內容資源表現都已超過前代產品。儘管沒有太多令人驚艷的地方,但加上它甜美的聲音,299元的超低價格,相對不錯的體驗,未來競爭力仍會很大。

第三,叮咚2代從產品層面來講真的算是驚艷,LED屏的搭配,強力的遠場喚醒能力、自定義喚醒詞、音箱打電話等都是上一代產品的突破,再加上較早布局擁有的豐富內容資源,都值得肯定。

但是通過對比上一代的叮咚A1,叮咚2代在語義理解和多輪對話方面並沒有太多進展。從三款產品的對比中,叮咚2代在語義理解和多輪對話上已經有落後另外兩家產品的趨勢了。

第四,剛剛推出的問問音箱,儘管測試機還存在一定的不穩定性,但是在語義理解和多輪對話上目前是三家中較好的。但作為一款新推出的音箱,還需要在喚醒、音樂、英文識別等各個場景下進行更深度的打磨。

第五,相比上一代國內產品在語義理解和多輪對話的糟糕表現,這一代的智能音箱在基於特定任務的多輪對話上進展明顯。

第六,儘管通用語的多輪對話、語音交互還很難實現,但是在具體場景、具體任務下的多輪對話是可以做到用戶的容忍度以內的。這還需要相關的玩家深耕自然語言理解和知識圖譜領域,對技術落地進行進一步打磨。

第七,儘管聲紋識別不像語義理解那樣難以突破,但是從目前的產品來看,聲紋技術還需要進一步打磨,另外圍繞聲紋的應用也需要進一步探索。

第八,接下來智能音箱產品仍會層出不窮,但每家產品的「技能」還處於稀缺狀態,對優質「技能」和「技能商店」的需求成為亟待解決的問題,需要更多玩家參與到應用服務內容的深耕。

結語:快速成熟的智能音箱行業

上一季智能音箱產品實測完后,我對智能音箱的體驗結果略感失望,併發出「道阻且長」的感嘆。

但本次體驗完國內最新一代三款智能音箱后,不得不說國內音箱在趕超、跟進的速度上值得稱讚,僅僅幾個月這一代產品在產品體驗、語義理解、多輪對話等方面均有提升。

而這種提升的背後,是智能音箱產業鏈的成熟,產業鏈中各個領域的玩家發力不同的方向,所形成的一種聚合效應。相信隨著小米AI音箱299價格的強勢入場,以及眾多其他家音箱產品的湧入,用戶和市場會快速培養,最終推動整個行業的成熟。

(預告:單單體驗還不夠,智東西將繼續拆解音箱,一起深扒音箱背後的「世界」)



熱門推薦

本文由 yidianzixun 提供 原文連結

寵物協尋 相信 終究能找到回家的路
寫了7763篇文章,獲得2次喜歡
留言回覆
回覆
精彩推薦