search
尋找貓咪~QQ 地點 桃園市桃園區 Taoyuan , Taoyuan

語音版淘寶天貓面世,阿里巴巴推出天貓精靈X1音箱與AliGenie語音助手

一夜之間遍地AI(人工智慧),這可能是2017年科技新聞給人的既視感。緣何Google突然間AI技術遍及所有業務?百度又何以開始自稱是AI公司?人工智慧是如何佔領新聞版面的已經不可考,但人工智慧作為一個簡單的技術名詞,從幕後走向台前,已經是不爭的事實。

神經網路、卷計演算法、機器學習、深度學習,這些詞已經隨人工智慧一起進入消費者的視野,但主打這些技術的硬體產品,卻大部分還停留在PPT里,停留在傳聞階段。今天,其中的一個傳聞成真:阿里巴巴的人工智慧語音硬體產品天貓精靈X1正式面世,成為BAT里第一家發布AI語音硬體產品的公司。天貓精靈X1僅售499元,8月開賣。相比類似形態的Echo和Google Home,X1的價格可稱親民。

同時,阿里自家的人工智慧電子助手、內置於天貓精靈X1的AliGenie也一起上線。但有意思的是,阿里巴巴這場發布會上,全程未提到「人工智慧」或「AI」這兩個詞,他們對AliGenie的稱呼是「人機交流系統」。

BAT第一家,AI硬體后發先至

相比騰訊「AI即服務」戰略與「絕藝」圍棋AI,百度的duerOS、度秘和無人駕駛(沒錯,就是昨天被北京交警調查罰款的那種),阿里的AliGenie來的有些遲。並非阿里不注重AI和硬體,正相反,機器人、AI、雲計算一直是阿里巴巴的重點業務。早在2015年,阿里巴巴就投資了軟銀旗下的機器人公司SBRH,後者就是人形機器人Pepper的製造商;針對天貓淘寶買家賣家的多種服務里,AI技術已經於2015年開始應用;同時作為國內最大的雲計算服務提供商,阿里雲今年年初已經推出FPGA雲服務,而FPGA是目前用於AI的主流計算解決方案。

阿里巴巴投資的Pepper

比起百度和騰訊乃至科大訊飛和出門問問,阿里的AI服務一直保持低調,其阿里巴巴人工智慧實驗室也是近期才正式亮相,但硬體發布卻搶了個先,成為第一款BAT旗下的智能音箱。這次發布的天貓精靈X1直接歸入了天貓品牌下,與天貓魔盒命名類似。身材上,它比亞馬遜的初代Echo和蘋果的HomePod更小,不過造型類似,圓柱形設計,按鍵和拾音的陣列式麥克風(支持全向5m拾音)在頂部,底部則是發聲單元。

天貓精靈X1內部使用了一顆定製的聯發科MT8516晶元,四核Cortex-A35架構,還有一顆獨立的NEON處理單元,據稱能帶來更快的語音識別速度和音頻處理效果。Cortex-A35是ARM高能耗比方向設計的核心,比A53有更高的效率和更低的功耗,適合智能語音音箱這類全天開機的智能硬體產品。內置德儀的功放晶元,使用DC供電,12V/1A。支持2.4G Wi-Fi和藍牙4.0連接。

阿里巴巴人工智慧實驗室負責人淺雪(花名)在介紹這款產品時,提到了設計時的一個難點:如何在音效與喚醒靈敏度之間做到平衡。也就是說,如何在大音量播放音樂時,保證試音麥克風陣列能保持對人聲的高識別率。最終阿里工程師靠氣密性設計做到了這一點,據悉目前天貓精靈X1在75分貝的臨界值時仍能輕鬆喚醒AliGenie人機交流系統。現場演示里,較大音量的音樂播放時,天貓精靈X1仍然快速準確地識別到了「暫停」的命令,表現相當不錯。這也意味著頻繁打斷併發出新的指令並不是問題,這多少能提高一點語音輸入的效率。

相比Alexa,AliGenie僅僅更懂中文?

一款功能完整的AI語音智能音箱定價499元,縱觀此類產品市場,可以說這個價格是比較良心的。但低售價必定有低成本的原因,或許相比蘋果HomePod定位家庭音頻設備,天貓精靈X1更接近智能語音助手而非客廳音箱。具體的音質表現,還有待後續實際測試。毫無疑問,比起Echo、Google Home和國內的叮咚、喜馬拉雅小雅AI音響,天貓精靈X1具備更高的性價比。比起AI巨頭亞馬遜和Google的產品,天貓精靈X1定價低於前兩者同級別產品;而和國內產品相比,阿里系產品顯然擁有更好的生態和內容資源。

同樣首次亮相的AliGenie是阿里巴巴的人機交流系統,比起硬體載體天貓精靈X1,它其實更應該受到關注。在發布會上,淺雪將它的能力總結為三點:理解力、執行力和進化力。

所謂理解力,即AliGenie的語音識別和自然語義理解能力。一個AI語音助手,應該是一個擬人化的對話對象,而不是過去那種識別單條語音命令的語音識別工具。執行力則是一種智能分析選擇的能力,AliGenie具備上下文分析和場景化識別功能,舉例來說,當你在夏天下班回家時喊一聲「天貓精靈,我回來了」,它會打開與天貓精靈X1相連的空調、風扇、電視;接著喊一句「風再大點」,它會調節空調或電風扇的速度而非廚房裡排氣扇的速度。而進化力,則是人工智慧通用的一項特性,通過大數據的調教和機器學習,人工智慧對於場景的判斷、選擇將會越來越準確。

從發布會上公布的特性來說,除了對漢語的語音識別支持,天貓精靈X1與AliGenie並沒有表現出太多比Echo更令人眼前一亮的能力。但筆者認為,「更懂中文」並不是一項值得嘲諷的事情(當年的百度正是憑著這句口號,從谷歌手裡吃下了搜索引擎的大部分份額。),這反而是目前天貓精靈X1在市場最大的優勢。要知道優秀的本地化體驗,很多時候比技術本身是否領先要更重要。目前Google Assistant和亞馬遜Alexa對漢語語音識別都沒有提供足夠的支持,之前這塊市場是國內百度、搜狗、科大訊飛和出門問問的天下,Google的Android Wear版正是使用了出門問問的語音識別方案。

而阿里巴巴的天貓精靈X1,是目前互聯網巨頭中唯一的AI智能音箱產品。它背後是阿裏海量的資源版權庫,是龐大的阿里智能物聯平台,是幾乎覆蓋整個大陸互聯網用戶的淘寶天貓購物生態,這都是天貓精靈X1和AliGenie的巨大優勢。這種生態圈的資源優勢相對於國內其他AI語音硬體產品,可以說是碾壓級別的。再加上499元的定價,目前天貓精靈X1似乎沒有夠格的對手。或許,即將來臨的騰訊智能音箱「耳朵」會成為它短時間內最大的競爭者。

聲紋支付是亮點,暫時領先業界

除了漢語語音識別,AliGenie的聲紋識別其實也有必要一提,目前Alexa和Google Assistant的聲紋功能都還在開發調試中,所以阿里成熟的聲紋識別系統已經小小領先。何謂聲紋識別?類似於指紋,每個人的聲音也具備各自的獨特之處,聲紋就是可以區別每個人聲音的東西,因此也可以作為人物識別的依據。Windows、Android系統有多帳號功能,可以在一台PC上開多個帳號,以適應不同人的不同使用習慣。智能音箱的不同聲紋的用戶可以認為是多個帳號,而且這些帳號的切換是即時的,不必登入登出。

簡單舉例,在家庭中多人共用天貓精靈X1,老年人喊一句「播放我上次聽的曲子」,放的可能是京劇;年輕人同樣喊一句,則可能播放的是之前自己聽的流行歌曲。通過聲紋識別,多個用戶可以方便的共用一台天貓精靈X1。阿里還將聲紋技術用於語音購物驗證,用戶可以向AliGenie發送命令,說明想購買的商品,確定購買后,支付時需要驗證聲紋,一般是跟著AliGenie說一句話。有了這一層可靠的驗證技術,語音購物不但可行,安全性也增強了很多。

聲紋以外的其他方面,AliGenie面對已擁有15000項技能的Alexa並不佔優勢。至於對智能家居的控制、日程管理、內容獲取和播放等功能,市面上的產品基本都帶有,也是大同小異。同時,國內智能家居產品的標準還是分化明顯,阿里巴巴的阿里智能物聯平台,京東的京東微聯,小米的米家各有一套協議。天貓精靈X1目前只能連接阿里智能平台的產品,不過目前許多主流品牌的家電和智能家居都已接入該平台,可用性還是很高的。

目前阿里智能平台的智能家居產品

AliGenie不是我想要的溫柔女聲

如果問對天貓精靈X1和AliGenie哪點最不滿意,筆者一定會回答:AliGenie並不是我想要的溫柔女聲。現場演示環節有這麼一段,淺雪讓天貓精靈X1講了個笑話,笑話的內容並無不妥,但那種勻速朗讀、毫無語氣語調起伏的「女聲」所表現出來的「機器感」十足,似乎在時刻提醒你,這是一台機器,而不是一個有真實血肉的自然人。

當然,這不是AliGenie和天貓精靈X1獨有的問題,事實上可能所有AI語音服務的開發者都正在努力讓AI的聲音更像真人,但目前還沒能實現。因此,即使你可以更加自由地向智能音箱和語音助手們表達你的問題和情感,直接向它們輸入自然語言而非特定的語音指令。但現階段,它們回應還會略顯生硬。

另外一個痛點在於,不管是天貓精靈、Alexa、Google Assistant還是Cortana,你都無法省略前面那一句「天貓精靈」、「OK,Google」或「Hey,Siri」,目前暫時沒有比喚醒語句更智能的喚醒方法。而在你喚醒后,如果突然切入與他人對話,此時智能語音助理是否還能準確地分辨你對話的對象?這也是智能語音助手需要解決的問題。相信隨著AI技術的發展,我們終能看到一個交流起來與真人無異的虛擬數字助手,相信科技發展的每一步,都是朝未來踏的一小步。(完)



熱門推薦

本文由 yidianzixun 提供 原文連結

寵物協尋 相信 終究能找到回家的路
寫了7763篇文章,獲得2次喜歡
留言回覆
回覆
精彩推薦