search
百度AI的開放生態剛起步

百度AI的開放生態剛起步

2016谷歌開發者大會盛況。

從千夫所指到創新模範,百度只用了一年的時間,而秘訣就是大談AI。不過,以此為始,百度也走上了一條只許成功不許失敗的「不歸路」。

本月初的百度AI開發者大會,並沒有太多能讓人「wow」一聲的東西。但是,它至少鄭而重之地給百度貼上了一個新標籤——「人工智慧公司」。

而且,從百度在開發者大會上重點介紹的Apollo和DuerOS開放平台的動作來看,它顯然想做人工智慧時代的領軍者,而工具就是「AI開放生態戰略」。用百度總裁陸奇的話說,百度的未來將建立在與開發者共贏的基礎上。開發者的成功,就是百度的成功,這是百度AI平台的核心價值觀。

開放什麼?喚醒萬物的DuerOS

如今,一個以安卓為操作系統主體的移動互聯網世界已經形成。而百度度秘事業部總經理景鯤的話擲地有聲:DuerOS要做AI時代的安卓。

「最好的搭建生態的方式就是開源。並且確實只有像百度這樣的大公司才玩得起。」對百度的戰略選擇,賽迪顧問電子信息產業研究中心高級諮詢師向陽這樣評價。

DuerOS是一款對話式人工智慧系統。在7月5日的「百度AI開發者大會」現場,百度的工程師展示了「讓音箱學會漢語需要幾步」。他用17行代碼、1分鐘時間,讓搭載了Alexa系統的Anker音箱,從地地道道的外國貨變成聽得懂且說得好話的本地娃。

順便說一句,Alexa也被媒體冠以過「AI時代的安卓」封號。

DuerOS的核心理念是「喚醒萬物」,讓設備和人之間能用自然語言溝通,讓設備聽得懂用戶說話,懂用戶需求。是的,這個設備可以是任何東西。而喚醒萬物的核心要素,就是「聽清、聽懂、滿足」。

在對話式人工智慧分論壇上,百度演示了一段「花式折磨」智能音箱的橋段:我要聽首安靜抒情的歌!哎呀,不喜歡這首,換一首!算了,來首周杰倫的歌吧!不,再換一首!呀,這首歌叫什麼名字?……

百度語音識別率達到97%以上,它的Deep Speech是2016年MIT十大突破性技術之一。「只做好這些還不夠,人工智慧時代要與場景結合,放在家庭小房間里,放在車上,讓技術真正放在場景里解決問題。所以我們研發了遠場相關的語音技術包括麥克風陣列、回聲消除、波束成形、語音喚醒、遠場識別。」景鯤說。

百度更大的優勢,在於數據。

百度度秘事業部首席技術官朱凱華介紹,百度擁有中文世界最大的知識圖譜,而且每天通過用戶的搜索和使用,這個知識圖譜還在呼吸和生長——吸收新知識,吐出過氣知識。加上自然語言處理、多輪對話技術、深度學習的實踐和搜索技術這些能力,DuerOS可以聽懂用戶的「freestyle」。如果你需要一家合心意的餐廳,可以盡情地在提問前加上一串定語:有沒有環境優雅的適合情侶約會的在上地附近的人均消費兩百元左右的餐廳?

怎麼開放?全方位服務開發者

既然是做AI時代的安卓,就得開放。既然是「開發者」大會,開發者怎麼玩自然是重頭戲。

開發者怎麼開發技能?這就需要講到DuerOS的重要的技能框架。技能框架定義了第三方開發者如何為DuerOS開發技能。「DuerOS對話服務支持多種終端能力。不管合作夥伴提供什麼樣的硬體,通過DuerOS的對話服務,我們都可以為你提供最貼近硬體、最能發揮你硬體所長的智能服務。」朱凱華說。

同時,小度技能工具箱還可以提供工具,對開發者的應用開發提供幫助。它支持標準化介面,第三方開發者一行代碼都不需要編寫,就能創造標準化技能。如果百度提供的標準模板不能滿足開發者的胃口,那麼,百度還可以為其提供類似自然語言理解能力和對話管理能力這樣的智能技能接入。「開發者不需要懂深度學習,不需要懂語音識別,就能讓設備具有自如的語音溝通能力。」朱凱華表示。

DuerOS也是個智能設備開放平台。景鯤認為,AI時代,軟硬結合是趨勢。DuerOS提供最容易上手的軟硬體一體化解決方案,它包括了多樣化的開發套件和完全開放的參考設計。開發套件包括個人版、輕量版和標準版等。

「就像Windows有軟體生態一樣,DuerOS有技能生態。這個平台有比較好的開放性,也具備比較強的技術服務能力。」AI公司三角獸技術負責人陳華榮說,「我們公司和DuerOS合作,可以充分釋放我們在AI方面的潛力,而因為DuerOS在各行各業都被應用,接入這一平台,我們所有的服務和解決方案,都可以馬上獲得更多場景和更多用戶。」

目前,需要開發者的百度,還是要抱住開發者的大腿。在開發者大會上,他們請來了海信,請來了中信國安,請來了喜馬拉雅,用合作方的口碑力證自家平台的能力。不過,也正如同一些分析人士所指出的,一旦生態建成,地位或將顛倒。

建立帝國?群雄逐鹿才剛開始

「從嚴格意義上講,DuerOS不能算是人工智慧時代的操作系統。」北京郵電大學人機交互與認知工程實驗室主任劉偉告訴科技日報記者,「坦白說,別說國內,就是國外的谷歌、IBM的操作系統,也遠沒有成熟。」在劉偉看來,把DuerOS叫成「操作系統」,是一種商業炒作。向陽也認為,DuerOS其實更像一個嵌入式軟體包。

語音交互是目前比較流行的人機交互模式,隨著深度學習的「加持」,語音識別發展到了一個新的階段。相比其他交互方式,語音交互在技術上確實相對成熟。「語音時代的到來,是比較自然的事情。」劉偉說。所以,也無怪乎國內外的科技公司,都瞄準了語音。他同時也指出,語音交互目前的難點,是語義和語用問題,這些問題並沒有完全解決。

在「語音」領域,目前也是群雄逐鹿。能叫的出名字的,就有科大訊飛、思必馳、雲之聲等等。「在技術上,百度並不明顯具有優勢。其實,這幾家技術差別都不大。」向陽分析,生態能否建成,恐怕關鍵還要看商業策略和推廣力度。「還有一個重要的影響因素就是晶元。」今年3月底,百度聯合數家公司發布了DuerOS智慧晶元,圍繞成本、性能和易用性等方面打造一站式智能語音交互解決方案。在底層上的發力,可以為整個生態環境的構建打好地基。

向陽認為,DuerOS的開放,有望推動更多智能硬體產品的發布。畢竟,百度是個大公司,技術上領先,在平台上的投入也不菲,在平台的背後,還有龐大的運維團隊支撐。「如果百度服務好,能夠提供的功能模塊多,作為一個中小企業,它當然會選擇百度。」

車聯網公司博泰創始人應宜倫說得鐵板釘釘:移動互聯網和人工智慧,根本就是兩個時代。「雖然比賽剛剛開始,輸贏已經決定。我認為百度DuerOS相對其他,是個降維打擊。」

其實,所謂的「降維」打擊能不能成,關鍵要看開發者和合作者買不買賬。正如景鯤所強調,希望DuerOS作為百度核心人工智慧開放平台之一,真正開放賦能,推動時代的變革。「賦能我們的合作夥伴,賦能內容商,賦能晶元商、賦能整個生態。」

熱門推薦

本文由 一點資訊 提供 原文連結

一點資訊
寫了5860316篇文章,獲得23306次喜歡
留言回覆
回覆
精彩推薦