search
AI·商學院 | 成立幾個月就讓科大訊飛加班半年,更不怕BAT和谷歌、亞馬遜,這家企業憑什麼?

AI·商學院 | 成立幾個月就讓科大訊飛加班半年,更不怕BAT和谷歌、亞馬遜,這家企業憑什麼?

尋找AI企業獨角獸系列報道之一

2011年,AI初創企業只有70家。2015年,就已經超過了400家,增長近6倍。到了2016年,AI企業709家,全球每10.9個小時誕生一家人工智慧企業。

接下來,將迎來人工智慧和企業成長最好的時代。如同李開復所說,像20年前的互聯網,10年前的移動互聯網一樣,未來幾年,出現最多的獨角獸公司,肯定是人工智慧公司。

身處新的技術和商業風口,如何尋找AI企業的未來獨角獸?從本期開始,我們將走進一家家AI企業,從中發現未來的AI獨角獸。我們的選擇標準是,這些未來獨角獸公司不僅有著超高的估值和光明前景,以及顛覆性的商業模式和技術,而且是在這場AI革命中,真正讓我們感受到帶來的世界改變。

方向:語音交互

特點:從軟到硬

成立時間:2012年6月

員工人數:250人

2016年營收狀況:暫無

估值:超10億美元

融資情況:完成A輪1億元、B輪5000萬美元以及數千萬美元的B+輪融資

2017年北京第一次下鵝毛大雪的這天,雲知聲CEO黃偉很是忙碌。

這位《財富》剛剛評選出的「40歲以下商界精英」,先是在上午接受了電腦報記者2個多小時的專訪,來不及吃午飯,又馬不停蹄的開始準備下午一個重要會議。

窗外,雪花灑落在北京太陽宮冠捷大廈,科技藍打底的雲知聲佔據了數千平方米規模,200多位員工中,博士、碩士學歷員工超過一大半——去年4月,雲知聲從牡丹科技大廈,搬到了現在環境更優雅的寫字樓。對比創業初期拿到天使融資之前,團隊半年內幾乎花光了積蓄,甚至要借錢來發工資的情景,讓記者深感這家人工智慧公司在曾經「冷門」行業中蟄伏的不易。

雲知聲是我們尋找「AI企業未來獨角獸」的第一站。外界大多數人聽說它,是在2013年高調亮相鎚子科技手機發布會,這家成立不足9個月的創業公司,研發出了與科大訊飛媲美的語音助手,然後與樂視、搜狗、阿里巴巴、格力等數百家客戶成了合作夥伴——此後又刷新語音行業融資紀錄,成為近幾年崛起速度最快的語音識別公司。

語音技術作為人機交互方式的入口,是人工智慧重要的一環。現在,隨著BAT、搜狗等語音技術的布局加強,解讀雲知聲的黑馬式崛起密碼,就更頗有一番意味。

改變傳統醫療的「生態商業閉環」

北京協和醫院,一位骨科醫生邊看片子,邊對著手裡的麥克風這樣說:「核對患者及手術標記無誤,麻醉成功后,清潔手術區域皮膚,給予靜脈預防抗生素.....」麥克風中的聲音,語音實時轉化成文字,自動輸入進電腦里,記錄在了患者的電子病歷上。

這是首家支持語音識別的公立三甲醫院,醫生因人而異進行病理錄入,平均每個醫生每天整理病例的時間從超過3小時,降低到了1個小時。

這個案例,顛覆了過去人們印象中的傳統醫療流程,也表明了一個站在風口上的產業,正在開花成熟。

給協和醫院語音識別系統提供定製服務的,正是雲知聲。「這是我們『雲端芯』生態體系中的落地應用之一。在智能家居、智能車載、智能教育等幾大領域,都實現了落地。」黃偉說。

他對AI的判斷是,AI作為底層技術,必須搭載服務和應用,考驗的是資源整合能力。「從技術和需求兩個角度,我們認為理想的方式是垂直領域切入,做定製差異化的服務。」

實際上,與初出茅廬時相比,現在的雲知聲,早就是一家基於物聯網、大數據、語音識別多領域布局的人工智慧公司。

2014年,黃偉第一次提出「雲端芯」概念,將公司定位於「一個IoT(物聯網)時代的語音AI服務商」,引入高通戰略投資的同時進行內部架構的調整,成立了IoT事業部,占當時總人數的一半以上。2016年2月,又成立了AI Labs。

「簡單來說,就是軟硬一體結合,甚至要與晶元結合。」在產品層面,利用AI芯、AIUI、AIService技術架構支撐起雲知聲核心技術的落地和實現,形成完整的「雲端芯」生態閉環。「我們根據用戶場景倒推,未來用戶的形態應該是,比如,在客廳沙發上,自然與空調對話,而不需要湊上去和它交流。場景設定好之後,倒推需要什麼樣的產品,裡面需要哪些技術。」

儘管,這表面看起來並不是技術的顛覆。但這種模式的轉變,需要許多底層的基礎變革來支撐,需要根據不同的載體形式,定製需求、深度開發——更重要的是,對於一個創業公司而言,可以從中確定自己的商業模式和產品模式,甚至是建造自己的壁壘,這些恐怕才是技術之外更重要的考量。

十年,放棄IT巨頭的技術創業者

不過,在目前的AI熱潮中,有多少創業者和公司,能夠像黃偉這樣,準確找到屬於自己的商業閉環邏輯?

「過去我們在AI領域耕耘,缺少經費和機會。於當時,我們是不幸。今天來看,對於在AI領域堅守多年的我們來說,又是如此幸運。」回首過去,黃偉很是感概。他說,從現在看,AI創業公司以2011年前後成為分水嶺,那個時間段成立,並且堅持技術的公司,現在機會最大。

2012年,蘋果Siri開始支持中文。此後,谷歌、亞馬遜、英特爾、微軟等國際巨頭均重金投入語音識別技術;國內,百度和黃偉師出同門的科大訊飛,在行業更是鼎鼎大名。

同樣這一年,黃偉離開盛大創辦了雲知聲。作為在語音識別領域浸淫十多年、拿到諸多語音識別大獎的資深人士,他有充分的自信在這個領域大有所為。

2004年,黃偉從科技大學這所著名的理工類學校畢業后加入摩托羅拉,為MOTO最具盛名的「明」系列手機開山之作A1200提供語音技術支持。2008年,摩托將整個語音識別團隊出售給Nuance。2009年,他加入盛大創新院建立了語音分院。

十餘年的語音從業經驗,讓黃偉意識到,如果把Siri定位為語音助理,用戶就會覺得應該什麼都懂,但人的需求是千變萬化的,一旦做不到就會失去用戶。

所以,雲知聲做的第一件事,是把深度學習應用到了語音識別里,2012年9月,雲知聲發布了基於傳統統計模型的第一代語音識別引擎,準確率為85%,比當時的訊飛高出5個百分點。同年12月,雲知聲又上線了業內第一家搭載DNN(深度神經網路)的雲平台,將準確率提升到91%。這最終征服了以挑剔著稱的鎚子CEO羅永浩,雲知聲用一個晚上就將產品集成和鎚子科技團隊進行對接。

「對一個人工智慧系統公司來說什麼最重要?答案是大數據。」雲知聲因此把它開放出來提供給了第三方,平台上接入的企業客戶數量很快3萬家。快速的數據積累,讓雲知聲進行了一系列數據迭代和演算法優化,將通用識別的準確率在2016年提升到了97%。

隨後,在樂視TV上、美的空調、抽油煙機上,雲知聲語音識別技術迅速落地。雲知聲的合作夥伴數量也已經超過2萬家,覆蓋用戶已經超過2億,日調用量2億次,其中語音雲平台覆蓋的城市超過647個,覆蓋設備超過1億台。

這不能不說是一個商業奇迹——回頭來看,從創業開始,雲知聲只用了2年時間,就將自己基礎語音識別引擎落地並步入正軌,再用數據反哺演算法,不斷將其客戶從家電拓展到醫療、汽車、等其他領域。

先考慮什麼堅決不能做

「我們證明了:一,BAT之下確實還有別的路。二,行業老大之外這條路確實是可行的。」採訪中,黃偉甚至認為,「谷歌、亞馬遜Alexa肯定不是我們的競爭對手,合作機會大於競爭。」這是因為從智能層面,國外雲服務商在國內落地很難,在亞馬遜本土化落地方案等方面,就有了合作機會。

不過,在業界看來,相比於阿里、鎚子、英特爾、樂視、美的、小米、格力等合作夥伴,雲知聲像是一個背後的靜默解語者,這種背後的靜默,恰好體現了雲知聲的產品特點:雖然技術載入,卻無法被用戶形象的感知。

很大程度上,這是由黃偉個人氣質所決定的。「先考慮什麼堅決不能做。」2012年-2014年,黃偉堅持「不做APP」。他的理由是,APP浪潮一波又一波,他需要的只是專註底層技術的提升和大規模應用。

這個理念,一直保持到了今天,哪怕人工智慧行業火爆,他還是認為,不能急功近利的去做事情。

到了2014年,確立了「雲端芯」戰略,他又有兩個不能做:不能只做聯網方案、不能只做手機方案——很早黃偉就認為,手機不是語音識別的主戰場,未來人們更願意對著音箱、冰箱、馬桶、抽油煙機說話,即便這些設備沒有屏幕。他希望,雲知聲先從終端滲透率不斷增加著手,培育用戶的習慣。

「創業對於我來說最難的在於,想做的事情有時候會和資源不匹配。」作為科技大學走出的理工男,黃偉也曾有過「將技術作為唯一評價標準」的時代,後來他不斷修正自己的判斷,他認為到了2017年,如果一家AI公司還在講演算法、講評測,只會非常不成熟。黃偉說,技術和商業,本質是分不開的,沒有純粹的AI公司。技術在一個公司最終的比重只佔到20%。尤其在這個市場環境中,光有技術是不夠的,要補足很多其他的能力。

同時,他覺得自己的心態越來越平和,用他的話來說就是「不會特別悲觀,也不會特別激進」——這和他的從小經歷有關,在部隊大院長大,至今比較喜歡畫畫,出身理工科卻有一顆文藝的內心。這更與他經歷摩托羅拉、Nuance、盛大創新院、創辦雲知聲的職場經歷相關——在摩托羅拉,潛心做了幾年的研發和演算法;在盛大,升級了自己管理的技能。而雲知聲,卻可以在BAT之外,再造一個AI領域的獨角獸。

對話:AI是產品與技術結合的「萬金油」

我們的選擇都是順勢而為

AI與機器人:根據我們了解,目前雲知聲主要聚焦在智能家居、醫療和車載三個行業,選擇這幾個領域的理由是什麼?

黃偉:我們的選擇並沒有刻意選擇某個領域,除了技術成熟以外,更多是市場的成熟度。

AI是一種非常基礎的資源,對各個行業來說都是賦能的,我們是把相對成熟的技術去引入,順勢而為。比如智能家居領域,已經歷了聯網化的改造。格力、美的出貨設備中聯網產品佔比已經相當高,具備了與人工智慧結合的條件。

醫療領域同樣如此,在2013年,醫院信息化還是只有WIFI,那時候談AI根本不可能。但今天,隨著深度學習、大數據的積累,我們技術指標上在語音識別的準確率能做到97%-98%,即便是比較嘈雜的環境,也可以做到90%以上的識別,AI與醫院信息化的結合,有了一個新的機會。

AI與機器人:從2012年就開始進入人工智慧領域,雲知聲並沒有選擇去做2C的領域,也沒有做App,而是切入人工智慧2B,為什麼?

黃偉:這可能和我以前從業背景有關。並不是說,我們沒有互聯網基因,所以不會做APP,實際上,從摩托羅拉到盛大,我可能是人工智慧創業團隊中最具備互聯網基因的。

創業開始時,Siri等各種語音助手很火,但我們認為,這類語音助手註定是個偽命題,一定不會成功。因為AI並不是一個產品,它是一個賦能技術,是「萬金油」,比如人臉識別和安防結合才是產品,如果AI沒有應用場景,用戶是無感的。我們需要做的,是切入這一領域時,將語音助手和場景結合,使得它可以服務於各行各業。比如樂視電視遙控器的語音控制。

商業模式主要來自晶元授權費

AI與機器人:語音識別領域現在競爭非常的激烈,和百度、科大訊飛、亞馬遜、搜狗相比,雲知聲的優勢在哪裡?

黃偉:行業競爭和共同進步是好事。在我們誕生以前,訊飛是沒有壓力的。但2012年9月我們發布語音識別,做到準確率85%,超過科大訊飛的80%。這導致科大訊飛加班了大半年,追上了我們。訊飛在產品上經驗更加完善,值得我們學習。競爭會促進行業發展,比寡頭壟斷進步更快。

BAT做人工智慧,反而我們並不擔心,它們的AI都是為了給現有的主營業務來服務的。比如阿里為電商服務,騰訊為社交服務,百度為搜索,它們的能力是有邊界的。一旦下沉到具體領域,我們還是有非常大的先發優勢。

AI與機器人:目前雲知聲商業模式是怎樣的?是如何將技術、數據和商業閉環打通起來的?

黃偉:商業模式目前主要來自收取晶元授權費用。比如給格力、美的提供包含服務費的晶元模組價格。醫院則是安裝系統收費的模式,比如北京協和醫院,我們幫助他們部署了約600個工作站。

通過這些設備的落地,雲知聲可以獲得更多有價值的垂直數據,AI公司只有拿到數據和使用數據,公司未來才有更大的空間。

聽懂的同時,還要告訴你怎麼做

AI與機器人:現在雲知聲的引擎已經到了3.0版本,從1.0到3.0的迭代,從技術到產品都經歷了哪些過程?

黃偉:廣度和高度上都有很大的變化。1.0時,基本是單純的語音識別,到今天的3.0版本,產品從信號層面到雲的感知層面、自然語言理解層面,都已經非常完善了,這是廣度的變化。

高度上,我們的識別率從1.0版本的85%提升到到3.0版本的97%。如今,口音和噪音識別都不是問題。都可以通過數據加演算法的方式來實現的。遠講則可能會是個挑戰。

AI與機器人:現在版本運用到實際產品中,比如說智能空調,或者智能家居設備,是否已經可以實現自然語言的交互,和你理想中的智能家居應用、交互場景還有多大的差距?

黃偉:感知,認知,到通用,這是我理想中的人工智慧交互場景。現在才是感知和認知的初步階段。

即便我們現在用了語用計算,還是不夠智能,還有很多專業知識需要補充和完善。比如好的語音助理不僅是幫你紀錄,不光要聽懂你說的,還能幫你預測和規劃一些你不知道的東西,比如助理知道你要出差去上海,但上海在下豪雨,那麼會提醒你帶雨具。

「能夠聽懂的同時,還要告訴你怎麼做。」要實現這一點,背後還有很多專業知識庫需要構建。此外這些對話並不擬人化,還缺乏情感計算。這些都是技術限制的局限性,在主動思維和個性化上,還有很長的路要走。尤其是情感計算,我們會嘗試在4.0版本里加入情感計算,它可能既不是語音也不是圖像,但是一個趨勢和方向。

熱門推薦

本文由 一點資訊 提供 原文連結

一點資訊
寫了5860316篇文章,獲得23261次喜歡
留言回覆
回覆
精彩推薦