search
尋找貓咪~QQ 地點 桃園市桃園區 Taoyuan , Taoyuan

數博會「黑科技」提前看 比爾·蓋茨都曾高度評價

不用出聲!唇語識別技術知道你在說啥

2017數博會目前已有近250家企業確認參展,展覽會上,諸多難得一見的「黑科技」將面向公眾亮相。其中,海雲數據將帶著他們最新的唇語識別技術參加展覽,比爾·蓋茨都曾到訪並高度評價的企業,你也有機會一睹「廬山真面目」。

海雲數據被稱為大數據可視分析的領導者,提供企業級大數據整體運營與分析服務,依託於計算機數據視覺、數據演算法等技術,探索大數據的潛在商業價值,為不同行業客戶提供基於數據交互可視化的整體產品,真正實現將大數據應用於分析、決策和預判領域。

2016年11月,Google旗下的Deepmind發布了一篇唇語識別研究論文,識別的準確性大幅度超過人類專家,成為人工智慧超越人類的又一個領域。而海雲研究院自2016年12月以來,成功復現了Deepmind發布的研究成果,同時開展了中文唇語識別模型的研究工作,取得了一定的成果。目前看來,中文識別模型有望在準確性上超過Deepmind發布的英文識別模型。海雲數據稱,將在今年上半年公布研究成果。

目前,海雲數據的唇語識別技術的中文準確率已達到71%,英文準確率高達80%。

據了解,唇語識別是一項集機器視覺與自然語言處理於一體的技術,目的在於直接從有人講話的圖像中識別出講話內容。唇語識別系統使用機器視覺技術,從圖像中連續識別出人臉,判斷其中正在說話的人,提取此人連續的口型變化特徵;隨即將連續變化的特徵輸入到唇語識別模型中,識別出講話人口型對應的發音;隨後根據識別出的發音,計算出可能性最大的自然語言語句。

訓練唇語識別模型,需要用到大量的語料,這些語料是經過處理的有人講話的視頻,以及視頻中每個講話的口型所在的時間點上,對應的講話內容文字。可以使用來自視頻網站的公開視頻,但是這些視頻不能直接使用。利用視頻製備語料,首先需要對視頻進行篩選,把說話人不在畫面中的部分去除,然後分離出篩選后的視頻中的語音,將語音識別成文字,最後將識別出的文字對齊到語音中相應發音的時間點上。

海雲數據目前已創造出全新的大數據運營產品「圖易」、「智駕」、「 DIVA」、「智警」、「慧務」等多個產品。微軟創始人比爾·蓋茨曾在造訪海雲數據時評價道:「這是一支充滿激情的團隊,形象化數據是商務智能的重要組成部分,我對海雲數據的數據分析能力印象深刻。」

今天,海雲數據的產品被世界500強企業所廣泛使用,並進一步推動了大數據可視分析的商業應用市場空間。

2017國際大數據產業博覽會(簡稱2017數博會)將於5月26日-29日在貴陽召開。數博會展覽、論壇以及系列活動將於5月25日開始舉辦。自5月25日起,北廣場及登錄大廳的專業發布區和精英發布區以及展場會議室,將分別舉辦大數據領域權威發布活動和企業新產品、新技術的發布專場,為參展企業提供業內最具專業水平的展示發布平台。想參觀2017數博會專業展的觀眾可通過數博會官網、官方微信進行購票。

dsjsd-zzs

投稿地址:[email protected]

聚焦大數據時代 傳播新思維變革



熱門推薦

本文由 yidianzixun 提供 原文連結

寵物協尋 相信 終究能找到回家的路
寫了7763篇文章,獲得2次喜歡
留言回覆
回覆
精彩推薦