Zi 字媒體
2017-07-25T20:27:27+00:00
人工智慧變革速記行業百度最近宣布推出SwiftScribe網頁應用,它的出現意味著人工智慧將改變完全依賴人工的速記行業。百度首席科學家吳恩達在Facebook說:「這個應用非常適合那些需要把長語音轉換為文本的人們,人工智慧將實現1+1大於2的效果。」SwiftScribe怎麼用?用戶可在PC端打開SwiftScribe網頁應用,選取wav和mp3格式的文件上傳,系統就能馬上進行處理,時長1分鐘的音頻文件可以在30秒內轉換完成。使用鍵盤快捷鍵可以進行加快播放、後退和添加換行符等操作,處理完成後,只需人工調整大小寫、標點及部分拼寫細節就能快捷、準確地完成音頻轉換。從使用效果看,SwiftScribe可以為速記員帶來1.67倍的效率提升,縮短40%的工作時間。目前可處理1小時內的音頻文件,而這一時長正在開發團隊的努力下逐步延展,未來會增加視頻文件的語音識別及自動添加標點符號等功能,並支持更多文件格式,降低用戶使用門檻。SwiftScribe的開發原理這次推出的SwiftScribe網頁應用,依託於百度新一代深度語音識別系統Deep Speech 2,通過利用長達數千小時的語音數據訓練,Deep Speech 2可以不斷「學習」從語音中識別特定的字或詞。Deep Speech 2也被《麻省理工科技評論》評為「2016年十大突破技術」之一:「在識別漢語語音片段方面,要比人為識別更加準確。」目前,百度語音識別準確率已達到97%,這也為SwiftScribe的轉化效率提供了技術基礎。SwiftScribe的靈感來源作為非英語母語者,百度SwiftScribe項目經理吳田曾深受長語音記錄的困擾:「要整理一段1小時錄音對我來說要花上10個小時。」 而這就是這一應用的靈感來源。百度在去年也推出了應用Deep Speech 2的安卓輸入法TalkType,讓用戶能夠用語音快速輸入文字。百度矽谷人工智慧實驗室項目領導人Bijit Halder在公告中稱:「TalkType是首款智能語音優先輸入法。」語音交互的時代對話機器將成為2017人工智慧的發展風口,吳恩達曾在《華爾街日報》的採訪中說,隨著準確率的提高和用戶體驗的提升,百度的語音產品已度過用戶心中的「試用期」。在語音產品迅猛發展的大環境下,亞馬遜、蘋果、谷歌和微軟等科技巨頭都在加緊研發各自的語音識別技術,然而在長文本音頻轉化技術上,百度的技術仍然領先。
寫了
5860316篇文章,獲得
23313次喜歡