search
尋找貓咪~QQ 地點 桃園市桃園區 Taoyuan , Taoyuan

IBM語音識別錯誤率再創紀錄 已經接近人類對話

對於人工智慧來說,語音識別無疑也是其中的重要組成部分之一,而近年來,在語音識別技術的發展上,IBM、谷歌、微軟等國際巨頭都在不斷推進,並且也在不斷突破,日前據IBM官網消息,在語音識別錯誤率方面,其再次獲得突破,已經越來越接近人類了。

在語音識別方面,此前據外媒報道,谷歌曾表示他們已經在語音識別領域獲得了突破,將錯誤率降低到了30%,隨後,這個錯誤率貌似就開始了不斷下降,2016年,IBM 宣布在會話語音識別方面取得重大進展,把語音識別的詞錯率降至 6.9%,很快在2016年9月,微軟宣布自家語音識別技術的最低錯誤率為6.3%,打破了當時IBM保持的6.9%紀錄,而就在此後的幾個月,微軟再次宣布將最低錯誤率降低到了5.9%,並表示這已經與普通人類齊平。而就在日前,這個記錄被再次刷新,最近IBM在其官網上宣布,他們已經創造了自家語音識別的新紀錄,錯誤率已經低至5.5%,不但低於了其去年的6.9%的錯誤率,更低於了微軟號稱已經與普通人齊平的5.9%的錯誤率。

據IBM官方博客稱,IBM集中擴展深度學習應用技術終於取得了 5.5% 詞錯率的突破。我們結合了 LSTM 模型和帶有 3 個強聲學模型的 WaveNet 語言模型。這 3 個使用的聲學模型中,前兩個是 6 層雙向 LSTM,其中一個具有多特徵輸入,另一個則通過說話者-對抗多任務學習進行訓練。第 3 個模型的獨特之處在於可以從正負兩個樣本中進行學習。因此 IBM 的系統變得越來越聰明,尤其是在相似語音模式重複之處,表現更佳。

並且,IBM 官方博客還宣稱人們在說話時,對方每聽20個單詞都會漏掉或聽錯1-2個單詞,在5分鐘的對話中,可能會聽錯80個單詞,所以,人類的水平實際上應該是5.1%,這雖然對於多數人在聽懂說話上沒有問題,但是,對電腦就不一樣了。所以,雖然IBM目前雖然已經將次錯率降至了5.5%,但正在向5.1%努力。

從此次IBM在語音識別領域的又一次重大突破看,語音識別很可能在人工智慧領域發展的越來越快,並很可能將對會對人工智慧的發展起到更為有利的推動作用,所以,也許某天小夥伴們接到的流暢的音頻來電,就是來自於人工智慧語音識別的系統的,相信這一天會越來越近了。



熱門推薦

本文由 yidianzixun 提供 原文連結

寵物協尋 相信 終究能找到回家的路
寫了7763篇文章,獲得2次喜歡
留言回覆
回覆
精彩推薦