Zi 字媒體

GTC 2017 | 科大訊飛：攜手 NVIDIA 后，應用領域效率提升了 50 倍

2021/12/25

為了助益整個人工智慧創新、創業的發展，雷鋒網攜手《環球科學》和 BOSS 直聘，重磅推出「2017 AI 最佳僱主」榜單。文末可了解關於AI僱主榜單的詳細消息，歡迎廣大企業報名參加。

雷鋒網按：美國本地時間 5 月 9 日，科大訊飛在聖何塞召開的 GTC 2017 大會期間宣布，訊飛開放平台將提供基於 NVIDIA 最新 Pascal 架構的 NVIDIA Tesla P4 平台，提供語音雲服務的深度學習推理，進一步提升訊飛語音雲平台的效率。

科大訊飛美國分公司總裁李春燕博士表示，隨著對深度學習和人工智慧技術要求日益提高，GPU 在扮演越來越重要的角色。在 NVIDIA 推出 Pascal 架構的 GPU 平台後，科大訊飛第一時間應用 NVIDIA Tesla P4 深度學習進行訓練，並取得了相對於 CPU 訓練的 50 倍以上速度提升。

「原先需要兩個月時間來完成的訓練，現在只需要一天就能完成。」李春燕告訴雷鋒網。

李春燕介紹，科大訊飛從 2013 年便開始使用 NVIDIA 的 K10 GPU 平台進行相關人工智慧產品的開發，目前科大訊飛在線日業務量過 35 億人次，總用戶數超過 10 億，擁有 30 萬家合作夥伴、是中文語音技術市場的領先者。目前，科大訊飛的全行業語音產品和人工智慧產品在教育、客服、車載、智能家居、智能硬體、醫療等方面均有著廣泛的應用。

「目前深圳有超過 60% 做機器人的公司，他們用的都是訊飛的方案。」得知雷鋒網編輯來自深圳，李春燕如是說。

科大訊飛此次投入應用的 Tesla P4 具備超高的運算能力，主要將其應用於訊飛開放平台的深度學習推理，在語音識別的線上解碼引擎上。相比起之前科大訊飛使用的 M40，Tesla P4 的併發路數提升了 3-4 倍，而功耗峰值降低至 75W，僅相當於 M40 的 1/2-1/3。

在性能優化上，科大訊飛也下了一番功夫。Tesla P4 理論上能提供每秒 22T INT8 運算的計算峰值，在實際應用中，科大訊飛跑出了超過 20T INT8 運算的接近理論峰值的計算能力，這一結果讓 NVIDIA 刮目相看。

「這是所有合作夥伴達到的最高數值。」NVIDIA 全球副總裁、亞太區總裁 Raymond Teh 告訴雷鋒網。

Tesla P4 運算能力的提升和計算併發路數的提升對於科大訊飛來說至關重要。前者有助於幫助科大訊飛提升訓練時間，加快迭代的速度，後者可以大大提高雲端服務響應速度。通過在訓練和推理兩端同時用 GPU 加速，不僅能夠降低在線識別的成本，更能有效提升客戶的體驗。

據 NVIDIA 業務發展總監何濤介紹，Tesla P4 是為了適應未來數據中心低功耗計算能力而設計的。GPU 對於所有計算中心的計算能力管理至關重要，P4 迎合了數據中心的需求，不僅在性能上有顯著提升，體積更小，可以在同樣空間中配置更多的 GPU；功率降低，更重要的是可以用 PCIE 供電，無需額外電源，能夠便於客戶更靈活地管理計算能力。

「的傳統機房一般是給一個恆定的能耗，如果用大 GPU 不可能放很多。」何濤說。「這樣的設計，特別適合。」他接著補充道。

2017 AI 最佳僱主榜單正在評選中

「AI 最佳僱主榜單」，國內最具權威性的 AI 企業僱主榜單，致力於幫助學術青年和 AI 從業者發現最佳企業發展平台。「閱讀原文」，加入榜單評選！

桃園 qq 地點貓咪桃園市 taoyuan xuan 根部尾巴有大桃園旅遊景點