Zi 字媒體

解決噪音遠場識別、雞尾酒酒會難題，GMEMS想要打通感測器到模組的音頻產業鏈

2021/12/25

智能語音交互正成為新的趨勢，音頻器件產業鏈迎來新春天。市研機構Yole Développement的數據顯示，整體音頻器件市場規模已超150億美元，有機會於2022年增至200億美元。遠場噪音環境下的語音識別、多人語音識別等制約智能語音交互的難題急需解決。聲學公司紛紛推出新一代的音頻解決方案，不少AI公司也試圖通過語音識別的軟體演算法優化解決這些問題。

我們近期接觸的初創公司GMEMS（通用微科技）從聲學原理入手，從演算法、晶元、MEMS麥克風切入，打通晶元到模組的全產業鏈，解決這一難題。

GMEMS成立於2016年下半年，將聲學微型感測器研發與智能演算法及軟體相結合，經過一年左右時間，已經完成了聲學相關演算法及軟體、MEMS麥克風晶元的研發，產品已在小米手機、PC、藍牙耳機等領域商用落地。

團隊目前研發的三款MEMS麥克風晶元分別為低端62DB、中端65DB、高端 68DB規格。其中中端65DB規格已經進入批量生產。高端 68DB（同平台實測約為66到67DB）、低端62DB規格將於本月推出，今年量產。CEO告訴36氪，目前該產品線產品水平已經達到與音頻器件大廠樓氏、英飛凌同一水平，是目前國內可以實現的最好水平。

在智能語音交互日漸流行的當下，GMEMS的聲學前端產品賣點之一就是解決噪音環境下遠場識別的魯棒性問題、多人語音識別的雞尾酒會難題。在降噪方面，團隊過去長期從事相關演算法的研究，降噪相關的演算法已經相對成熟，也被小米MAX2手機採用。為了解決雞尾酒會難題，產品集成了聲紋識別的功能，可以監測出不同的人聲並加以區分。團隊表示，用戶僅需要訓練兩分鐘，到實際使用時就可以只摘取某一特定用戶的聲音。

聲學前端器件的研發並不容易。團隊之所以能在一年之內完成研發，與團隊的專業背景密不可分。公司目前技術團隊25人，核心團隊多數為美籍，其中博士學歷4人，碩士學歷8人，從2003年開始就在基於MEMS的聲學微型感測器方面進行研發，所研發的產品最終被各大品牌筆記本電腦（如聯想、戴爾等）和手機（如小米、聯想、魅族、索尼等）使用，此前也曾在該領域多次創業。

不過，團隊並不滿足於現有的技術水平，一直也在研發更高性能的產品，採用了與目前電容式硅麥、壓電式麥克風完全不一樣的工作方式和原理，可以在器件尺寸不變的情況下做到76-80DB（目前行業最好水平是68DB），若今年開始流片，有望在一年後正式推出工程樣品。目前已申請三個專利，預計還會申請多個專利組建專利池。

相比於大多數聲學前端器件廠商只從事產業鏈的某一環節，GMEMS則採用了全產業鏈的商業模式，從演算法切入，涉足晶元、感測器、麥克風陣列等環節，提供一整套智能語音入口的聲學硬體解決方案。

之所以選擇這樣的商業模式，主要還因為半導體行業上游公司往往議價權較弱，越往產業上游公司能分到的產業蛋糕就越少。在聲學前端器件產業上游，從晶圓廠商及晶元廠商，到MEMS麥克風廠商及IC廠商，再到麥克風陣列廠商，所能獲得的收入及利潤往往是遞增的。

作為關鍵環節的MEMS麥克風，現階段雖然銷量幾十億顆，但市場規模也僅在10億美元左右，向MEMS麥克風感測器的下游環節切入，很可能是GMEMS的必選之路。這種發展路徑在音頻器件領域也已被大廠證明。

當智能語音交互的重要性日益提升，聲學前端器件大廠也都紛紛推出自己的麥克風陣列產品。GMEMS主打的賣點之一就是結合AI技術，讓麥克風陣列更為智能。以往麥克風陣列的尺寸、擺放位置都非常規定，需要進行多維度的匹配，這使得優質的麥克風陣列的尺寸普遍較大。團隊在此前與手機廠商合作的過程中就發現了這一痛點，利用機器學習的技術，讓機器自行調整，廠商不管是使用幾個麥克風，都可以最終達到優秀的效果。

對物聯網發展的樂觀預期，是這一波音頻器件繁榮的主要推動力量。為了使得麥克風陣列產品能夠更好的適用於聯網設備，團隊也在努力使得產品能夠兼顧高性能與小尺寸，利用軟體演算法方面的優化，使用4個麥克風就能達到七、八個左右麥克風陣列的效果。

不過，與市面上目前不少初創公司看重智能音響市場不同，GMEMS則首先選擇了有語音交互現實需求的電視機頂盒及耳機市場，並已經有想關的合作夥伴及意向合作夥伴。

在美國生活多年的王雲龍認為中、美國情不同，人居住房屋情況與美國不同，且沒有美國人非工作時間之外的生活文化，版的Echo很可能不是智能音響，而更可能是耳機。數據顯示，不考慮隨手機附帶的耳機，2015 年全球耳機市場出貨量已經達到3.5億，市場規模已達 100 億美元，無線化、智能化又是耳機行業的大趨勢，端側識別則是耳機智能化的趨勢之一。

電視機頂盒則是一個暫時還未被重視的市場。數據顯示，有 4.3 億戶家庭，電視機保有量約 5.35 億，截止 2015 年底電視機頂盒的保有量在6000萬左右，也有智能化迭代升級的需求，增加語音交互功能也是不少廠商的需求之一。現階段，市面上的音頻器件產品在雜訊環境下普遍只能做1-2米範圍內的識別，GMEMS的產品則將識別範圍拓展到了5-10米。目前，GMEMS已經為該領域的意向客戶做了Demo演示，並收到不少合作意向。

智能家居市場是GMEMS 未來看重的一個大市場。數據顯示，2014年全球智能家居市場規模達410億美元，每年約有80億美元的增速，智能家居市場規模在46億美元左右，未來增速可達50%左右。而現階段通過手機交互對用戶並不友好，而市面上又沒有太多成熟的智能語音交互可供選擇。GMEMS認為，當公司的語音前端做到高品質且小型化、智能化時，會非常有優勢。

目前，GMEMS在軟體降噪演算法及MEMS麥克風產品線上已經實現商業落地。軟體演算法方面，除小米MAX2外，今年可能還會有2家手機客戶；台灣一家安防攝像頭公司也已經植入了GMEMS的演算法。MEMS麥克風產品線方面，已經實現大批量供貨。目前，公司硬體銷售在營收中佔比高於軟體，預計今年的訂單量可以達到七八千萬元，在明年機頂盒領域出貨后，收入可能會有大幅提升。

GMEMS團隊目前約有員工近一百人，核心的軟、硬體團隊位於矽谷。CEO 王雲龍博士畢業於美國密西西比大學物理聲學專業，歷任KLA-Tencor（全球最大半導體晶圓檢測設備製造商）高級工程經理、美國富迪科技公司副總裁、美國通用微機電系統有限公司（General MEMS Corporation）創辦人兼總裁，擁有三十多項MEMS感測器方面的專利，涉及消費電子、生物醫學、免疫檢測等方面。CTO 吳廣華博士畢業於美國加州大學伯克利分校機械工程（博士），師從著名的MEMS領域知名教授 Arun Majumdar，共發表各類專業論文（期刊和會議）近30篇，曾在世界著名的通用電氣公司（GE）擔任MEMS新產品開發經理，負責MEMS設計、開發、製造和與ASIC的集成。

因為涉及到大量專業知識，聲學前端器件技術研發門檻高，不過在外界的印象里與終端的影音硬體相比一直是個「不賺錢」的行業。但相比於其他行業，這個普遍To B的行業主要依賴於技術實現能力，而非渠道、品牌，因此每一次新的硬體終端機會出現時，都會給予技術型初創公司提供發展契機。比如，智能手機問世，尤其是智能語音手機助手推出以來，MEMS麥克風產品迎來新的機遇，歌爾聲學即是抓住了iPhone的大訂單，獲得了商業上的大發展。

相比於智能手機，物聯網很可能會是一個更大的市場。調研機構預測，2020年聯網設備將達340億台（激進數據預測或達460億台），產值也有望增長到500億美元。對於音頻器件廠商來說，這或許又是一個新的洗牌窗口期。

桃園 qq 地點貓咪桃園市 taoyuan xuan 根部尾巴有大桃園旅遊景點