Zi 字媒體

易聯視訊陳建文：單純的人機交互絕不是終極目標

2021/12/25

引語：據專業人士稱，人類感知外界信息有80%以上是通過視覺獲取的。2015年，微軟在ImageNet大賽中，演算法識別率首次超越人類，視覺由此成為此次人工智慧浪潮中最為活躍的領域。人工智慧作為人類的終極夢想，這一次浪潮人類距離夢想還有多遠？是曇花一現，還是會夢想成真？

正文：7月20日，國務院發布了《新一代人工智慧發展規劃的通知》。在全球AI迅猛發展的今天，此通知的印發將人工智慧提到了國家層面，為推動人工智慧事業的發展奠定了強有力的堅實基礎。近日，億歐網採訪了北京易聯視訊科技有限公司董事長、電子科大視覺智能研究中心主任陳建文博士。談話中，這位在此相關領域耕耘超過15年的千人專家深度闡述了自己對於AI當下及未來發展的分析與思考。

陳建文 Ph.D.

沒那麼簡單，人工智慧是一個龐大的生態系統

如果問你什麼是人工智慧，你會如何作答？人臉識別、語音識別還是圖像處理？這些經常說到的詞語像潤物細無聲般充斥在我們的周圍，正智慧地改變著人們的生活。是的，它們都是AI，也就是人工智慧。但人工智慧領域並不僅僅只有這些，「它是一個跨學科、多學科相結合的龐大領域」，陳建文如是說道。在這裡，他為我們展示了一張人工智慧圖譜並詳細介紹了這一領域的生態體系。

結合此圖譜，陳博士特別指出，機器學習（深度學習）這一框架目前已經基本確定了；而計算機視覺、語音識別、自然語言處理等都是應用層面的基礎技術支撐。早在2008年11月IBM就提出了「智慧地球」的概念，每個行業領域都有其專業的核心演算法，比如無人駕駛和安防設備的演算法就不盡相同，大家都是在各自的演算法上呈垂直方向更迭演進。像ImageNet 圖像識別，它也僅僅只是深度學習上的一個應用而已。而演算法又只有落地到場景中才能得到大量可靠的數據從而推動行業乃至社會的發展。

因此，在陳建文看來，人工智慧是一個龐大的領域，它也像其他領域一樣有著自己的發展脈絡和體系，結構分層互相支撐：底層深度學習架構檢驗著上層應用演算法，而應用演算法也能夠反過來對底層框架提出要求，並驗證底層框架是否能跟上應用的節奏，推進領域的整體發展。十幾年前不敢想象的場景在今天實現了、幾年前的難題在今天攻克了，人工智慧也和歷史一樣在持續不斷地向前發展著，每出現一個大框架的改進或演算法的提高都會在全球引發一波浪潮。所以，處在這一波人工智慧浪潮下的我們決不能因為一兩棵樹木而忽略整片森林。

放眼看，人工智慧的未來盡在科幻電影中

當問到AI的未來將何從何從時，陳建文博士非常激動地說到：AI的的未來實際上在之前無數的科幻題材的電影中都進行了比較生動的勾畫，AI的終極目標實際上也是人類的終極目標：一個虛擬智能的世界。這個世界的核心是一套完整的人工智慧系統，一套龐大而又完整的智能服務系統。就像《星際迷航》、《黑客帝國》、《阿凡達》等科幻電影中所描繪的場景一樣，在這個人類夢寐以求的虛擬世界中，無論你身處何方，均可隨時連接，無論是人機交互、人和系統交互還是人人交互都和真實的世界沒有任何分別。

陳建文對此表示：實際上，為達到這一終極目標，人類一直都在努力著。在連接方面，本質上是將人和人進行的一個線上互聯。而關於連接技術，陳建文並不拘泥VR和AR的概念異同，在他看來，無論是文字、圖片、語音還是視頻、VR、AR都是連接人與人的工具，我們在虛擬世界中所看到的人腦互聯從本質上也屬於連接技術的範疇。在那裡，交流不再僅僅只是通過直播或VR簡單連接，它可以做到把千里之外的「人」瞬間帶到你身邊，而這個「人」不僅可以陪伴你，TA還完全擁有與真實人一樣的表情、動作甚至情感，這其中就涉及到了現在的虛擬重建、全息投影、情感感知、手勢識別等核心人工智慧技術。

說到虛擬世界，很多人不免會對此產生疑問，認為它是虛幻的不可實現的。但陳建文表示，我們在二十年前科幻影片中所看到的很多技術和場景目前都已經實現了，我們現在看到的科幻電影中的東西我們又怎麼能懷疑那不是未來呢？所以，虛擬世界並不是空想主義，它是有科學依據的。這從技術的發展歷程，視頻直播、VR/AR以及全息投影的階段演進中便可知曉一二，所以，陳博士笑稱：人工智慧的未來就在科幻影片中，看看電影就知道未來的世界是什麼樣了。

我們只做視頻狀態下與人相關的視覺智能

在人工智慧火爆全球的今天，眾多企業紛紛涉足其中，而陳建文博士和他的易聯視訊AI團隊業務主要是在視覺智能方面，準確的說就是只做在視頻狀態下與人相關的視覺智能演算法，為未來的世界提供基礎架構和核心技術支撐。在他看來，單純的人機交互絕不是終極目標。當前，人有80%以上的時間不是在車裡，而是在不同的社交環境中，那麼未來的世界也依然如此。交朋友、打遊戲、逛街購物......人不僅可以隨意虛擬穿越到任何地點，而且還能夠將本體的動作、表情之類完全同步到虛擬世界中。所以，未來世界的重建應以人為本，如何解決人的連接和智能才是最核心的問題。

在陳建文博士的帶領下，易聯視訊AI團隊正在系統地研究視頻狀態下人的情緒感知、動作、手勢等相關的科學難題。對於一個剛剛走出來的方向，人工智慧領域需要持續不斷的加碼科研的投入，而這一點正是易聯視訊團隊的優勢之一。「我們有自己的研究單位和機構，大量的科研力量能夠源源不斷地提供科技的支撐，這是其他很多初創期的AI創業公司無法比擬的。如果沒有自己的研究團隊，我們的創新也將無法長期可持續發展。」

當前，醫療、安防、支付、車聯網、智能家居、工業自動化等領域的應用均已成為火熱的創業風口。站在風口處，陳建文博士有著清醒的認識：人工智慧並不是一個行業，它是與各行業相結合進而完成產業升級。大多數的傳統行業都有自己固定的設備、渠道，行業地位在短時間內是無法撼動的，所以，易聯視訊拒絕閉門造車，它倡導和行業的引領者合作，所有需要和人打交道的領域，我們為他們提供強有力的科技AI演算法支持。現在，易聯視訊與東方網力、長虹、華為等公司都展開了長期的合作研究，問其主要合作方式，陳建文說：「我們是他們核心演算法（人工智慧演算法）的提供者。」以長虹為例，易聯視訊提供相關視覺智能演算法，這一技術不僅僅只是人臉識別，它還包括了情感、情緒、動作等所有和人有關的方面，而這些演算法和技術將使用在長虹智能家居、智能機器人的產品鏈中。

有所為而有所不為，專註於人的AI——這即是易聯視訊的戰略也是目前正在做的事情！

只要方向定正確，不怕道路彎又遠

在陳建文看來，人工智慧和社會性質一樣，都是分階段的。實際上，人工智慧並不是一個新的概念，早在十幾年前陳建文在清華讀博士的時候就已經參與到車牌識別、運動行為識別這些古老的課題，但那時並未給它定義為「人工智慧」。隨著深度學習範疇的不斷拓展，在最近的十年內，技術取得了長足進步。例如圖片的識別數據集對象的準確率從71.8%上升到了97.3%，已經超越了人類的能力。而這些反過來會大幅度的升級整個行業。

上文中也提到：深度學習是底層核心，我們現在所說的人工智慧演算法能力大多屬於應用層的能力，底層核心框架為了上層應用演算法的實現和驗證提供了平台保障。除了底層平台，為達到高程度的準確率，演算法必須結合大量的訓練數據，而當數據並不豐沛時，它的準確率必然處於劣勢。只有準確率達到一定水平才會具有真正的實用價值，從而被人們所熟知。就像現在的人臉識別或語音識別等技術，經過了幾十年的發展，終於突破了性能的閾值走到我們的面前。當然，還有更多的人工智慧應用、演算法仍處於實驗室階段不被外界所知。

因此，陳建文認為：只要方向定正確，不怕道路彎又遠。就像亞馬遜連續虧損25年後，其CEO貝索斯終在7月27日超越比爾蓋茨成為新任世界首富。在陳看來，無論研究還是創業都不要隨大流，應該有自己的獨立判斷。認清優勢、找到目標，然後一直堅持下去。

地平線的優勢是無人駕駛、東方網力是智能安防、商湯科技是人臉識別、科大訊飛是同聲翻譯機、......而易聯視訊是專註於人的人工智慧公司。以強大科研機構為後盾，持續不斷地演進演算法，提升技術水平。在此過程中，每個核心的演算法或者能力都會輸出到一些階段性的產品上。也許「這個產品和我最後的願景並不一致，但只要方向是正確的，不怕道路有多遠。」目前，易聯視訊的所有技術、產品都是為構建未來的虛擬世界而準備，「我們還將深度挖掘，在演算法、應用場景上開疆拓土，把自己的核心技術、核心優勢做強做精，為架構未來人工智慧平台而不斷前行。」

當前，易聯視訊C+B端有幾千萬用戶從而積累了大量數據，這在國內人工智慧公司中是極為少見的。演算法+大數據+雲計算再結合龐大的研究機構，陳建文博士有信心帶領易聯視訊團隊打造出人工智慧虛擬世界！

桃園 qq 地點貓咪桃園市 taoyuan xuan 根部尾巴有大桃園旅遊景點