Zi 字媒體

僅憑孩子視頻圖片找父母，這樣的「人機大戰」你看好誰?

2021/12/25

人臉識別技術早已不新鮮，但靠著孩子的視頻照片找其父母會如何呢？

25日，由中央電視台和科學院共同主辦的大型科技挑戰節目《機智過人》在央視一套8點正式播出第一期，人臉識別「御眼重明」系統作為最強智能首發亮相，挑戰剛剛協助美國FBI破獲「章瑩穎」案的最強人類「妙筆神探」林宇輝。從識別本人到跨人識別，這一挑戰對林宇輝和人臉識別系統都是第一次，到底誰更強？

「御眼重明」能一秒跨年齡識人

在節目中，雲從科技研發總監李夏風帶領「一秒識人」的「御眼重明」系統作為最強智能首發亮相，一亮相便展示了跨年齡識人這個新技能——從36張圖片中一秒就選出了撒貝南、江一燕兒時的照片。

在與山東省公安廳首席模擬畫像專家、國際科學鑒定協會畫像專家林宇輝的PK中，節目組給出了以前人臉識別系統和林宇輝都從沒有做過的事情——根據孩子的圖片找父母。PK還分為視頻近景模糊、遠景模糊、遠景高糊三個難度等級。

在第一個階段，「御眼重明」不到一分鐘就找對了孩子父母，林警官花了十幾分鐘也找對了。但在遠景高糊難度下，「御眼重明」模型對比匹配度最高僅有29%，林宇輝則使出了自己擅長的模擬畫像法，用模糊畫像解決監控錄像中人像不清的問題，並以此畫像尋找孩子父母。

雖然最後雙方都沒有找對，打成了平手，不過精彩的PK讓雙方有了「英雄相惜」的感覺。林宇輝表示如果這種人工智慧技術能夠應用到工作中，那麼對破獲案件將有極大的幫助。李夏風則表示，對於模糊圖像的識別是他們下一步要研究的方向。

「御眼重明」為何會首發出場，是否代表國內人臉識別技術的頂尖水平？

據了解，雲從科技在業內被稱為是人工智慧行業國家隊。雲從科技創始人周曦博士師從美國工程院院士、計算機視覺之父黃煦濤教授，2011年入選中科院「百人計劃」，曾任科學院重慶研究院信息所副所長、智能多媒體技術研究中心主任。

雲從科技成立於2015年3月，是一家從重慶發展起來的專註計算機視覺與人工智慧的高科企業。目前雲從科技由上海、成都、重慶三個研發中心，美國UIUC和矽谷兩個前沿實驗室，及中科院、上海交大兩個聯合實驗室組成三級研發架構。

「為了參加節目，我們從去年就開始準備。」李夏風說，去年12月他們參加了路演進行了技術展示，中間經過多次溝通，6月最終通過中科院的技術驗證、現場答辯，才能百度等國內多家人臉識別公司中脫穎而出，作為人工智慧技術中人臉識別系統頂級代表進行「人機大戰」。

人證合一對比準確率可達99.8%

「御眼重明」如何識人？李夏風介紹了雲從的核心技術特點：「雙層異構深度神經網路」。

人類的神經系統在處理信息時是分級的，例如在看一張人臉照片時，首先會從像素中提取人臉的邊緣特徵，然後將邊緣特徵組合成部件特徵，接下來將部件特徵組合成能表達整張人臉的特徵，最後基於人臉特徵判人臉的屬性。他們對深度神經網路進行優化，避免其缺點。雙層異構深度神經網路中此模型中每層都是一個深度網路，在訓練時採用二分類損失函數並對兩個網路中對應權值的差異性進行正則化，可實現不同圖像空間到相同特徵空間的映射。在特徵空間中，相同身份人臉圖像的類內差異變小，而不同身份人臉圖像的類間差異變大，從而增強了特徵的判別性。

實際應用中，在雲從的演算法以及大數據的支持下，雲從的 1:1 人證合一識別準確率可以達到99.8%以上，3000 萬人底庫的大庫檢索 Top1 命中率可以達到 88.2%，2 萬人底庫的動態人臉識別布控準確率可以達到99.5%。

對於戴眼鏡等面部遮擋的情況會怎樣？李夏風說，關鍵區域遮擋小於30%識別問題都不大，戴眼鏡是沒有問題，目前對戴口罩和戴墨鏡的有一定難度。

首次嘗試跨人識別未來準確率會提高

李夏風說，跨年齡人臉識別也是一種雙層的關係，這是一種歲月變化。他們先用深度學習從1000多萬人，2億張人臉圖片中學習了人臉的600多個特徵，再通過搜集的幾萬對成年人與其本人小時候照片的人臉數據，提取了人臉特徵后，通過雙層異構網路進行特徵遷移學習，找到了成年人臉和兒童照的特徵空間映射關係，準確率在人臉特徵清晰的情況下可達95%以上。而本身其圖片清晰化技術，3D人臉旋正以及光照規整也會在人臉圖片處理時用到。多方面的技術整合，才能夠達到一定的識別精度。

「此次節目中要求跨人對比，根據孩子的照片找父母，也是我們第一次嘗試。」李夏風說，他們在人臉識別研究過程中，發現其小孩和父母也是有一定的人臉內在相似性，通過搜集五千多對父母與小孩的人臉數據進行機器學習，也找到了小孩與父母的人臉特徵空間對應關係，目前準確率平均在30%到50%之間。

對於此次跨人識別在最後的遠景模糊圖像識別環節沒有正確識別。雲從科技CEO、首席科學家周曦表示，一方面是因為圖片太不清晰了，這種質量的圖片在真正實戰中不太會用，另一面，在真正的實戰中還是搜同一個人，而不是跨人搜尋。

專家說法：目前人臉識別技術識人技術已經超過人

李千目教授南京理工大學計算機學院

使用遠景高糊的圖片進行跨人識別，就這個場景來說對目前的人臉識別技術來說確實很難。這不僅涉及到年齡的差距，而且目前有效訓練的素材比較難收集，而且深度學習對這種新樣本的覆蓋性也不夠。人工智慧在這種場景下只能找到有相似的，但很難確認正確。

從目前的人臉識別技術來說，人工智慧的識別速度與準確率已經超過人了。目前人臉識別的主要學習方法是深度學習，它會把人的主要特徵維度進行充分表達，肯定比人的神經元和視覺神經判斷要強很多。

對於人機對抗的勝負問題，如果是從全國的人臉庫里里進行尋找對比，而不是台上十幾個家庭，那麼人還判斷得過來嗎？這次人機大戰不是說誰戰勝誰，而是很好的展示了人臉識別技術。在真正的破案中，完全可以用人工智慧技術先識別，把其中得分高的篩選出來，再由人來判斷。

目前大家對人臉識別比較關注，其實人臉識別只是圖片識別技術中的一部分，我覺得這個技術更大的作用在於非結構化數據的識別，比如圖片、藏品、車、物等。因為人臉的識別最多只是身份驗證，但如果對其他物品的識別進行深度應用，會對我們整個智能城市、智能製造、工業4.0產生大的推動。如果能夠通過這些技術和宣傳，讓圖像識別技術在工業控制、製造生產、金融預測識別等領域進行使用，會對我們生活、生產、工作產生更大的便利便捷，更好的帶動智能化產業發展。

科技日報記者就央視一套《機智過人》節目專訪山東省公安廳首席模擬畫像專家、國際科學鑒定協會畫像專家林宇輝，以下為部分文位元組選：

1、您與人臉識別「御眼重明」系統打成平手，您覺得這是雙方正常「實力」的反映嗎？

首先我不是研究這種技術的，但這些年我一直在關注相關領域的技術發展情況。我感覺經過科研工作者的努力，的人臉識別技術不次於國外頂級水平。我認為那天在現場，雙方展現的都不錯，都發揮出了一定的實力。

2、在您和「御眼重明」較量的視頻近景模糊、遠景模糊、遠景高糊三個難度等級中，您覺得哪個沒有發揮好？或者不滿意的地方？

這個不存在發揮的問題。實際上有三個環節，8月25日播出的第二個環節去掉了，我估計因為時間原因。第一環節相對比較容易，因為小孩子的面部暴露的比較清晰，特徵比較清楚，所以我們都能找出他們的父親；因為我是研究模糊視頻的，這一環節還不屬於模糊視頻。

第二環節是在公園裡面，一個大人領著一個小孩玩，攝像頭在三四十米的距離，因為在室外，光線比較好，小女孩的特徵還是能夠看出來的，所以我跟「御眼重明」也是都選擇了正確。所以，前兩環節我們達成了平手。

第三個環節的設置實際上參照了美國章穎瑩的案子，遠處停車場，開過一輛車來，小孩子露著頭。當時主持人也問我，你覺得這個條件怎麼樣？有沒有挑戰？我說這個比章穎瑩案子的條件要好一些，至少孩子的形象是正面臉型，她的面部輪廓看出來了，這就跟我的專業接近：藉助人物的面部輪廓，把我的畫固定下來。再去尋找她的父母，就相對容易一些。不然的話，視頻模糊，靠眼記、靠腦子記，出來的判斷是不完全的，畢竟現場給出的時間比較緊張。我的這個判斷跟機器完全不一樣，它要憑眼睛和腦子同時記住，結合幾十年的經驗做出判斷。而「御眼重明」就是一秒鐘時間，是與不是，馬上給出判斷。

所以，這一關，我選擇的是10號和6號，因為這兩個人感覺像父親的多一些。但主持人說你只能選一個，在猶豫之間，我選擇了6號。「御眼重明」選擇了4號，這是錯誤的選擇。很遺憾，我之前選擇涵蓋的10號，在稍微一猶豫之間放掉了。而正確答案恰恰是10號。

人的判斷是基於經驗基礎上的，這個比機器人要好得多。

3、這也是我想問的，你和「御眼重明」優勢各在什麼地方？

「御眼重明」是基於大數據做出的判斷，它的內存蘊含著上千萬的人臉數據，經過快速計算，像「海選」一樣，由海量數據縮小到一定的小範圍，並且馬上出結果，所以它的突出優勢就是快。這是人達不到的。要是篩選如此海量的數據，你需要多少人、多少日日夜夜去完成啊，而且準確度也不敢確定。這是機器的優勢。

但由於環境、光線、角度的一系列主客觀因素影響，極大地制約到機器的發揮，因為他們可能沒有這種人性化的思維、判斷和綜合分析。在這種情況下，人的經驗、角度、思維優勢便顯現出來。

我搞了十幾年的模糊視頻研究，雖然我的速度趕不上高智能機器，但人的感情、思維、經驗，如果我從這一小部分數據中再提取、升華，結果可能就是比較準確的。這也是人與機器「搭檔」的好處。所以說人的智慧與機器的快速配合起來，我認為這應該是代表未來的發展方向。

註：文中圖片均來自網路

桃園 qq 地點貓咪桃園市 taoyuan xuan 根部尾巴有大桃園旅遊景點