search
尋找貓咪~QQ 地點 桃園市桃園區 Taoyuan , Taoyuan

聽過人臉識別,但你聽過猴臉識別?西電計算機視覺教授為你揭秘

導讀

聽過人臉識別,但是你聽過猴臉識別么?研究猴臉識別能幹嗎?難不成分辨真假美猴王?我們知道猴子和人類都屬於靈長類動物,那可否用人臉識別的方法去識別猴子?然而,猴子生長在野外,且天生好動,又該如何獲取猴子的影像呢?黃河連線帶著這些疑問,特此專訪了西安電子科技大學苗啟廣教授,苗啟廣教授是計算機視覺方面的專家,在猴臉識別領域有著深入的研究和實踐基礎。以下為專訪實錄:

1.黃河連線:非常感謝苗教授能接受黃河連線的專訪,提到人臉識別大家可能還會比較熟悉,那提到猴臉識別讓人感覺會很興奮,但是感覺離我們的現實應用比較遠,當時為什麼會有這樣的想法呢?

苗啟廣:金絲猴是國家一級保護動物,對其進行保護的重要性是不言而喻的。對金絲猴進行保護,就要了解它的個體和群體的習性,活動規律,生存狀態以及社會群體的組織結構等。那麼在此過程中,首要的任務就是個體識別。只有認識了每一個個體,才能進一步研究群體規模,社會結構等。

陝西有一個金絲猴保護區,首先,對動物飼養員來說,金絲猴具體有多少只,只能知道大概,那對金絲猴的保護是一個難題。其次,很多學校經常做金絲猴的動物實驗,相關專業的學生需要到山上觀察金絲猴的行為,往往蹲點觀察1—2個月才能把金絲猴分別開來,然後進行正式工作,這樣就很浪費時間。

對於金絲猴的個體識別,傳統的方法就是採用人工標記或者是「照片相面」。人工標記方法指的是在金絲猴身體的某個部分打上標籤,這種方法存在較大的局限性,隨著金絲猴的成長會對金絲猴的身體造成一定的傷害,這也就違背了我們保護金絲猴的初衷。而「照片相面」方法其實就是人工記憶,這種方法很大程度上受限於個人經驗,並且當群體規模較大時,人工記憶難度較大,極易產生相互混淆的情況,此外,人腦還存在遺忘的問題。為解決這些問題,又鑒於目前機器學習方法,特別是近年來深度學習方法在人臉識別方面取得輝煌成果,希望能夠利用計算機視覺技術實現金絲猴的個體識別。這些工作,都是我和我的已經畢業的博士生許鵬飛博士共同做出的研究成果。

就目前的研究進展,利用金絲猴的面部特徵進行個體識別是完全可行的。猴臉識別是通過拍照或者錄像的方式獲取圖片數據,然後由計算機執行相應演算法實現個體識別。這種方法不會對金絲猴產生任何傷害,也不會影響他們的活動規律,完全是一種非接觸式的監測方式。

此外,拍照或錄像可以長時間持續(這裡指的是每天,每月,每年等等)進行,這樣就可以持續記錄每隻金絲猴的「相貌」,並且計算機不存在人腦遺忘的情況。我們做的種種努力都是為了能夠利用計算機視覺技術實現複雜情況下對金絲猴進行個體識別,這些研究成果將為後期對金絲猴個體的行為監控、群體生存狀態檢測和活動規律的研究奠定基礎,進而為金絲猴保護政策和措施的制定提供更可靠的依據。

2.黃河連線:這需要解決哪些難點?

苗啟廣:猴臉識別需要解決的第一個難題就是建立猴臉資料庫。與人臉識別一樣,猴臉識別也需要首先建立一個猴臉資料庫。但相對於人臉資料庫,猴臉圖像的獲取存在更大難度。主要原因在於,我們無法讓動物按照我們的意願來接受我們對其進行拍攝,更多情況下是我們主動尋找機會去捕獲他們的面部圖像。

此外,金絲猴獲得的場景較為複雜,特別是野生金絲猴,拍攝時會受到多種因素的影響。例如:

■ 野外環境的複雜性和不可控制性。金絲猴生活在野外環境,不同季節的野外環境存在巨大差異。並且,全球金絲猴分布區域廣泛,不同國家、不同區域的金絲猴所棲息的野外環境也存在較大差異。

■ 布置在野外的紅外相機或者可見光相機的位置和角度都是固定的,在面臨各種環境光照的考驗時,可能出現側光、背光和高光等現象,同時還會出現各個時段光照不同的現象。

過去差不多一年的時間我們都在摸索如何能夠快速有效地拍攝到金絲猴面部圖像數據的方法。為了能夠拍攝到有效的猴臉圖像,我們經過多次拍攝實踐,制定了相應的拍攝策略和方法,同時對拍攝設備和相關參數也進行了相關設置。目前我們已經捕獲有220多隻金絲猴的面部圖像共計有30000餘幅。

由於金絲猴面部特徵的相似性和易變性相同年齡階段的不同金絲猴個體在其頭部形狀、面部結構、器官外形、頭部毛髮的顏色和紋理等方面都非常相似。這也就對識別演算法的性能提高了更高的要求。此外,與人類相似,金絲猴也可以通過面部的變化產生多種表情,這些表情導致了其面部形狀特徵和紋理特徵的不穩定。如果在野外環境下,金絲猴面部可能受到樹枝、樹葉等事物的遮擋,或者其面部粘有污泥等,這都會導致金絲猴面部特徵的發生變化。由面部表情變化以及其他環境因素的變化所引入的非線性因素是金絲猴面部特徵識別過程中需要解決的一個難題。

3.黃河連線:我們可以經常聽到人臉識別,而且猴子和人類都屬於靈長類動物,那麼猴臉識別的原理與人臉識別類似么?是什麼原理?

苗啟廣:金絲猴的面部特徵和人臉的面部特徵存在一定的相似之處,但同時也存在較大的差異,主要表現在面部結構和面部的紋理。當我們初次聽說或看到猴臉識別時,多數人的直觀的想法就是利用現有的人臉識別方法進行猴臉識別。而人臉特徵和動物面部特徵之間存在較大差異,如果將現有的人臉檢測和識別方法直接應用於動物面部檢測與識別會產生一系列問題。

雖然金絲猴面部特徵與人臉特徵之間存在一定的相似之處,但在面部結構、器官形狀和面部紋理特徵等諸多方面存在較大差異,主要體現在三個方面:

■ 第一,相對於人臉,金絲猴面部由毛髮和皮膚兩個部分組成;

■ 第二,金絲猴的面部(特別是面部毛髮區域)具有更複雜的紋理特徵;

■ 第三,相對於人臉特徵的全局相似性,金絲猴面部特徵具有顯著的局部差異性。

因此,針對金絲猴面部圖像的檢測與識別,不能直接採用現有的人臉檢測與識別的方法。

圖1 金絲猴面部圖像與人臉圖像對比

基於深度學習的猴臉識別的基本原理其實是和人臉識別類似的,也就是利用深度學習演算法提取金絲猴面部的有效特徵,進而對其進行更有效的個體識別。但是我們不能直接使用現有的人臉識別的方法進行猴臉識別,我們需要根據具體的任務,對演算法模型進行相應的改進,使其更適合於猴臉識別任務。

4.黃河連線:與人臉識別相比,猴臉識別的難度如何?精確度如何?

苗啟廣:相對於人臉識別,猴臉識別還是存在一定難度的,除了上邊提到的環境複雜,面部角度和形態多樣性之外,還有就是猴臉的相似性。相對於人臉,猴臉識別就類似於「多胞胎」的識別,相同年齡階段同一性別的金絲猴的長相非常相似,人類僅憑視覺難以準確識別,這也給我們設計猴臉識別演算法提出了較高的要求,也就是如何能夠提取出長相相似的不同金絲猴個體面部的差異性特徵,以及同一金絲猴個體在不同因素影響下面部的相似性特徵。

好在目前具有多隱層的人工神經網路有著優異的特徵學習能力,學習到的特徵對數據有著更本質的刻畫,更有利於對金絲猴個體的識別。相比於一些傳統的學習方法,在精度上,有了很大的提高。目前已經對197隻金絲猴進行了識別,識別準確率在97%以上,包括秦嶺皇冠朝陽溝保護區的23隻金絲猴,佛坪熊貓谷的48隻金絲猴和周至的126隻金絲猴。

5.黃河連線:猴子的活躍度遠高於人,且不受控制,能否順利識別?在技術上有什麼解決辦法?

苗啟廣:在野外,猴子的活躍度高,不受控制,但是事實上我們並不需要和猴子近距離接觸,只需要拍攝記錄下猴子的照片或視頻即可,在圖像或視頻幀中猴臉解析度在100×100左右,且不存在運動模糊和大面積遮擋,就可以進行識別。目前常用的有200萬像素的智能手機就可以滿足要求,當然單反相機就更好了。因此,獲取猴臉圖像在設備上不存在問題。而主要的問題在於如何能夠拍到側臉角度較小,也就是小於30°的側臉,沒有大面積遮擋的猴臉。對於不聽指令,活躍度很高的金絲猴,這一任務具有較大的挑戰。

在單個人拍攝的情況下,我們總結了相應的拍攝策略和參數要求,並且形成了相應的規範。目前我們在進行多物種動物拍攝過程中,基本都是按照這一規範進行的。我們可以在已拍攝的圖像和視頻中實現金絲猴面部的檢測與識別,並且已經實現了基於淺層ResNet模型的金絲猴面部識別的實用軟體,這個軟體運行在基於Tegra K1的Jetson TK1嵌入式系統開發平台上。

而在後期,我們將會嘗試多攝像頭組合的方式(即布置攝像頭點陣),這樣就可以在不同方向對金絲猴進行拍攝,就能夠很大程度上拍攝到他們的有效面部圖像。進一步,再進行視頻拼接,三維建模等研究,以更好地實現在大場景下對金絲猴進行面部檢測、識別與追蹤。

6.黃河連線:那猴臉識別在現實中會起到什麼作用?

苗啟廣:在金絲猴保護和動物、生態研究方面,解決了研究人員需要對金絲猴個體進行人工記憶的難題,為他們更準確地計算群體規模提供了可靠數據。並且,我們後期的主要任務就是實現在複雜的野外背景下對金絲猴進行快速檢測與追蹤,為金絲猴個體和群體行為規律大研究奠定基礎。這樣可以讓動物研究人員能夠更好、更深入地了解金絲猴個體和群體行為。

對於計算機視覺研究方面,拓展了計算機視覺的應用範圍,實現了計算機視覺技術的跨學科應用,同時,針對新的問題,對傳統機器學習和深度學習方法進行了相應的改進,提高了演算法的精度和速度。

此外,這種技術還可以應用於野生動物新個體的發現。如果金絲猴種群中,存在新加入的個體或者家庭,那麼我們的演算法可以準確識別,並及時將相應個體的圖像數據加入資料庫。如果後期這種技術能夠應用於大熊貓等其他動物的識別中,那麼對於野生大熊貓或者其他珍惜動物數量的調研將起到重要的有利作用。

7.黃河連線:猴臉識別的應用場景有哪些?市場需求是否足夠大?

苗啟廣:目前,金絲猴臉部識別可以應用到以下幾個方面:

■ 對動物科研人員來說,可以使他們更容易,更準確地獲得動物個體的身份,以及個體和群體行為等信息。

■ 對動物園來說,可以利用這種技術實時監測不同動物群體和個體在籠舍中的情況,為科學飼養提供依據。

■ 對遊客來說,隨著旅遊業的興起,越來越多的人前往動物園或野生動物保護區,但是多數遊客只是看看動物的種類,不同種類動物的長相,或者看下那些動物是不是比較可愛,而很少了解動物的個體和群體的關係或者相關行為規律。那麼我們可以將猴臉識別應用到對金絲猴以及對動物園中其他動物的個體識別中,我們用手機拍下一隻金絲猴或者其他動物的圖像,通過演算法進行個體識別,然後給遊客返回這隻金絲猴或其他動物的很多信息,比如:它的名字,年齡,甚至家庭成員,這也增加了遊客遊玩的樂趣,了解了很多動物的相關知識,也在一定程度上促進了人類保護動物的意識。

來源:黃河連線



熱門推薦

本文由 yidianzixun 提供 原文連結

寵物協尋 相信 終究能找到回家的路
寫了7763篇文章,獲得2次喜歡
留言回覆
回覆
精彩推薦