search
尋找貓咪~QQ 地點 桃園市桃園區 Taoyuan , Taoyuan

可怕,40行代碼的人臉識別實踐

以後可千萬別闖紅燈了,不要以為可以躲過去。

那人臉識別的技術到底怎樣的呢?

很多人都認為人臉識別是一項非常難以實現的工作,看到名字就害怕,然後心懷忐忑到網上一搜,看到網上N頁的教程立馬就放棄了。這些人里包括曾經的我自己。其實如果如果你不是非要深究其中的原理,只是要實現這一工作的話,人臉識別也沒那麼難。今天我們就來看看如何在40行代碼以內簡單地實現人臉識別。

一點區分

對於大部分人來說,區分人臉檢測人臉識別完全不是問題。但是網上有很多教程有意無意地把人臉檢測說成是人臉識別,誤導群眾,造成一些人認為二者是相同的。其實,人臉檢測解決的問題是確定一張圖上有木有人臉,而人臉識別解決的問題是這個臉是誰的。可以說人臉檢測是是人識別的前期工作。

今天我們要做的是人臉識別。

所用工具

  • Anaconda 2 —— Python 2

  • Dlib

  • scikit-image

Dlib

對於今天要用到的主要工具,還是有必要多說幾句的。Dlib是基於現代C++的一個跨平台通用的框架,作者非常勤奮,一直在保持更新。Dlib內容涵蓋機器學習、圖像處理、數值演算法、數據壓縮等等,涉獵甚廣。更重要的是,Dlib的文檔非常完善,例子非常豐富。就像很多庫一樣,Dlib也提供了Python的介面,安裝非常簡單,用pip只需要一句即可:

  • pip install dlib

上面需要用到的 scikit-image
  • pip install scikit-image

  • 註:如果用 pip install dlib 安裝失敗的話,那安裝起來就比較麻煩了。錯誤提示很詳細,按照錯誤提示一步步走就行了。

人臉識別

之所以用 Dlib 來實現人臉識別,是因為它已經替我們做好了絕大部分的工作,我們只需要去調用就行了。Dlib裡面有人臉檢測器,有訓練好的人臉關鍵點檢測器,也有訓練好的人臉識別模型。今天我們主要目的是實現,而不是深究原理。感興趣的同學可以到官網查看源碼以及實現的參考文獻。

今天的例子既然代碼不超過40行,其實是沒啥難度的。有難度的東西都在源碼和論文里。

首先先通過文件樹看一下今天需要用到的東西:

準備了六個候選人的圖片放在 candidate-faces 文件夾中,然後需要識別的人臉圖片 test.jpg 。我們的工作就是要檢測到 test.jpg 中的人臉,然後判斷她到底是候選人中的誰。

另外的 girl-face-rec.py 是我們的python腳本。 shape_predictor_68_face_landmarks.dat是已經訓練好的人臉關鍵點檢測器。 dlib_face_recognition_resnet_model_v1.dat 是訓練好的ResNet人臉識別模型。ResNet是何凱明在微軟的時候提出的深度殘差網路,獲得了 ImageNet 2015 冠軍,通過讓網路對殘差進行學習,在深度和精度上做到了比 CNN 更加強大。

1. 前期準備

shape_predictor_68_face_landmarks.datdlib_face_recognition_resnet_model_v1.dat然後準備幾個人的人臉圖片作為候選人臉,最好是正臉。放到 candidate-faces 文件夾中。

本文這裡準備的是六張圖片,如下:

她們分別是

然後準備四張需要識別的人臉圖像,其實一張就夠了,這裡只是要看看不同的情況:

可以看到前兩張和候選文件中的本人看起來還是差別不小的,第三張是候選人中的原圖,第四張圖片微微側臉,而且右側有陰影。

2.識別流程

數據準備完畢,接下來就是代碼了。識別的大致流程是這樣的:

  • 先對候選人進行人臉檢測、關鍵點提取、描述子生成后,把候選人描述子保存起來。

  • 然後對測試人臉進行人臉檢測、關鍵點提取、描述子生成。

  • 最後求測試圖像人臉描述子和候選人臉描述子之間的歐氏距離,距離最小者判定為同一個人。

3.代碼

代碼不做過多解釋,因為已經註釋的非常完善了。以下是 girl-face-rec.py
  • # -*- coding: UTF-8 -*-

  • import sys,os,dlib,glob,numpy

  • from skimage import io

  • if len(sys.argv) != 5:

  • print"請檢查參數是否正確"

  • exit

  • # 1.人臉關鍵點檢測器

  • predictor_path = sys.argv[1]

  • # 2.人臉識別模型

  • face_rec_model_path = sys.argv[2]

  • # 3.候選人臉文件夾

  • faces_folder_path = sys.argv[3]

  • # 4.需識別的人臉

  • img_path = sys.argv[4]

  • # 1.載入正臉檢測器

  • detector = dlib.get_frontal_face_detector

  • # 2.載入人臉關鍵點檢測器

  • sp = dlib.shape_predictor(predictor_path)

  • # 3. 載入人臉識別模型

  • facerec = dlib.face_recognition_model_v1(face_rec_model_path)

  • # win = dlib.image_window

  • # 候選人臉描述子list

  • descriptors =

  • # 對文件夾下的每一個人臉進行:

  • # 1.人臉檢測

  • # 2.關鍵點檢測

  • # 3.描述子提取

  • for f in glob.glob(os.path.join(faces_folder_path, "*.jpg")):

  • print("Processing file: {}".format(f))

  • img = io.imread(f)

  • #win.clear_overlay

  • #win.set_image(img)

  • # 1.人臉檢測

  • dets = detector(img, 1)

  • print("Number of faces detected: {}".format(len(dets)))

  • for k, d in enumerate(dets):

  • # 2.關鍵點檢測

  • shape = sp(img, d)

  • # 畫出人臉區域和和關鍵點

  • # win.clear_overlay

  • # win.add_overlay(d)

  • # win.add_overlay(shape)

  • # 3.描述子提取,128D向量

  • face_descriptor = facerec.compute_face_descriptor(img, shape)

  • # 轉換為numpy array

  • v = numpy.array(face_descriptor)

  • descriptors.append(v)

  • # 對需識別人臉進行同樣處理

  • # 提取描述子,不再註釋

  • img = io.imread(img_path)

  • dets = detector(img, 1)

  • dist =

  • for k, d in enumerate(dets):

  • d_test = numpy.array(face_descriptor)

  • # 計算歐式距離

  • for i in descriptors:

  • dist_ = numpy.linalg.norm(i-d_test)

  • dist.append(dist_)

  • # 候選人名單

  • candidate = ['Unknown1''Unknown2''Shishi''Unknown4''Bingbing''Feifei']

  • # 候選人和距離組成一個dict

  • c_d = dict(zip(candidate,dist))

  • cd_sorted = sorted(c_d.iteritems, key=lambda d:d[1])

  • print"\n The person is: ",cd_sorted[0][0]

  • dlib.hit_enter_to_continue

4.運行結果

我們在 .py所在的文件夾下打開命令行,運行如下命令

python girl-face-rec.py 1.dat 2.dat ./candidate-faecs test1.jpg

由於 名字實在太長,所以我把它們重命名為 1.dat2.dat
  • The person isBingbing

記憶力不好的同學可以翻上去看看 test1.jpg 是誰的圖片。有興趣的話可以把四張測試圖片都運行下試試。

這裡需要說明的是,前三張圖輸出結果都是非常理想的。但是第四張測試圖片的輸出結果是候選人4。對比一下兩張圖片可以很容易發現混淆的原因。

機器畢竟不是人,機器的智能還需要人來提升。

有興趣的同學可以繼續深入研究如何提升識別的準確率。比如每個人的候選圖片用多張,然後對比和每個人距離的平均值之類的。全憑自己了。

關注「數據與演算法之美」

獲取更多最全數據集



熱門推薦

本文由 yidianzixun 提供 原文連結

寵物協尋 相信 終究能找到回家的路
寫了7763篇文章,獲得2次喜歡
留言回覆
回覆
精彩推薦