search
尋找貓咪~QQ 地點 桃園市桃園區 Taoyuan , Taoyuan

AI 看臉識同性戀:準確率最高為 91%

斯坦福大學的邁克爾·科辛斯基(Michal Kosinski)和王軼倫發現,通過從 3 萬多張人臉圖像中提取出來的特徵,計算機識別出同性戀男性的準確率最高可達到 91%,同性戀女性則為 83%。論文認為,與產前激素理論一致,同性戀男性的長相更「女性化」,下巴更窄,鼻子更長,額頭更大,同性戀女性則相反。

這篇題為《深度神經網路基於人臉圖像判斷性取向比人類更準確》的論文於 9 月 7 日發表在《人格與社會心理學雜誌》(Journal of Personality and Social Psychology)上后,引發了媒體和社交網路的熱議。

英國《衛報》擔心,這項技術會導致青少年「自測」,夫妻「互測」,而在對同性戀處以死刑的國家,這項技術更可能淪為殺人工具。

不過,在作者看來,他們的研究是針對人臉識別技術和互聯網隱私問題的警告,是對未來可能成真的技術濫用的演示。作者在文章中呼籲,政府和企業應制定相關法規,發展相關技術,降低同性戀群體的隱私風險。

異性戀(左)、同性戀(中)男女的複合面部圖像,最右為異性戀(綠色)、同性戀(紅色)男女的平均面部標記

論文的摘要寫道:「我們發現人臉中包含的有關性取向的信息遠比人腦能夠感知到的多。我們用深度神經網路從 35326 張面部圖像中提取特徵。我們將這些特徵輸入邏輯回歸演算法,對性取向進行分類。給定單張面部圖像,分類器能以 81% 的概率區別同性戀和異性戀男性,女性則為 71%。人類的判斷準確率則要低得多:男性 61%,女性 54%。給定同一個人的 5 張面部圖像,演算法的準確率可以相應提高到 91% 和 83%。分類器利用的面部特徵,有鼻子形狀等固定特徵,也有打扮風格等臨時特徵。同性戀男性和女性傾向於具備性別非典型的面部形態、表情和打扮風格,這與產前激素暴露影響性取向的理論相符合。而性別分類模型檢測同性戀男性的準確率為 57%,同性戀女性的準確率為 58%。這些發現提高了我們對性取向起源以及人類認知缺陷的理解。此外,公司與政府越來越多地使用計算機視覺演算法探測人的內在特徵,我們的研究揭示出同性戀的隱私與安全正在面臨威脅。」

演算法準確率:男性 91%,女性 83%

研究者從美國交友網站上獲取了公開資料,包括 36630 名男性的 130741 張照片和 38593 名女性的 170360 張照片,年齡在 18 歲到 40 歲之間。他們的性取向則是通過意向伴侶性別獲悉的。

隨後,研究者將這些照片中的人臉用 Face++軟體進行了處理,剔除了一些照片。接著,他們人工篩選這些照片是否是成年白人,性別與網路資料是否相符。最後,他們隨即剔除了一些照片,以平衡異性戀和同性戀的人數,留下的樣本包含同性戀和異性戀男性各 3947 名,同性戀和異性戀女性各 3441 名。

對美國交友網站上獲取的公開照片進行處理

研究者使用一個名為 VGG-Face 的深度神經網路提取圖像的特徵,並以此訓練邏輯回歸模型。實驗結果顯示,給定單張面部圖像,分類器能以 81% 的概率區別同性戀和異性戀男性,女性則為 71%。給定同一個人的 5 張面部圖像,演算法的準確率可以相應提高到 91% 和 83%。

給定個體男性(藍色)、女性(紅色)1 至 5 張照片,演算法的準確率提高

符合產前激素理論:同性戀男性更「女性化」?

在引言部分,作者說明,他們選擇研究性取向的一個重要原因是「廣為接受的性取向的產前激素理論(PHT),預測了外表與性取向的關係」。

論文寫道,根據產前激素理論,男性胚胎過少地暴露在雄性激素中,或女性胚胎過多地暴露在雄性激素中,都可能造成性取向異化。然而,雄性激素同樣與兩性面部分化有關,產前激素理論預測同性戀人群傾向於具備性別上不典型的面部形態。即,同性戀男性面部應該更女性化,同性戀女性面部應該更男性化。

研究者通過分類器識別的位點集合成了計算機認為「最像同性戀」和「最不像同性戀」的人臉。論文認為,計算機識別結果與產前激素理論相符合,同性戀長相在性別上更不典型。平均來講,同性戀男性的下巴更窄,鼻子更長,額頭更大;同性戀女性則相反。

顏色越紅的區域,在演算法中越重要

為了進一步檢驗「同性戀長相更不具備性別典型性」這一假設,研究者還通過一個準確率 98% 的性別分類器試圖區別同性戀和異性戀,發現在男性身上的準確率為 57%,在女性身上的準確率為 58%。論文寫到:「數據顯示,男性面部的女性化程度與同性戀概率呈正相關,女性則相反。」

研究的幾點局限性

不過,在論文的討論部分,作者強調研究結論不應被讀者誤讀。首先,同性戀長相更不具備性別典型性,不代表所有的同性戀男性長相都女性化,也不代表所有同性戀女性長相都不女性化。

其次,不應誤讀 91% 這個實驗中的數值。在美國的同性戀比例大約為 6% 到 7% 的情況下,分類器需要大幅犧牲準確率,才能覆蓋大量的樣本。

論文也自我指出了研究的幾點限制:樣本限於白人、沒有排除雙性戀,以及無法排除長相「更同性戀」的人更容易「出櫃」這一點。

作者也拋出了其他幾個有趣的問題,比如同性戀男性更少留鬍子,主要是生理原因(毛髮稀少)還是品味原因?分類器識別男性比女性更準確,是否意味著女性的性取向更具流動性?

看臉識罪犯、識貧富、識同性戀:科學相面術?

近年來,計算機視覺識別技術發展迅速。從辦理身份證件、電子支付到機場安檢、辦公門禁,人臉識別技術正在大規模進入人們的日常生活。不過,一些研究者試圖通過計算機視覺識別,尋找外表特徵和內在性格的聯繫,引發了廣泛的爭議。

去年 11 月,上海交通大學武筱林教授的《基於面部圖像的自動犯罪概率推斷》一文指出,機器可以通過照片分辨出誰是罪犯,誰是守法公民,識別準確率在 86% 以上。隨後,加拿大多倫多大學一項機器看臉識貧富的研究,同樣引發了一些爭議。

此前,一家以色列初創公司聲稱其開發的人臉識別程序成功識別了參與 2015 年 11 月巴黎恐怖襲擊的 9 名恐怖分子,還能識別戀童癖與白領罪犯。

儘管這些研究倍受倫理爭議,但從論文來看,科辛斯基和王軼倫顯然並不認同將這方面的研究完全劃歸禁區。

在引言部分,論文提到,相面術可回溯至古和古希臘,畢達哥拉斯就曾「看臉」收門生。而義大利外科醫生龍勃羅梭在 19 世紀初開創了「天生犯罪人理論」,指出罪犯可以通過臉部特徵識別。

「如今,相面術被廣泛認定為一種糅合迷信與種族主義的偽科學。由於合法性問題,研究、甚至是討論面部特徵和性格之間的聯繫都成為了禁忌。聯繫不存在,這成了一個普遍的前提。然而,很多機制暗示,情況是相反的。」

「重要的是,人類看臉判斷性格的準確率低,並不一定說明線索不是明明白白地擺在那裡。只是,人類可能缺乏探測或解讀的能力……因此,我們用現代計算機視覺演算法檢驗這個假設。」

同性戀群體危險了!

論文的作者試圖通過這一研究警告我們,社交平台上的公開數據,可以被人利用,製作針對性取向的分類器。文章寫道:「預測性取向可能對同性戀男女和整個社會都造成嚴重威脅,甚至生命威脅。……許多國家的法律認定同性戀是犯罪,8 個國家會將同性戀處以死刑。因此,我們讓決策者、科技企業和同性戀群體知道看臉識同性戀的準確率可以有多高,這很關鍵。」

雖然論文所演示的恰恰是論文所反對的,作者強調,他們並非要製造一種入侵的工具,而是為了演示一些常用的入侵路徑。就在眼下,一些政府和企業就在研究人臉識別和內在人格之間的聯繫,風險預警迫在眉睫。作者希望,他們的研究能提醒政府和企業,制定相關法規,發展相關技術,降低同性戀群體的隱私風險。

社交網站信息顯示,科辛斯基是斯坦福商學院的助理教授,2014 年在劍橋大學獲得心理學博士學位。他曾供職於微軟研究院和劍橋大學,在公開言論中曾多次談及隱私問題。王軼倫大學部畢業於浙江大學,2016 年在斯坦福獲碩士學位,目前是 IDG 資本駐舊金山灣區的投資顧問,投資領域專註於 AI、機器人、機器學習、計算機視覺等。

王軼倫(左)、科辛斯基(右)

原文檢索:

Deep neural networks are more accurate than humans at detecting sexual orientation from facial images.

Public

4



熱門推薦

本文由 yidianzixun 提供 原文連結

寵物協尋 相信 終究能找到回家的路
寫了7763篇文章,獲得2次喜歡
留言回覆
回覆
精彩推薦