Zi 字媒體

AI 看臉識同性戀：準確率最高為 91%

2021/12/25

斯坦福大學的邁克爾·科辛斯基（Michal Kosinski）和王軼倫發現，通過從 3 萬多張人臉圖像中提取出來的特徵，計算機識別出同性戀男性的準確率最高可達到 91%，同性戀女性則為 83%。論文認為，與產前激素理論一致，同性戀男性的長相更「女性化」，下巴更窄，鼻子更長，額頭更大，同性戀女性則相反。

這篇題為《深度神經網路基於人臉圖像判斷性取向比人類更準確》的論文於 9 月 7 日發表在《人格與社會心理學雜誌》（Journal of Personality and Social Psychology）上后，引發了媒體和社交網路的熱議。

英國《衛報》擔心，這項技術會導致青少年「自測」，夫妻「互測」，而在對同性戀處以死刑的國家，這項技術更可能淪為殺人工具。

不過，在作者看來，他們的研究是針對人臉識別技術和互聯網隱私問題的警告，是對未來可能成真的技術濫用的演示。作者在文章中呼籲，政府和企業應制定相關法規，發展相關技術，降低同性戀群體的隱私風險。

異性戀（左）、同性戀（中）男女的複合面部圖像，最右為異性戀（綠色）、同性戀（紅色）男女的平均面部標記

論文的摘要寫道：「我們發現人臉中包含的有關性取向的信息遠比人腦能夠感知到的多。我們用深度神經網路從 35326 張面部圖像中提取特徵。我們將這些特徵輸入邏輯回歸演算法，對性取向進行分類。給定單張面部圖像，分類器能以 81% 的概率區別同性戀和異性戀男性，女性則為 71%。人類的判斷準確率則要低得多：男性 61%，女性 54%。給定同一個人的 5 張面部圖像，演算法的準確率可以相應提高到 91% 和 83%。分類器利用的面部特徵，有鼻子形狀等固定特徵，也有打扮風格等臨時特徵。同性戀男性和女性傾向於具備性別非典型的面部形態、表情和打扮風格，這與產前激素暴露影響性取向的理論相符合。而性別分類模型檢測同性戀男性的準確率為 57%，同性戀女性的準確率為 58%。這些發現提高了我們對性取向起源以及人類認知缺陷的理解。此外，公司與政府越來越多地使用計算機視覺演算法探測人的內在特徵，我們的研究揭示出同性戀的隱私與安全正在面臨威脅。」

演算法準確率：男性 91%，女性 83%

研究者從美國交友網站上獲取了公開資料，包括 36630 名男性的 130741 張照片和 38593 名女性的 170360 張照片，年齡在 18 歲到 40 歲之間。他們的性取向則是通過意向伴侶性別獲悉的。

隨後，研究者將這些照片中的人臉用 Face＋＋軟體進行了處理，剔除了一些照片。接著，他們人工篩選這些照片是否是成年白人，性別與網路資料是否相符。最後，他們隨即剔除了一些照片，以平衡異性戀和同性戀的人數，留下的樣本包含同性戀和異性戀男性各 3947 名，同性戀和異性戀女性各 3441 名。

對美國交友網站上獲取的公開照片進行處理

研究者使用一個名為 VGG-Face 的深度神經網路提取圖像的特徵，並以此訓練邏輯回歸模型。實驗結果顯示，給定單張面部圖像，分類器能以 81% 的概率區別同性戀和異性戀男性，女性則為 71%。給定同一個人的 5 張面部圖像，演算法的準確率可以相應提高到 91% 和 83%。

給定個體男性（藍色）、女性（紅色）1 至 5 張照片，演算法的準確率提高

符合產前激素理論：同性戀男性更「女性化」？

在引言部分，作者說明，他們選擇研究性取向的一個重要原因是「廣為接受的性取向的產前激素理論（PHT），預測了外表與性取向的關係」。

論文寫道，根據產前激素理論，男性胚胎過少地暴露在雄性激素中，或女性胚胎過多地暴露在雄性激素中，都可能造成性取向異化。然而，雄性激素同樣與兩性面部分化有關，產前激素理論預測同性戀人群傾向於具備性別上不典型的面部形態。即，同性戀男性面部應該更女性化，同性戀女性面部應該更男性化。

研究者通過分類器識別的位點集合成了計算機認為「最像同性戀」和「最不像同性戀」的人臉。論文認為，計算機識別結果與產前激素理論相符合，同性戀長相在性別上更不典型。平均來講，同性戀男性的下巴更窄，鼻子更長，額頭更大；同性戀女性則相反。

顏色越紅的區域，在演算法中越重要

為了進一步檢驗「同性戀長相更不具備性別典型性」這一假設，研究者還通過一個準確率 98% 的性別分類器試圖區別同性戀和異性戀，發現在男性身上的準確率為 57%，在女性身上的準確率為 58%。論文寫到：「數據顯示，男性面部的女性化程度與同性戀概率呈正相關，女性則相反。」

研究的幾點局限性

不過，在論文的討論部分，作者強調研究結論不應被讀者誤讀。首先，同性戀長相更不具備性別典型性，不代表所有的同性戀男性長相都女性化，也不代表所有同性戀女性長相都不女性化。

其次，不應誤讀 91% 這個實驗中的數值。在美國的同性戀比例大約為 6% 到 7% 的情況下，分類器需要大幅犧牲準確率，才能覆蓋大量的樣本。

論文也自我指出了研究的幾點限制：樣本限於白人、沒有排除雙性戀，以及無法排除長相「更同性戀」的人更容易「出櫃」這一點。

作者也拋出了其他幾個有趣的問題，比如同性戀男性更少留鬍子，主要是生理原因（毛髮稀少）還是品味原因？分類器識別男性比女性更準確，是否意味著女性的性取向更具流動性？

看臉識罪犯、識貧富、識同性戀：科學相面術？

近年來，計算機視覺識別技術發展迅速。從辦理身份證件、電子支付到機場安檢、辦公門禁，人臉識別技術正在大規模進入人們的日常生活。不過，一些研究者試圖通過計算機視覺識別，尋找外表特徵和內在性格的聯繫，引發了廣泛的爭議。

去年 11 月，上海交通大學武筱林教授的《基於面部圖像的自動犯罪概率推斷》一文指出，機器可以通過照片分辨出誰是罪犯，誰是守法公民，識別準確率在 86% 以上。隨後，加拿大多倫多大學一項機器看臉識貧富的研究，同樣引發了一些爭議。

此前，一家以色列初創公司聲稱其開發的人臉識別程序成功識別了參與 2015 年 11 月巴黎恐怖襲擊的 9 名恐怖分子，還能識別戀童癖與白領罪犯。

儘管這些研究倍受倫理爭議，但從論文來看，科辛斯基和王軼倫顯然並不認同將這方面的研究完全劃歸禁區。

在引言部分，論文提到，相面術可回溯至古和古希臘，畢達哥拉斯就曾「看臉」收門生。而義大利外科醫生龍勃羅梭在 19 世紀初開創了「天生犯罪人理論」，指出罪犯可以通過臉部特徵識別。

「如今，相面術被廣泛認定為一種糅合迷信與種族主義的偽科學。由於合法性問題，研究、甚至是討論面部特徵和性格之間的聯繫都成為了禁忌。聯繫不存在，這成了一個普遍的前提。然而，很多機制暗示，情況是相反的。」

「重要的是，人類看臉判斷性格的準確率低，並不一定說明線索不是明明白白地擺在那裡。只是，人類可能缺乏探測或解讀的能力……因此，我們用現代計算機視覺演算法檢驗這個假設。」

同性戀群體危險了！

論文的作者試圖通過這一研究警告我們，社交平台上的公開數據，可以被人利用，製作針對性取向的分類器。文章寫道：「預測性取向可能對同性戀男女和整個社會都造成嚴重威脅，甚至生命威脅。……許多國家的法律認定同性戀是犯罪，8 個國家會將同性戀處以死刑。因此，我們讓決策者、科技企業和同性戀群體知道看臉識同性戀的準確率可以有多高，這很關鍵。」

雖然論文所演示的恰恰是論文所反對的，作者強調，他們並非要製造一種入侵的工具，而是為了演示一些常用的入侵路徑。就在眼下，一些政府和企業就在研究人臉識別和內在人格之間的聯繫，風險預警迫在眉睫。作者希望，他們的研究能提醒政府和企業，制定相關法規，發展相關技術，降低同性戀群體的隱私風險。

社交網站信息顯示，科辛斯基是斯坦福商學院的助理教授，2014 年在劍橋大學獲得心理學博士學位。他曾供職於微軟研究院和劍橋大學，在公開言論中曾多次談及隱私問題。王軼倫大學部畢業於浙江大學，2016 年在斯坦福獲碩士學位，目前是 IDG 資本駐舊金山灣區的投資顧問，投資領域專註於 AI、機器人、機器學習、計算機視覺等。

王軼倫（左）、科辛斯基（右）

原文檢索：

Deep neural networks are more accurate than humans at detecting sexual orientation from facial images.

Public

4

桃園 qq 地點貓咪桃園市 taoyuan xuan 根部尾巴有大桃園旅遊景點