search
專訪 LP Morency 教授:抑鬱症、自殺傾向都逃不出「計算機之眼」

專訪 LP Morency 教授:抑鬱症、自殺傾向都逃不出「計算機之眼」

據美國精神衛生組織估計,2015年美國有超過4000萬的成年人曾患過某種形式的精神疾病,其中有1600萬人(相當於美國人口的7%)經歷過至少一次嚴重的抑鬱發作。美國幾乎有30%的成年人將患上焦慮症。

改善這一現狀需要大量專業的、熟練的臨床醫生對精神疾病進行診斷,這無疑給醫療保障系統帶來了巨大的壓力。診斷過後,判斷治療的成功與否,以及判斷患者對治療反應的好壞程度也都是非常主觀的。為了協助醫生們完成這些困難的任務,研究專家們正在考慮將計算機視覺技術引入心理疾病的治療中。

Louis-Philippe Morency 是卡內基梅隆大學的教授,他是這個領域的領軍人物。MedGadget 的記者 Mohammad Saleh 與 LP Morency教授就他的「多感官技術」進行了交談。

Medgadget:請您介紹一下您在計算機視覺和人類互動方面的工作吧。

Dr. LP Morency: 我們正在開發一種能夠自動感知人類非語言行為(如面部表情、眼神、頭部動作)和非語言聲音(像緊張、意願)的技術。我們這麼做是為了幫助醫生診斷和治療心患者的精神疾病,如抑鬱症、焦慮症、創傷后精神障礙(PTSD)、精神分裂症和孤獨症等。

Medgadget: 這項技術的開發現在到了什麼地步?你能介紹一下在這些演算法背後的科學原理嗎?

Morency: 從「計算機視覺」的角度來看,「人臉關鍵點檢測」是我們的基本演算法之一。它能自動識別人面部68個「關鍵點」。多年來,這些「關鍵點」一直被認定為是相對可靠的人臉追蹤點,比如眉毛的位置、嘴巴的輪廓、眼角和下巴輪廓。這些都是之後人臉分析的基礎,因為識別當下的面部部位形狀有助於理解和識別面部表情。面部表情的識別通常是與「頭部傾斜」和「眼神」預估相結合的。

Medgadget:那麼你能從這68個面部參數中獲取多少信息呢?你是如何幫助計算機通過這些參數「讀懂」人的表情的?

Morency: 實際上,這些「面部關鍵點」讓我們觀察到了面部肌肉的變化,在某種程度上幫我們「量化」了面部表情。在Paul Ekman的「面部動作編碼系統」中,有一些相當受歡迎的研究成果,近年來這些成果通過電視節目「別對我撒謊」變得越來越流行。其中的觀點是面部肌肉能夠被可靠地標記出來,而且面部肌肉能夠顯示出人的表情,從而反映人的感情。人臉大約有28到50個面部動作單元,因此這些面部關鍵點的移動和褶皺向我們反映了肌肉的變化。這樣的信息現在為止還只是低級的,但之後我們會對這些信息進行研究,以尋找抑鬱症、焦慮症或PTSD等病症的指標。

通過與心理醫生們和一些醫療中心,如McLean醫院,的合作,我們收集到了大量的數據。針對抑鬱症,我們有近500個參與者與我們的系統進行交流和互動,當他們與系統交談時我們就對他們的非語言行為進行了分析。因此,我們可以通過對這些數據進行總結和統計,然後觀察參與者的非語言行為與他們的抑鬱程度之間的關聯性,這樣我們就能識別出與抑鬱症最相關的行為指標。從這些參與者的交談數據中,我們得到了大概20個抑鬱症的行為指標,這些行為指標可以作為醫生的診斷參考。

我們希望這些指標最終能用於篩查,但是短期而言,這項技術主要是用於對治療中的患者進行監測。觀察同一個人的行為變化,相比較觀察一個你從未見過的人的行為變化要簡單得多。當你第一次見到一個人,你需要對這個人生成多方面的「標度」,你還需要適應他身上獨有的特質;不過多見幾次面之後,你就能比較容易地察覺到這個人的行為變化了。這能幫助醫生判斷治療進展是否順利,或治療方法是否需要改變。

這項技術的背後其實隱藏者一些人工智慧演算法,它身後的許多技術都是基於人臉檢測的概率圖形模型的。我們最近還對深度學習和神經網路方法進行了更深入的研究。

Medgadget: 你會告訴演算法這些參與互動的人都是精神疾病患者嗎?還是「蒙蔽」演算法,讓計算機自己做出判斷,並且把他們的行為與「正常」行為作對比?

Morency: 在早期,我們有一些調查研究。其中一次調查有500個志願者參與互動,這些參與者不全是醫院的病患。他們被邀請來接受我們的計算機系統的訪問,或者與我們的系統進行交談。在與系統交流之前和之後,參與者們都需要填寫一份關於抑鬱症、PTSD和焦慮症的調查問卷。通過研究我們發現,在這500個參與者中大約有15%-20%出現了抑鬱症的癥狀,出現PTSD癥狀的人數比重與之相當,而出現焦慮症癥狀的比重比前兩者都高。

這樣的研究群體是非常具有代表性的。你可以這樣想,觀察大量的疾病癥狀是相當具有挑戰性的,因為那些抑鬱症非常嚴重的人肯定會被送入醫院;所以我們找的病人都是帶有輕度抑鬱症癥狀的,而不是已經進了醫院的嚴重抑鬱症患者。儘管如此,當我們最近開始研究「自殺意念」時,我們還是與醫院合作了。在與麥克萊恩醫院的合作中,我們才是真正地與病人「共事」。

Medgadget: 您在前面提到了初次見到一個人時的「標度」是一個很重要的因素,尤其是在設定一個度量的基準時。那麼我想知道這些演算法的準確度究竟有多高呢?

Morency: 我們的研究是為了學術目的的。這個軟體的目標並不是診斷抑鬱症,病症的診斷始終都是醫生的職責。我們的這些演算法是作為醫生的決策支持工具的,幫助醫生進行醫療評估。但是從學術的角度來看,我們確實想弄清楚這些行為標記與醫生評估的關聯程度。通過研究,我們已經發現了大約78%的關聯度。因此關聯度雖然不是百分之百,但我們的數據卻是非常重要的。我們的研究方向是肯定正確的!同樣值得關注的是,當我們有了一個確定的病人訪談風格后,這些演算法才是最有效的。開放式的問題能幫助我們將這些「非語言線索」集合。我們想要的是那些能揭露患者情緒和記憶的問題,當醫生在問這些問題的時候,我們就能得到其中的關聯性了。

Medgadget: 您對這項技術在醫療領域的前景有什麼展望呢?這項技術現在處在什麼階段?將來會發生那些變化呢?

Morency: 這項技術在早期主要是關注抑鬱症、PTSD和焦慮症的篩查工作;但隨著技術的不斷成熟,我們希望能將其用於精神疾病的治療。我們正在與麥克萊恩醫院密切合作研究醫院中的病患;我們現在還在尋找一個精神疾病(包括精神分裂症和雙向情感障礙)患者群體,觀察他們的「行為標記」。我們希望能夠更好地識別出精神疾病的具體類型,然後向醫生提供實時的反饋。

Medgadget: 還有其他因素會影響到這些視覺性的「生物行為標記」的評估嗎?您提到了「視覺性非語言」的方面,那您有沒有考慮到「語言性」或「行為」方面的因素呢?

Morency: 既然我們現在已經從「非語言線索」中得到了這些可靠的結果,那麼我們下一步就是要研究「語言」方面的因素以及他們談話的具體內容。在研究中,我們非常關注病人在交談中所使用的辭彙和語法,以及辭彙和語法的變化。之前的一些研究已經發現了精神分裂症與語言用法相關的跡象,但我們現在還是要非常關注這些語言用法,因為「非語言行為」只有被「語境化」成為「語言行為」時才更容易被理解。只有在親眼看到的情況下,你才能更好地解讀一個人的動作和面部表情。因此,我們希望我們的演算法能夠做到這個「多模態分析」。

Medgadget: 說的很有道理!這就像你在開著聲音看電視劇的時候,絕對會比靜音看要好得多。

Morency: 沒錯!我們早期的工作是只使用視頻的。令人驚訝的是,我們竟然在靜音模式還能得到這樣的「行為指標」。所以加入了「語言線索」后,我們現在期待著更加有力的指標。

Medgadget: 您在前面提到了一些不同的醫療狀況,這些演算法本身會在不同的醫療狀況之前發生改變嗎?

Morency: 你可以把它看成一個「三層問題」。前面兩層能很好地概括不同的群體,其中一層是「單模態」的,幾乎能瞬間感知你對面部表情和延伸的量化;另一層是為進一步的識別整合信息。這兩層似乎對我們的工作十分有幫助,因為我們的服務對象大部分是成年人。我們還對青少年做過一些研究,但是從來沒有針對兒童的調查。因此,我們希望在這一問題上對前兩層做些調整。

最後一層就是對「行為標記」進行檢測,不同的「行為標記」一定是與某些疾病相對應的。我們在研究中確實發現了一些「標記」是抑鬱症和PTSD共有的,但是,大部分「標記」是會變化的。

舉個例子——抑鬱症患者的微笑。我們本以為抑鬱的人比不抑鬱的人笑得更少,但我們在研究的過程中發現,這兩種人微笑的次數相當,但是展現出的笑容卻非常不一樣。那些抑鬱的人的笑容更短暫,幅度更小。他們的微笑似乎是出於禮貌的笑,而非發自內心的。

另一個非常有趣的例子來自「創傷后心理障礙」(PTSD)研究。我們原本以為PTSD患者會展現出更消極的表情,但出乎意料的是,我們並沒有看到非常明顯的消極表情。而當我們將男女分開以後,PTSD男性患者表現出更多的消極神態,相反,女性患者則表現出較少的消極神態。這樣的結果實在是非常有趣,因為這是一種可能建立在社會規範的基礎之上的「特定性別互動」——在美國文化中,男性通常能夠在大眾面前展示消極的表情,而女性一般需要以微笑示眾。

Medgadget: 那麼,考慮到社會規範因素對這些「行為線索」的影響,這些演算法在不同文化中的應用程度究竟如何呢?它是不是與西方社會規範更契合呢?

Morency: 我們希望這些「行為線索」能夠具有強大的概括性,但這幾乎是不可能的,因為社會規範和文化價值的變化是不可避免的。比如,當一個人出現抑鬱癥狀的時候,他就會減少眼神交流;在某些文化價值中,避免眼神交流是尊重的體現。當這兩種情況同時發生時,我們希望這樣的小差別還是能被觀察到的。這正是我們想要測試的內容,也是我們與國際機構合作研究的重點項目。

Morency教授在2015年「世界經濟論壇」上對他的研究進行了介紹

Medgadget: 您做的大部分事情貌似都是在揭露隱藏在人類交流互動背後的情感狀況。您在前面還提到了將這項技術應用於自閉症的治療,您能不能講講這兩者之間的聯繫?

Morency: 一方面,我們希望用這項技術更好地對自閉症進行分類和診斷,這正是我們現在與耶魯大學正在合作的內容。另一方面,我們還希望幫助自閉症患者與他人進行一般交流和互動。我們與南加州大學共同開發了一個系統,這個系統是針對所有人的,對自閉症譜系較低的人尤其適用。系統的目的就是幫助他們在公眾場合講話,進而讓他們能夠在工作面試中更好地展示自己。因此,儘管我們的這項技術主要是應用於醫療領域,但它作為一個訓練系統,還能向病患用戶提供實時反饋。

Medgadget:我偶然發現您還有一篇關於「自殺青少年」的「語音模式」的論文,能給我們講講文章的主要內容嗎?

Morency: 「自殺青少年」研究事實上是另外一個令人驚訝的發現。我們對於研究急診室里那些有自殺傾向和自殺想法的青少年非常感興趣。我們一開始是希望簡單地區分那些「有自殺想法」和「無自殺想法」的青少年。先前的研究表明,語言的使用可以作為一個「標記」。那些有自殺想法的青少年會更頻繁地使用「我」、「我自己」這樣的人稱代詞,因此我們能夠根據這樣的語言使用習慣來區分有無自殺想法的青少年。但是我們真正希望做到的是預測青少年再次自殺的企圖。所以我們在幾周后再次給他們打電話,希望通過他們的聲音和呼吸質量來判斷是否存在再次自殺的企圖。這其實是「反直覺」的,我們認為緊張的聲音和呼吸是再次自殺企圖的一種突出表現。但另外一種可能的假設是,他們已經完全確定了自殺的想法,所以他們的聲音反而是平靜的。

Medgadget: 那麼在未來的十到二十年,您對於這個領域的研究有何展望呢?

Morency: 不論是醫學領域還是技術本身,我們都看到了相當光明的前景。在接下來的五年內,甚至在更短的時間內,我們將會看到更多有效性研究。我們現在在「行為標記」方面已經創造了許多成果,接下來我們還將看到許多成果在不同領域的應用。這項技術還將進入到遠程醫療領域,醫生們並不是總能夠為病人提供實地服務的,所以遠程服務非常有必要,而這也將是我們未來幾年研究的重要內容。

Medgadget: 除了醫療領域外,這項技術還有其他的實際應用?

Morency: 這項技術至少還有兩個實際應用,其一是礦業在線視頻的應用。許多人在網上發布視頻表達自己對各種事情的想法,因此我們的這個「多模態系統」中的一個非常有趣的應用就是將這些視頻匯總起來,並且理解視頻中的內容和表達的想法。除此之外,另一項讓我感到非常興奮的研究是協助在線學習。這是一個非常有潛力的領域,但我們的研究成果並不是全部積極的成果。我們相信這項技術能夠幫助學生完成更高效的遠程學習任務,我們希望遠程的在線合作項目也能享受到「面對面」互動的好處。

熱門推薦

本文由 一點資訊 提供 原文連結

一點資訊
寫了5860316篇文章,獲得23303次喜歡
留言回覆
回覆
精彩推薦