Zi 字媒體

解碼大腦：科學家正用機器學習研究人類智能

2021/12/25

yidianzixun

過去幾年中，Jack Gallant 的神經科學實驗室已經發表了一串聽起來有些荒誕的論文。

2011年，實驗室證實，僅通過觀察人類觀影時的腦部活動，就可能再造電影片段。某種意義上，掃描觀影人大腦再用計算機生成這部電影就像是讀心術。類似地，2015年，這個團隊通過觀察人類大腦活動成功預測了被試腦中勾勒著的名畫。

2016年，該團隊在《自然》上發表了著名論文，宣布畫出一萬多個單個語詞在大腦中的位置地圖——方法是讓被試收聽podcast節目。（Nature封面：神經科學家成功繪製大腦語義地圖，解讀人類思想邁出關鍵一步）

他們怎麼做到的？研究人員使用了機器學習工具——一種人工智慧——挖掘海量大腦數據、找到了大腦活動模式、預測人類感知。

不過，他們的目標並不是要打造一台讀心機器。神經科學家對盜取藏在腦中的密碼不感興趣，也對那些見不得光的秘密不感冒。他們的目標更加遠大。將神經科學轉變為一種「大數據」科學，使用機器學習挖掘數據，Gallant和該領域的其他科學家有可能革新我們對大腦的理解。

畢竟，人類大腦是宇宙中已知的最為複雜的東西，人類幾乎搞不懂它。Gallant實驗室的雄心——讓神經科學擺脫不成熟階段——或許可以打造出一台為我們解讀大腦的機器。如果可以解碼極端複雜的大腦模式，就有可能找出修復大腦的辦法（當大腦深受疾病之苦時）。

MRI——我們用來窺探和分析大腦功能及其解剖學的工具——誕生於上世紀九十年代，效果透光不均勻。為了讓效果透視化，fMRI能夠觀察到的腦部活動最小單元到了體素（voxel）層面。這些體素通常小於1立方毫米。而一個體素中可能有10萬個神經元。德克薩斯大學的神經科學家Tal Yarkoni告訴我，fMRI「就像飛過城市，找到哪裡亮著燈。」

傳統的fMRI成像可以呈現出對某個行為至關重要的廣闊區域在哪裡——比如，你可以看到大腦哪裡處理負面情緒或者當我們看到熟悉面孔時，哪裡會亮起來。

但是，你無法確切知道這個區域在行為中扮演什麼樣的角色，或者其他不那麼活躍的區域是否也扮演著重要作用。大腦不是樂高玩具，每塊玩具都有著特定的功能。大腦是一張活動之網。Gallant說，「每個大腦區域會有50%的可能與大腦其他區域連接起來。」

這就是為什麼簡單的實驗——識別「hunger（飢餓）」或者「vigilance(警覺）」所在大腦區域——無法真的得出讓人滿意的答案。

美國國家精神健康研究院（National Institute of Mental Health）fMRI部門負責人Peter Bandettini告訴我，「過去十五年中，我們一直研究這些一團一團東西的活動。結果，每一團中細微差別、每一次波動的細微差別都包含著大腦運動的信息，而我們無法真正挖掘出來。這也是我們需要這些機器學習技術的原因。我們可以看到一團團的東西，卻識別不出模式，因為這些模式太複雜了。」

舉個例子。大腦如何處理語言？傳統的看法是活動發生在左半球的兩個特定區域——布洛卡區和威爾尼克區域——這是語言活動的中心區域。如果它們受損，人就會失去語言能力。不過，Gallant實驗室的博士后Alex Huth最近發現，這個觀點太過簡單。他想知道整個大腦是否都與語言理解相關。

實驗中，他請幾個被試聽兩個小時的故事節目The Moth，與此同時，同事們用fMRI掃描儀記錄被試大腦活動。他們想要將大腦不同區域與所聽到的單個語詞關聯起來。

實驗產生了很多數據，人力很難處理。Gallant說。但是，可以訓練計算機程序尋找數據中的模式。因此，Huth設計了可以揭示出語義地圖的程序，地圖顯示出每個語詞所在大腦區域。

「Alex的研究表明，語義理解需要動用大腦的大部分區域，」Gallant說道。Alex同時也展示了意義相似的單詞（如poodle和dog）在大腦中的刺激到的位置彼此靠近。

這個研究的意義何在？在科學里，預測就是力量。如果科學家可以預測讓人眼花繚亂的大腦活動是如何進行語言理解的，他們就可以受此啟發構建更高效的模型。而一旦新的模型被建立起來，他們就可以更好地認識變數改動后的情況——大腦出現病變時。

什麼是機器學習？

「機器學習」是一個內容廣泛的概念，包含了各類演算法與系統。機器學習目前已經被大量應用到消費級產品中去了——例如讓計算設備學會識別圖片中的物體，其準確程度堪比人類。機器學習的一個分支「深度學習」是最近最為引人注目的辭彙，這種技術已經讓谷歌的翻譯服務從生硬的單詞翻譯進化到可以把海明威的著作翻譯成各國語言，同時保留原作風格的水平。

在最基本的層面上看，機器學習程序需要先使用數據集進行「訓練」。在訓練中，程序會在數據中尋找模式。通常來說，訓練越多的數據，系統就會有更好的表現。一旦經過訓練，在遇到同類型的數據之後，系統就可以展開預測了。

最常見的例子就是電子郵件中的垃圾郵件過濾程序。機器學習通過掃描足夠數量的垃圾郵件，學習其中內容的特性，從而在收到新的郵件時幫你進行分析和攔截。

機器學習可以是非常簡單的程序，僅僅進行數學回歸運算（這只是中學數學知識，比如從一些已知條件中算出一條線段的斜率）；也可以是非常複雜的系統，就像谷歌DeepMind，經過了數以百萬條數據的訓練，從而在圍棋上打敗人類世界冠軍（圍棋的棋局變化數量超過了宇宙中所有原子的數量）。

神經科學家正在使用機器學習進行著一些研究。如編碼與解碼。

通過「編碼」，研究人員試圖使用機器學習來預測不同刺激在大腦中造成的影響。

「解碼」則與之相反，通過觀察大腦活動來反推受試者正在思考什麼。（註：神經科學家可以使用不同大腦掃描方式為機器學習提供數據，除了fMRI以外還有EEG和MEG等）

俄勒岡大學的神經科學家Brice Kuhl最近使用fMRI數據解碼，重建了受實驗者眼睛里看到的內容。

Kuhl通過核磁共振成像研究的腦區一直被認為與人類記憶密切相關。「這個腦區的活動顯示了你所看到物體的細節——或許僅僅是（點亮），因為它是你非常確定的記憶。」Kuhl說道。機器學習程序可以從這個腦區的活動圖像中預測被試者看到的人的面部特徵，這表明這個位置就是「你看到的細節」被處理的地方。

▲第一行是Kuhl研究中的原始面孔；第二行是基於大腦的兩個不同區域中的活動，機器學習進行的猜測，重建遠非完美，但它們表現出了原面部的一些基本細節，如性別、膚色和表情

同樣，Gallant有關藝術作品的實驗揭示了一個關於心靈的小秘密：當我們看到相同物體時，我們會激活大腦中相同的區域。

所有接受採訪的神經科學家們都表示機器學習並沒有徹底改變他們的領域。究其原因——沒有足夠的數據。掃描大腦活動需要花費大量時間，而且價格昂貴。同時，一項研究通常會招募幾十名受試者，而不會有幾百人。

「在20世紀90年代，神經影像學剛剛起飛時，人們關注類層面（category level）的表徵——大腦的哪個部分處理人的面孔（而不是房子和物體），這是大尺度的問題，」匹茨堡大學的神經科學研究院Avniel Ghuman解釋道。「現在我們可以研究很多細節上的問題，比如：這讓他/她回憶起了十分鐘前想到的同一件事嗎？」

「這種進步是革命性的。」Ghuman說道。

神經科學家希望機器學習可以幫助診斷和治療精神障礙

目前，精神科醫生還不能通過讓病人接受fMRI掃描來確定他/她是否患有精神疾病（如精神分裂症）。他們仍然不得不依靠在臨床上與患者進行對話（毫無疑問，這種方式獲得的信息具有很大價值）。但機器學習帶來的新型診斷方法將會讓疾病的診斷更加準確，這無疑會給醫療領域帶來新的進步。為了做到這一點，美國國家精神健康研究院（NIMH）的Bandettini表示，神經科學家們需要獲得10,000份以上fMRI掃描結果的數據集。

機器學習程序可以從精神病人的大腦活動圖像中尋找模式，學會進行識別。「隨後你可以開始把它應用在臨床上，掃描一個病人然後說：基於容量為10,000的數據集的訓練，我們現在可以作出初步診斷，此人患有精神分裂症。」Bandettini表示，現在，這些研究仍然處於初級階段，新的突破還沒有出現。

但是，如果我們理解了大腦中各區域組成的網路是如何工作的，這些方向很快就會轉化為成果。「在未來，我們也許能設計複雜的干預措施在大腦出現病變時進行治療，」MIT計算神經科學家Dan Yamins說道。「也許我們可以把某種植入物放進大腦，用來治療阿爾茨海默病，或者也可以治療帕金森症。」

機器學習還可以幫助精神科醫生預測不同患者的大腦會如何對抑鬱症的藥物治療產生反應。「現在的精神病醫生不得不猜測，從診斷角度來看，哪種藥物可能是有效的，」Yamin說道。「因為有時癥狀並不能說明大腦中發生的一切。」

但Yamin同時指出，這些願景可能很長一段時間都無法實現。很多科學家們現在正在思考這些問題。NeuroImage期刊曾出版過一個專刊登載預測個體大腦差異和神經影像學診斷的論文。

這是非常重要的研究方向，因為當涉及到醫療領域時，預測為治療和預防疾病帶來了新思路。

機器學習可以預測癲癇發作

癲癇病的患者永遠無法得知自己將在何時發病。「這對你的生活來說是致命的——你不能開車，不能正常生活，因為你隨時有可能發病，」國立衛生研究院的神經科學家Christian Meisel說道。「如果擁有一個預警系統，一切都將會不同。」

目前人們對癲癇病的治療方式也不甚完美。一些患者不得不24個小時不斷服用抗驚厥藥物，而這些藥物具有嚴重的副作用。而對於20%-30%的患者來說，沒有任何藥物對他們有效。

用預測來改變這一切。

如果癲癇患者知道癲癇發作即將來臨，他們至少可以提前找到一個安全的地方。預測還可以改變治療方式：提前警告可以告訴患者快速服用癲癇藥物，或發送電信號以阻止其即將出現的發作。

這是一個EEG——腦電圖圖像——Meisel分享了一個癲癇病人的例子。「現在是沒有癲癇發作的情況，」Meisel說道。「問題是，這種情形距離發病有一小時還是四個多小時？」

對於臨床醫生來說，預測是非常困難的，他說，甚至是不可能的。

但關於一場即將發作的癲癇的信息可能隱藏得非常微妙。為了測試這種可能性，Meisel的實驗室最近參加了一個由網路上的數據科學社區中心Kaggle主辦的比賽。Kaggle提供了三位癲癇患者的幾個月和幾年的EEG記錄。Meisel使用了深度學習來分析這些數據並尋找其中的模式。

根據癲癇的前奏的EEG掃描來預測癲癇發作，這能夠做到多好？「如果你有一個可以預測一切的完美系統，你得1分。」Meisel說，「如果你只有一個拋硬幣的隨機系統，你得分0.5。而我們現在的得分是0.8。也就是說我們的系統現在並不能做到完美預測，但卻比隨機好很多。」（這聽起來似乎不錯，但目前這個方法更多還是理論上的，並不實用。這些患者是通過顱內EEG監測的，這是一種侵入式操作。）

Meisel是一位神經學理論學家，繪製了癲癇發作病症如何從小型的神經活動發展成完全的衰竭型行為的模型。他說，機器學習是幫助他改善其理論的有用工具。他可以將自己的理論引入到機器學習模型中，觀察它是否使得系統更具預測性。「如果有效，那我的理論就是正確的。」他說。

從機器學習到真正有用，神經科學將需要變成一種大數據科學。

機器學習並不能解決神經科學領域內的所有大問題。它可能會受限於來自fMRI和其它腦掃描技術的數據的質量。（最好的也就是fMRI繪製出的大腦的模糊影像。）「就算我們有無限的成像數據，你也不能得到完美的預測，因為這些成像流程本身是非常不完美的。」計算機科學家Gael Varoquaux如是說，他已經開發出了一款用於神經科學的機器學習工具包。

但至少我訪問過的神經科學家都對機器學習感到興奮，因為機器學習有利於實現更乾淨的科學（cleaner science）。機器學習解決了所謂的「多重比較問題（multiple comparison problem）」，其中研究者的工作本質上是在他們的數據中挖掘出統計學上顯著的結果（只要有足夠的腦掃描數據，某些地方的一些區域就會「點亮」）。使用機器學習，不管你對大腦行為的預測是否正確，Varoquanx說：「預測是你可以控制的東西」。

大數據的方法也意味著神經科學家可以在實驗室之外開始自己的行為研究。「我們所有的關於大腦活動方式的傳統模型都基於那些人工設置的實驗環境」，Ghuman說，「當涉及到真實世界環境時，我們並不完全清楚它是否還是有效。」如果我們有了關於大腦活動（也許來自可穿戴的EEG監測器）和行為的足夠數據，機器學習就可以開始尋找將這兩者聯繫起來的模式，而不再需要認為設置的實驗。

在神經科學領域使用深度學習還有最後一個可能性，這聽起來很科幻：我們在大腦上使用機器學習來開發更好的機器學習程序。過去十年機器學習領域內最大的進步是被稱為「卷積神經網路」的思想。谷歌就是用這種技術來識別照片中的物體的。這些神經網路基於神經科學的理論。所以，隨著機器學習在理解大腦上做得越來越好，機器學習本身也可以從中學習技巧，從而變得更加聰明。經過這樣改進的機器學習程序又可以繼續研究大腦，讓我們可以更進一步地了解更多神經科學。

（研究人員也可以從機器學習項目中吸取洞見，比如訓練機器學習重現視覺這樣的人類行為的項目。可能在學習這些行為的過程中，這些項目能重現大腦做出行為的方式。）

Varoquanx說，「我不想讓人們認為我們突然開始研發大腦讀取設備，事實不是這樣。我們希望得到更豐富的計算模型，從而更好地理解大腦，這才是我們想要做的。」

桃園 qq 地點貓咪桃園市 taoyuan xuan 根部尾巴有大桃園旅遊景點