search
尋找貓咪~QQ 地點 桃園市桃園區 Taoyuan , Taoyuan

人工智慧時代,科研領域都發生了哪些新變化?

尋找新粒子

上世紀80年代末,正當「神經網路」這一術語捕獲了公眾的想象力時,粒子物理學家開始「玩弄」起人工智慧。他們的領域很適合應用人工智慧和機器學習演算法,因為幾乎每項試驗均聚焦於從複雜粒子探測器獲取的不計其數的類似數據中尋找微妙的空間模式,而這正是人工智慧擅長的事情。「我們花了好幾年時間才說服人們,人工智慧並不是一種神秘的把戲。」最早擁抱此項技術的物理學家之一、美國費米國家加速器實驗室研究人員Boaz Klima表示。

粒子物理學家力圖使帶有巨大能量的亞原子粒子相撞以迸發出獨特的新物質微粒,從而理解宇宙的內部運作。例如,2012年,利用全球最大質子對撞機——位於瑞士的大型強子對撞機(LHC)開展研究的團隊發現了預期已久的希格斯玻色子。這是一種轉瞬即逝的粒子,對於物理學家解釋所有其他基本粒子如何獲得質量至關重要。

不過,此類奇特粒子並非自帶標籤。在LHC,幾乎約10億次對撞才出現1個希格斯玻色子。與此同時,它會在十億分之一皮秒內衰變成諸如光子對等其他粒子。為「重現」希格斯玻色子,物理學家必須認出所有那些更加常見的粒子。然而,典型碰撞中產生的成群的不相關粒子使此項工作變得更加艱難。

費米實驗室物理學家Pushpalatha Bhat介紹說,諸如神經網路等演算法擅長從背景中篩選信號。在粒子探測器(一般是由各種感測器構成的巨型筒狀集合體)中,光子通常在被稱為電磁量能器的子系統中創建粒子束。電子和強子也是這樣產生的,但它們的束流和光子稍微有些不同。機器學習演算法通過發現描述束流的多個變數之間的相關性,將它們區別開來。此類演算法還能幫助區分希格斯玻色子衰退產生的光子對。「這是一個公認的大海撈針式的問題。」Bhat表示,「這也是為何我們要從數據中提取儘可能多的信息。」

LHC利用神經網路技術尋找碰撞碎片中新顆粒痕迹

然而,機器學習並未完全佔領這個領域。物理學家仍然主要依靠對基礎物理的理解來斷定如何搜索數據,以尋找新粒子和現象存在的跡象。不過,勞倫斯伯克利國家實驗室計算機專家Paolo Calafiura表示,人工智慧可能正變得愈發重要。到2024年,研究人員計劃升級LHC,從而使其碰撞率提高10倍。Calafiura介紹說,到那時,機器學習將在應對數據洪流時發揮至關重要的作用。

分析公眾情緒

伴隨著每年幾十億用戶以及數千億條Twitter和帖子的產生,社交媒體已將大數據帶入社會科學。同時,心理學家Martin Seligman表示,它還為利用人工智慧收集人類傳播產生的意義創造了史無前例的機遇。在賓夕法尼亞大學正向心理學中心,Seligman同來自「全球福祉項目」的20多名心理學家、內科醫生和計算機專家,利用機器學習和自然語言處理篩選大量數據,以估量公眾的情感和身體健康。

傳統上,這是通過調查實現的。不過,Seligman表示,社交媒體數據「比較低調」、花費較少,而且獲得的數據要高出好幾個數量級。雖然此類數據也很散亂,但人工智慧提供了一種強有力的獲取模式。

在一項最新研究中,Seligman和同事分析了2.9萬名自我評估患有抑鬱症的Facebook用戶更新的內容。利用來自其中2.8萬名用戶的數據,機器學習演算法發現了更新內容中的詞語和抑鬱症水平之間的關聯。隨後,它能僅基於更新的內容,成功估量出其他用戶的抑鬱症水平。

在另一項研究中,該團隊通過分析1.48億條Twitter,預測了縣級心臟病死亡率。事實證明,同憤怒和負面情緒相關的詞語是危險因素。和基於諸如吸煙、糖尿病等10項主要危險因素的預測相比,這項來自社交媒體的預測同實際死亡率匹配得更加緊密。與此同時,研究人員利用社交媒體預測了個性、收入和政治意識形態,並且研究了住院治療、神秘體驗和刻板印象。該團隊甚至利用從Twitter上推斷出的福利、抑鬱症、信任和五大人格特徵,創建了一幅為美國每個縣作出標識的地圖。

「在分析語言及其同心理學的聯繫方面,一場革命正在上演。」得克薩斯大學社會心理學家James Pennebaker表示。Pennebaker關注的並非內容,而是風格。他發現,在申請大學入學短文中虛詞的使用能預測成績。冠詞和介詞象徵著分析性思維並且預示了更好的成績,代詞和副詞象徵著敘事性思維並且預示了較差的成績。Pennebaker還發現了證據,表明1728年的劇本《雙重背叛》的大部分內容可能由莎士比亞撰寫。機器學習演算法基於諸如認知複雜性和罕見詞等因素,將該劇本同莎士比亞的其他作品進行了匹配。「現在,我們可以分析你貼出甚至撰寫的任何內容。」Pennebaker表示,結果是「獲得了關於人們是什麼樣子的愈發豐富的畫面」。

探尋自閉症根源

對於遺傳學家來說,自閉症是一項棘手的挑戰。遺傳定律表明,它擁有強大的遺傳因素。然而,已知在自閉症中起到一定作用的許多基因的變體只能解釋約20%的病例。尋找可能影響自閉症的其他變體,需要從關於2.5萬個其他人類基因及其周圍DNA的數據中搜尋線索。對於人類研究者來說,這是一項艱巨的任務。為此,普林斯頓大學計算生物學家Olga Troyanskaya和紐約西蒙斯基金會取得了人工智慧工具的支持。

Troyanskaya將關於哪些基因在特定人類細胞中活躍、蛋白如何相互作用以及轉錄因子結合位點和其他關鍵基因組特徵位於哪裡的上百個數據集結合在一起。隨後,她的團隊利用機器學習構建了基因相互作用的地圖,並且將已得到確認的較少自閉症危險基因同上百個涉及自閉症的其他未知基因進行了比對,以尋找它們的相似性。此項研究標記了另外2500個可能同自閉症相關的基因。相關成果在去年發表於《自然—神經科學》雜誌。

不過,正如遺傳學家最近意識到的,基因並不是孤立地發揮作用。它們的行為受到上百萬個附近非編碼鹼基的影響。這些非編碼鹼基同DNA結合蛋白以及其他因素相互作用。確認哪些非編碼變體可能影響附近的自閉症基因是一個更加棘手的問題。Troyanskaya的研究所Jian Zhou正在利用人工智慧解決這一難題。

人工智慧工具正在幫助人們解開可能導致自閉症的基因面紗

為訓練程序(一個深度學習系統),Zhou將其暴露在「DNA元件百科全書」和「表觀基因組學路線圖」收集的數據中。這兩個項目對上萬個非編碼DNA位點如何影響附近基因進行了梳理。Zhou利用的系統學習了在評估未知非編碼DNA的潛在活性時應該尋找哪些特徵。

當Zhou和Troyanskaya於2015年10月在《自然—方法學》雜誌上描述了這個名為DeepSEA的項目時,加州大學爾灣分校計算機專家Xiaohui Xie將其稱為「將深度學習應用於基因組學的里程碑」。目前,該研究團隊正通過DeepSEA研究自閉症患者父母的基因組,以期對非編碼鹼基的影響進行排序。

以上內容部分參考自人民網

能讀懂天空的機器學習

今年4月,天體物理學家Kevin Schawinski在Twitter上發布了4個星系的模糊圖片,以及一個請求:其他天文學家能幫助他對這些星系進行分類嗎?同事們紛紛插話說,這些圖像看起來像有點眼熟的橢圓星系和螺旋狀星系。

還有一些天文學家,對有計算思維的Schawinski直接提出了質疑:這些是真實的星系嗎?還是在擬計算機上的相關物理模型?事實上,兩者都不是。在瑞士蘇黎世聯邦理工學院(ETH Zurich)的Schawinski、計算機科學家Ce Zhang以及其他的一些合作者已經用神經網路把物理學研究透了——雖然它對物理學其實一無所知,但它看起來對星系的深度和外觀都了如指掌。

在他的Twitter上,Schawinski只是想看看這個神經網路的創作會「騙」過多少人的眼睛。但他更大的目標是創造出像電影中的技術那樣,可以神奇地削弱模糊監視圖像的技術:一個網路可以使模糊的星系圖像看起來比實際望遠鏡拍攝的更好。這可以讓天文學家從大量的觀察中發現更微妙的細節。 「數千萬甚至數十億美元的經費正在用於研究我們的天空,」Schawinski說。「有了這項技術,我們可以快速提取到更多的信息。」

Schawinski發布在Twitter上的「偽造」是生成對抗網路的作品,這是一種機器學習模型。Schawinski的團隊拍攝了數千個星系的真實圖像,然後將它們降維。接下來,研究人員訓練模型的生成器使圖像翻轉,來通過鑒別器識別。最終,通過大量數據訓練,生成對抗式網路可以比其他技術都能更好的講嘈雜圖片更平滑。

人工智慧可以「知道」一個星系應該是什麼樣子,將模糊圖像(左)轉換成一個清晰的圖像(右)

位於伊利諾伊州Batavia的費米國立加速器實驗室(Fermi National Accelerator Laboratory)的天文物理學家Brian Nord說,Schawinski的方法是機器學習在天文學的應用中特別前衛的一個例子,但它遠非唯一一個。在1月份美國天文學會的會議上,Nord提出了一種機器學習策略來捕捉強引力透鏡:當遙遠的星系的圖像在通往地球的過程中經歷扭曲的時空時,形成了天空中罕見的光線。這些鏡頭可用於測量宇宙中的距離,並發現不可見的質量濃度。

強引力透鏡在視覺上是獨特的,但很難用簡單的數學規則來描述,傳統的計算機很難識別出來,但對人來說其實很容易。 Nord等人意識到,經過數千個鏡頭訓練的神經網路可以獲得和人類似的直覺。在接下來的幾個月中,「實際上,已經有十幾篇論文都在使用機器學習技術來發現強引力透鏡。這已經是一股風潮。」Nord說。

而這只是應用在天文領域的一部分,人工智慧策略提供了一種強大的方法從PB級數據中查找和分類有趣的對象。在這個感慨「OMG,我們有太多數據了「的時代,一個能從中真的能發現有用信息的方式就是AI。

神經網路學習化學合成的藝術

有機化學家是研究逆向工作的專家。就像那些從已經成品的菜肴開始,然後研究如何製作的大師級廚師一樣,許多化學家從他們想要製造的分子的最終結構開始,然後思考如何組裝它。「你需要合適的配料和配方來搭配它們,」德國明斯特大學的研究所Marwin Segler說。他和其他人正在把人工智慧(AI)引入他們的分子廚房。

他們希望AI能夠幫助他們應對分子製造的關鍵挑戰:從數百個可能的構建塊(building blocks)中選擇,以及從成千上萬的化學規則中選擇如何來連接它們。幾十年來,一些化學家煞費苦心地用已知的反應來編寫計算機程序,希望創建一個能夠快速計算出最簡單的分子配方的系統。然而,Segler表示,化學是非常微妙的。用二進位的方式寫出所有的規則是很困難的。

因此,Segler、計算機科學家Mike Preuss還有Segler的顧問Mark Waller,一起轉向了AI。他們設計了一個深層的神經網路程序,從數百萬個例子中學習反應如何進行,而不是在化學反應的硬性規則中進行編程。「你提供的數據越多,得到的結果就越好,」Segler表示。隨著時間的推移,神經網路學會了預測合成中想要的步驟的最佳反應。最終,它想出了自己的方法來從頭開始製造分子。

這三人測試了40個不同的分子,並將其與傳統的分子設計方案進行了比較。他們在今年的一次會議上表示,用傳統的程序,在一個2小時時間成只合成了22.5%的目標分子,而採用AI的方法能在相同的時間內合成95%。Segler不久將搬到倫敦去一家製藥公司工作,他希望用這種方法來改進藥品的生產。

斯坦福大學的有機化學家Paul Wender表示,現在還不知道Segler的方法會起什麼作用。但是Wender也將人工智慧應用到合成中,他認為AI「可能產生深遠的影響」,不僅僅是在已知的分子上,而是在尋找新的方法。Segler補充道,AI不會很快取代有機化學家,因為他們能做的遠不止預測反應如何進行。就像GPS導航系統一樣,AI也許能找到一條路,但它不能自行設計和實現完整的同步。

免費訂閱!

C2

如何加入學會

註冊學會會員:

個人會員:

(c2_china),回復「個人會員」獲取入會申請表,按要求填寫申請表即可,如有問題,可在公眾號內進行留言。通過學會審核後方可在線進行支付寶繳納會費。

單位會員:

(c2_china),回復「單位會員」獲取入會申請表,按要求填寫申請表即可,如有問題,可在公眾號內進行留言。通過學會審核後方可繳納會費。

學會近期活動

1. CICC企業會員交流會

會議時間:(具體時間詳見後續通知)

2.2017首屆全國兵棋推演大賽總決賽

2017年10月

長按下方學會二維碼,關注學會微信

感謝關注



熱門推薦

本文由 yidianzixun 提供 原文連結

寵物協尋 相信 終究能找到回家的路
寫了7763篇文章,獲得2次喜歡
留言回覆
回覆
精彩推薦