search
尋找貓咪~QQ 地點 桃園市桃園區 Taoyuan , Taoyuan

對口型不再是難事,美國總統講話視頻也能被PS

7月18日消息,《大西洋月刊》(The Atlantic)撰文稱,利用華盛頓大學研究人員開發的技術,你可以做出讓肉眼無法分辨真偽的對口型視頻,讓人覺得視頻中的人真的就在說那些話,但實際上並不是。該技術會讓人覺得無法相信自己的眼睛。

以下是文章主要內容:

總統很惱火。

讓他惱火的是媒體,也是他們所使用的技術。電子媒體改變了一切。人們一天到晚都盯著屏幕看。「我從未聽說過或者看見過如此離譜、惡毒的扭曲性報道。」他在新聞發布會上說道。

1973年10月,理查德·尼克松(Richard Nixon)向聚集的記者們表示,電視新聞的時代正在動搖美國人的信心。當時他還不知道自己的總統生涯將迎來災難性的結局。1974年8月尼克松要宣布辭職的時候,他直接對著一台電視攝像機宣布。這段錄像即便是在近半個世紀之後的今天也依然令人震撼——主要是因為那個歷史性的時刻,還因為電視直播的威力。

即使是在互聯網主導的信息時代,視頻也仍然是十分引人注意的媒介形式。特別是在實時新聞多到眼花繚亂的時代,讓人可以通過眼睛看到實況畫面的視頻很有優勢。

又或者說,過往就已經是這樣。

視頻的Photoshop 式技術

在公眾對新聞媒體機構越發不信任之時,進一步模糊人們真偽分辨能力的技術在迅速發展。用在視頻上的令人信服的Photoshop式技術已經到來,其帶來的結果既令人印象深刻,又令人恐懼。

計算機科學家如今能夠製造逼真的嘴唇同步視頻——表面上看,就是讓任何一個人的聲音對上另一個人的口型。

看到上面的那個GIF動圖了嗎?實際上動圖裡並不是巴拉克·歐巴馬(Barack Obama)在說話。它是一個針對歐巴馬的合成視頻,它做得讓人感覺就是他在說話,但實際上那些話來自一個音頻文件。

那段短片出自華盛頓大學的研究人員之手,他們開發了一個演算法來獲取某人說話的音頻,然後將該音頻轉變成一個某人在說那些話的逼真視頻。在下面的視頻中,你可以並排對比一下原創的視頻(確實是歐巴馬本人的評論)和人工生成的視頻。

這技術讓視頻真假難辨 讓人無法相信自己的眼睛

插入視頻

歐巴馬是非常理想的實驗對象,因為網路上他做演講的現成高質量視頻短片簡直多不勝數。為了做出逼真的嘴型效果,研究人員得輸入大量的歐巴馬演講例子——在比較基本的嘴型上疊加那些數據。研究人員使用一種名為遞歸神經網路的人工智慧技術來根據音頻合成嘴型。(這種模擬人腦打造的系統能夠吸收大量的數據和發現模式。遞歸神經網路還被用於臉部識別和語音識別。)他們使用數以百萬計的現有視頻幀來訓練他們的系統。最後,他們將影像合成技術應用於歐巴馬的頭部和軀幹的真實影像,進而讓整個合成影像變得更加平滑。

這些研究人員就這項技術撰寫了一篇論文,他們計劃在下個月舉行的計算機圖形和交互技術大會上介紹他們的研究成果。

該論文的合著者、華盛頓大學計算機科學與工程學院助理教授艾拉·凱梅爾馬赫-席里澤曼(Ira Kemelmacher-Shlizerman)指出,「我們的理念在於,利用該項技術讓人們能夠更好地進行溝通交流。」她認為,該技術可在視頻會議上大派用場——例如,與會者可通過音頻生成逼真的視頻,即便系統的帶寬太低,不足以支持視頻傳輸。最終,該技術可在虛擬現實和增強現實中用作一種遠距傳動形式,讓出現在房間的個人虛擬形象看上去就像是真人一樣,使得親切的人際互動免受時空距離的限制。

「我們不只是在學習如何給Siri賦予一個說話的形象,或者將歐巴馬的聲音用於你的GPS導航,我們還在學習如何捕捉人的音容笑貌。」該研究論文的另一位合著者蘇帕索恩·蘇瓦揚納科恩(Supasorn Suwajanakorn)說道。不出意外,數家大型科技公司已經注意到該項技術:三星、谷歌、Facebook和英特爾均已向該項研究提供資助。研究人員可能想要橫跨人工智慧、增強現實、機器人等領域。「我希望,我們能夠研究這些人類特質,將它們轉移到機器人上,使得它們變得更加栩栩如生。」蘇瓦揚納科恩說。

不過,該技術很顯然可用於騙人。人們現在就已經經常被偽造的照片、社交媒體假冒賬號以及其它的各種數字仿造品矇騙。

想象一下,要是網上出現一個看似很真實的,總統在「說」些他實際上從未說過的話的視頻,會引起多大的混亂。「我確實擔心過這種問題。」凱梅爾馬赫-席里澤曼坦言。但她堅稱,總的來看利還是大於弊。「我認為這是一項技術突破。」

如何判斷真偽

專家們有辦法去判斷視頻是否通過這種技術偽造而成。由於研究人員還是依靠正當的視頻片段來生成嘴唇同步視頻的各個部分,鑒別出被用來做成捏造視頻的那個原創視頻是可行的。

「所以,通過創建網路視頻資料庫,我們能夠通過搜索該資料庫來檢測偽造視頻,看看是否有視頻有著同樣的頭部和背景。」蘇瓦揚納科恩透露,「另一個可讓你看出造假的地方是模糊的嘴巴和牙齒區域。這肉眼可能看不出來,但開發程序來比較要鑒別的視頻和其餘視頻的嘴巴區域模糊性並不難,而且該程序會很好使。」

蘇瓦揚納科恩表示,如果要鑒別的視頻是從多個不同的視頻那裡抽取了一個人兩段或者以上的錄音,該程序也能夠派上用場。這些稱得上有用的防護措施,但該技術在帶來潛力的同時,還是帶來了挑戰。並不是每一個人都懂得如何尋找資料庫和程序來對視頻進行審查——又或者,很多人壓根就沒有想到要質疑一個看上去十分真實的視頻。那些無意間分享錯誤的鑒別信息的人也很可能會加劇人們對專家的不信任。

「我的看法是,人們將會變得不相信視頻,就像我們在知道Photoshop等工具的存在後不相信照片那樣。」蘇瓦揚納科恩指出,「這可能好壞參半,我們必須繼續去尋找更加可信的證據來源。」

但如果你連自己的眼睛都無法相信的話,何談可信性呢?隨著對現實的扭曲變得足夠令人信服,分辨真偽談何容易。



熱門推薦

本文由 yidianzixun 提供 原文連結

寵物協尋 相信 終究能找到回家的路
寫了7763篇文章,獲得2次喜歡
留言回覆
回覆
精彩推薦