網友努力區分複雜的機器生成的臉部影象和實際人類的影象
當抖音影片在2021年大火時,“湯姆·克魯斯”讓硬幣消失的場景,但那是假的,社交媒體平臺上“深度巡航”帳戶的建立者正在使用“深度偽造”技術來展示這位著名演員表演魔術和機器生成版本。
網友說,一種由合成人眼睛的空洞表情引發的令人不安的感覺。但越來越令人信服的影象正在把網友們帶入深層偽造的欺騙世界。
令人震驚的現實主義對惡意使用該技術產生了影響:它可能在虛假資訊運動中為政治或其他利益而武器化,為勒索製造虛假色情片,以及對各種新型虐待和欺詐的複雜操縱。制定識別深層偽造的應對措施已成為安全偵探與網路罪犯和網路戰爭特工之間的“軍備競賽”。
發表在美國國家科學院院刊上的一項新研究衡量了該技術的進展程度。結果表明,真正的人類很容易相信機器生成的面孔——甚至將他們解釋為比真正的文章更值得信賴。加州大學伯克利分校教授Hany Farid說:“我們發現,不僅合成面孔非常現實,而且被認為比真面孔更值得信賴。”這一結果引發了人們的擔憂,即“當這些面孔用於邪惡的目的時,可能會非常有效。”
盧加諾義大利瑞士大學副教授Piotr Didyk沒有參與論文,他說:“我們確實進入了危險的深層偽造世界。”用於生成研究靜止影象的工具已經普遍可用。Didyk認為,儘管建立同樣複雜的影片更具挑戰性,但其工具可能很快就會普及並容易獲得。
該項研究的合成面孔是在兩個神經網路之間的來回相互作用中開發的,例如一種被稱為生成對抗網路的型別。其中一個網路被稱為發電機,產生了一系列不斷髮展的合成面孔,就像學生透過在粗略草稿上逐步工作一樣。另一個網路被稱為識別器,在真實影象上進行訓練,然後透過將其與實際面孔上的資料進行比較,對生成的輸出進行分級。
生成器以隨機畫素開始練習。在辨別者的反饋下,它逐漸產生了越來越逼真的人性化面孔。最終,辨別者無法區分真面孔和假面孔。
在一系列真實影象上進行了培訓,這些影象代表了男性和女性的黑人、東亞、南亞和白人臉,這與早期研究中更常見的白人男性臉部不同。
在彙編了400張與400個合成版本匹配的真實面孔後,研究人員要求315人在128張影象中選擇了真面孔和假面孔。另一組219名參與者在試圖區分面部時,獲得了一些關於如何識別假貨的培訓和反饋。最後,第三組223名參與者每人對128張影象進行了1(非常不可信)至7(非常值得信賴)的可信度評級。
第一組在辨別真面孔和假面孔方面做得並不比擲硬幣更好,平均準確率為48.2%。第二組未能表現出顯著的改善,即使對這些參與者的選擇提出了反饋,也只收到了約59%。團體評級的可信度使合成面孔的平均評級略高於4.82,而真人的平均評級為4.48。
研究合著者Sophie Nightingale說:“我們最初認為合成面孔比真面孔更不可信。”
研究參與者確實以壓倒性多數將一些假相片確定為相片。南丁格爾說:“我們不是說生成的每張影象都無法與真實面孔區分開來,但其中很大一部分是。”
這一發現加劇了人們對技術可訪問性的擔憂,這使得幾乎任何人都有可能建立欺騙性的靜態影象。南丁格爾說:“任何人都可以在沒有Photoshop或CGI專業知識的情況下建立合成內容。”沒有參與這項研究的南加州大學視覺智慧和多媒體分析實驗室創始主任Wael Abd-Almageed說,另一個擔憂是,這些發現將給人留下深度偽造將完全無法檢測的印象。他擔心科學家可能會放棄試圖制定對深層偽造的應對措施,儘管他認為保持對深層偽造的檢測與日益現實主義同步是“只是另一個法醫問題”。
WITNESS是一個人權組織,部分專注於區分深層偽造的方法,WITNESS的專案戰略和創新主任Sam Gregory說:“在這個研究界,對話還不夠,是如何積極主動地開始改進這些檢測工具。”他說,製作檢測工具很重要,因為人們往往高估了他們發現假貨的能力,並且“公眾總是必須瞭解它們何時被惡意使用。”
沒有參與這項研究的Gregory指出,其作者直接解決了這些問題。他說,它們強調了三種可能的解決方案,包括為這些生成的影象建立耐用的水印,“例如嵌入指紋,以便您看到它的生成過程。”
該研究的作者在強調欺騙性使用深層假冒將繼續構成威脅後,得出了一個嚴峻的結論:“因此,我們鼓勵開發這些技術的人考慮相關風險是否大於其好處,”他們寫道。“如果是這樣,那麼我們僅僅因為技術是可能的,就阻止了技術的發展。”