sponsored links

基於Vision Transformer的影片雜湊檢索識別虛假影片

作者 | Doreen

01 介紹

深度學習的飛速發展為影象處理帶來技術突破的同時,也為虛假影象和影片的泛濫創造了條件。

利用深度學習演算法偽造的影象和影片很難用肉眼區分出來,若這些影象和影片被不良分子利用,將對社會和個人造成一定的損失。

因此,尋找一個有效的演算法識別偽造的影象和影片顯得尤為重要。

傳統的虛假影片的檢測方法是利用雜湊演算法進行影象檢索,由於相似影片的雜湊編碼相互聯絡緊密,很難區分出細節部分,這給識別工作造成了較大的困難。

針對這個問題,研究人員提出了利用基於vision Transformer模型的影片雜湊檢索方法有效地識別了影片中的可疑部分。

02 相關工作

目前,鑑定深度學習偽造影片的方式主要有兩類,一類是透過偽造內容和源內容在視覺上的不一致性來區分出可疑部分,另一類是藉助兩者不同的資料特徵來區分出偽造目標。

前一種方法用人眼就能清楚地識別偽造內容,但對於偽造技巧高超的目標,僅憑視覺難以準確地區分出可疑部分。

第二種方法雖不依賴視覺特徵,僅利用資料特徵就能識別高質量的偽造影片,但在一些特殊的情況下很難提供有效的證據證明影片的可疑部分。

因此,將視覺特性和資料結合起來成為研究人員關注的焦點。

基於深度學習模型的影象雜湊網路已經在識別偽造影象中取得了較好的成果,但在影片方面的應用比較少。

因此,作者提出將Vision Transformer模型與影片雜湊檢索法結合起來用於標註影片中的可疑部分。

03 方法

1、訓練影片的雜湊中心

將高維度的資料在漢明空間中轉換成緊湊的二進位制雜湊編碼後可以高效地進行資料儲存和檢索。因此,有效地對影片進行雜湊編碼是影片鑑別的首要條件。

作者首先將1個源影片和一組偽影片送入vision Transformer模型令其生成雜湊中心集。

vision Transformer的結構如圖1(a)所示,包括2個Transformer編碼模組和2個相似的注意力模組分支(即雜湊分支和鑑別器)。

第一個Transformer編碼器主要是對影片的空間資訊進行編碼,第二個模組則是對影片的時間資訊進行編碼。

編碼後的資料透過其中一個分支的tanh函式生成了一個雜湊編碼集並將其二值化為雜湊中心集,如公式(1)所示,z是雜湊編碼的長度,x是雜湊編碼。

基於Vision Transformer的影片雜湊檢索識別虛假影片

相比靜態的影象,影片在隨機載入的過程中生成雜湊中心集比較困難。

為了解決這個問題,作者將模型的輸入調整為1個源影片和2個偽影片。

為了評價雜湊中心集的準確性,作者在另一個分支的鑑別器模組中借用K-means演算法中的損失函式(如公式(2))來衡量每輪訓練後的損失。

基於Vision Transformer的影片雜湊檢索識別虛假影片

其中n是標記為不同標籤的不同種類的樣本數量,m是標記為同種標籤的同一類別的樣本數量,v是雜湊中心,h是雜湊編碼。

該損失函式的設計思想是儘可能擴大不同類別的雜湊編碼差異,同時減小同一類別的雜湊編碼差異。

基於Vision Transformer的影片雜湊檢索識別虛假影片

圖1 ViHash與Generator模組的結構圖(圖片來自論文:Vision Transformer Based Video Hashing Retrieval for Tracing the Source of Fake videos. https://arxiv.org/abs/2112.08117)

2、利用生成器標記影片的可疑部分

使用vision Transformer訓練影片的雜湊中心雖然可以識別出偽造的影片,但雜湊中心缺乏影片的空間資訊,難以標記偽造影片的可疑部分。

因此,作者提出使用Generator模組對偽造部分進行精確定位(即標記可疑部分)。

Generator模組包括一個Encoder和一個Decoder(如圖1(b)所示),兩者分別由4個卷積層組成。

為了進一步強化空間資訊,在這兩者之間加入了兩個Transformer block(結構如圖1(c)所示)。在Decoder模組中,作者使用了上取樣使被標記的可疑部分的細節更豐富。

文中,作者使用了公式(3)描述了被標記的部分。

基於Vision Transformer的影片雜湊檢索識別虛假影片

其中,i是影片的幀數,f是偽造影片,s是源影片,g(x)是一個將每幀影象的畫素對映到0至255之間的函式,λ是一個與影片相關的常量(不同影片的λ不同)。

04 實驗

由於偽造影片的數量有限,作者採用DeepFace-Lab,Faceswap,Faceswap-GAN,Recycle-GAN和ALAE這5種方法生成了一個包含200個影片(一共5558774幀)的DFTL(Deepfake Tracing and Localization)資料集,然後對比ViTHash模型與CSQ方法在檢索相似影片方面的準確率。

為了進一步定位偽造影片的可疑區域,作者採用FGVC、DFGVI、STTN、OPN、CPNET和DVI這6種方法擴充套件了公開資料集DAVIS2016,生成了200個訓練集和100個測試集的偽造影片(一共33550幀),並將Generator模型與DMAC方法進行了對比。

1、雜湊編碼的長度與鑑別準確率的關係

準確的雜湊編碼是識別偽造影片的前提,為了說明雜湊編碼的長度與實驗結果的關係,作者將幾種偽造的影片進行64bit至1024bit的雜湊編碼,並對比了雜湊編碼長度與鑑別結果之間的關係,如表1所示。

基於Vision Transformer的影片雜湊檢索識別虛假影片

表1 雜湊編碼長度與鑑別準確率的關係(表格來自論文:Vision Transformer Based Video Hashing Retrieval for Tracing the Source of Fake videos.https://arxiv.org/abs/2112.08117)

從表1可以清楚地看出,在相同長度的雜湊編碼下,鑑別各類偽造影片的準確率變化不大。

隨著雜湊編碼的長度增加,鑑別準確率也隨之提高。但到了1024bit時,準確率有所下降。

由此可以得出512bit的雜湊編碼是比較合適的選擇。

2、與現有的其他方法的對比

與作者提出的VTL(Video Tracing and Tampering Localization)方法類似,CSQ (Central Similarity Quantization)是透過生成雜湊中心對影象、影片進行檢索。

從表2的結果來看,CSQ在DFTL資料集上對相似影片的鑑別率小於10%,VTL透過對雜湊中心的訓練則能達到98.2%。

在IOU這個指標上,VTL與DMAC方法在DFTL和DAVIS2016-TL兩個資料集上都表現不佳,尤其是在DFTL資料集上,DMAC僅有0.06。

基於Vision Transformer的影片雜湊檢索識別虛假影片

表2 VTL與現有方法的結果對比(表格來自論文:Vision Transformer Based Video Hashing Retrieval for Tracing the Source of Fake videos.https://arxiv.org/abs/2112.08117)

為了進一步視覺化結果,作者展示了DMAC和VTL方法對影片可疑部分的標記影象,如圖2所示。

從圖2中可以清楚地看出兩者在DFTL資料集上都不能有效地提取出可疑目標;在DAVIS2016-TL資料集上,VTL提取的目標比DMAC有更豐富的細節。

基於Vision Transformer的影片雜湊檢索識別虛假影片

圖2 標記幾幀影象的可疑區域(圖片來自論文:Vision Transformer Based Video Hashing Retrieval for Tracing the Source of Fake videos.https://arxiv.org/abs/2112.08117)

05 結論

在傳統鑑偽的基礎上,作者提出了將基於視覺特性和基於資料特性的方式結合起來的VTL方法定位影片的可疑部分。

首先透過ViTHash模型生成影片的雜湊中心,並與源影片的雜湊中心進行對比,鑑別是否為偽造影片。

然後利用Generator模型的卷積模組和Transformer模組進一步強化畫素的空間資訊,將源影片與偽造影片進行精確對比從而找到兩者不同的部分。

透過實驗發現,利用ViTHash+Generator的VTL方法雖然能準確地鑑定出虛假影片,但在標記其可疑部分方面則效果不佳。

為了解決這個問題,可以考慮根據源影片的內容提取特定的特徵對其進行資料增廣,並將其與偽造影片的類似內容進行對比,進而更精準地標記出偽造部分。

參考文獻

1. Vision Transformer Based Video Hashing Retrieval for Tracing the Source of Fake videos. https://arxiv.org/abs/2112.08117

2. L. Yuan et al., "Central Similarity Quantization for Efficient Image and Video Retrieval," 2020 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), 2020, pp. 3080-3089

3. P. Zhuang, H. Li, S. Tan, B. Li and J. Huang, "Image Tampering Localization Using a Dense Fully Convolutional Network," in IEEE Transactions on Information Forensics and Security, vol. 16, pp. 2986-2999, 2021

私信我領取目標檢測與R-CNN/資料分析的應用/電商資料分析/資料分析在醫療領域的應用/NLP學員專案展示/中文NLP的介紹與實際應用/NLP系列直播課/NLP前沿模型訓練營等乾貨學習資源。

分類: 歷史
時間: 2022-01-03

相關文章

為何逼武則天退位扶李顯上位的五位官員無人善終

為何逼武則天退位扶李顯上位的五位官員無人善終
長安四年(704年)十二月,80歲的武則天因病避居迎仙宮. 武則天的病情很嚴重.朝堂無主,宰相也難見女皇.迎仙宮中只有張易之.張宗昌侍奉武則天左右,外人不得入內.史載:"則天不豫.張易之與弟 ...

武則天退位,百官慶祝僅一人痛哭,一年後慶祝的死了痛哭者升官了

武則天退位,百官慶祝僅一人痛哭,一年後慶祝的死了痛哭者升官了
李唐王朝是我國曆史上最為強大的一個時期,尤其到了玄宗時國家達到了巔峰狀態,並建立了世界上最強大的帝國.不過唐朝初年也經歷了不少的風雨,如玄武門兄弟相殘之悲劇,武則天短暫興周代唐等. 武則天是中國歷史上 ...

“酒後頭孢”和“頭孢後酒”,結局大不同!二者相隔多久才安全?

“酒後頭孢”和“頭孢後酒”,結局大不同!二者相隔多久才安全?
"頭孢配酒,說走就走." 這句話聽起來就像一句玩笑話,但現實中就不少人在吃了頭孢後喝酒,或喝酒後吃頭孢,然後猝死了--甚至連醫生自己也沒能倖免. 所以,咱們一定不能小瞧這句話,頭孢 ...

長大後,再看《范進中舉》,才發現范進這個人真不簡單

長大後,再看《范進中舉》,才發現范進這個人真不簡單
中學有篇課文叫<范進中舉>,是從吳敬梓的<儒林外史>中節選的一段.讀書的時候,覺得范進既無能又可憐的窩囊廢,只不過後來碰到好運氣才僥倖中舉罷了. 他從二十歲開始應考,參加考試二 ...

農村女孩留學後失聯,患癌父母苦尋16年才得知:女兒已在海外成家

農村女孩留學後失聯,患癌父母苦尋16年才得知:女兒已在海外成家
我們都知道父母的愛是這個世界上最無私的愛,慈禧太后就曾在自己的詩中感言,"可憐天下父母心",父母為了自己子女能夠更好的發展,往往付出了很大的心血來讓孩子過上更好的生活. 世界上這麼 ...

飛揚跋扈的汪直如何走向失落

飛揚跋扈的汪直如何走向失落
其實,汪直還算不上禍國殃民,所以不至於人人唾罵.遺臭萬年,但他實在是飛揚跋扈,以至於最終走向失落.但是,讓人不解的是,就是這樣一個奸詐的小人,是怎麼一步步登上明朝成化時期特務機構西廠的領導位置的呢?他 ...

李世勣有大恩於武則天,不幸病重身亡後,武則天回報他的方式絕了

李世勣有大恩於武則天,不幸病重身亡後,武則天回報他的方式絕了
"李世勣才智過人,在幷州統兵多年,麾下僚屬不勝列舉,是我朝最會打仗的統帥.但你對他無恩,恐怕難以令他心服,如今我將他貶黜外放,如果他立刻離去,我死之後,你便將他重新召回,以禮相待,委以重任, ...

武則天的一生到底經歷了多少男人?她真的掐死自己親生女兒嗎?

武則天的一生到底經歷了多少男人?她真的掐死自己親生女兒嗎?
中國幾千年的歷史上,皇帝從來都是這個天下的主角,作為封建統治的核心,帝王向來備受天下人的嚮往和推崇. 而幾千年的封建社會中,男人都是佔據絕對主導地位的:而皇帝,基本上也都是以男性為主: 在中國歷史上, ...

武則天背叛李治稱帝,82歲時被迫交出皇位,為什麼卻無人敢動她?

武則天背叛李治稱帝,82歲時被迫交出皇位,為什麼卻無人敢動她?
在中國歷史上,一共出現過三大女強人,分別是呂后(呂雉).武則天和慈禧. 雖說三個人都有自己獨特的一面,但毫無疑問的是,在當時她們都掌握了王朝最高權力.做了一些有助於王朝穩定的事情,也做了一些不利於王朝 ...

武則天當政,為何朝廷上下人才薈集,一點不比唐太宗貞觀時期少?

武則天當政,為何朝廷上下人才薈集,一點不比唐太宗貞觀時期少?
在我國曆史上的三百多個皇帝中,武則天是唯一的一個女皇帝.由於晚年的尊號稱"則天大聖皇帝",故歷史上叫她武則天.武則天原是唐太宗宮中的才女,唐太宗死後當了尼姑,後被唐高宗收入宮內,封 ...

詩歌唐朝李唐21帝王詩(6)——武周聖神武則天
[武則天]公元624年-公元705年),中國歷史上唯一一位女皇帝,尊為武周聖神皇帝.本名武媚娘,即位後改名武曌,取意"日月當空"(有另一種寫法,瞾,取其"雙日當空&quo ...

曹丕篡漢自立後,漢獻帝為什麼不去投奔劉備,繼續當皇帝?

曹丕篡漢自立後,漢獻帝為什麼不去投奔劉備,繼續當皇帝?
公元220年10月,在大臣們的數十次勸進,以及漢獻帝先後4次下詔禪位的情況下,曹丕"萬般無奈"的舉辦了禪讓典禮,登基為帝,正式建立起曹魏政權. 至此,傳承了四百多年的大漢滅亡,漢獻 ...

袁世凱逼溥儀退位時皇室態度如何?清朝的最後一天是怎樣的情形?

袁世凱逼溥儀退位時皇室態度如何?清朝的最後一天是怎樣的情形?
清朝是中國歷史上最後一個封建王朝,1912年2月12日清朝的隆裕太后以年僅6歲的清末帝溥儀名義宣佈清帝退位,也標誌著清朝走向滅亡.在隆裕太后決定宣佈溥儀退位時,清朝皇室的態度也都大不相同,有的堅決不同 ...

李隆基登基後,為何第一時間剷除上官婉兒?文學家:換你也忍不了

李隆基登基後,為何第一時間剷除上官婉兒?文學家:換你也忍不了
"沒有永遠的敵人,只有永遠的利益".歷朝歷代的君王背後無不都是"趨炎附勢之人",他們會假意迎合大勢,也會推翻時局,目的便是除去損害自己利益的敵人. " ...

自從當媽後我成了一個崩潰又快樂的老媽子

自從當媽後我成了一個崩潰又快樂的老媽子
2019年11月我的女兒開心果出生了,她就像我們給她取的小名一樣,總是樂呵呵的,眼神裡都帶著微笑. 開心果小朋友的微笑總是能感染身邊的人 2021年1月可樂弟弟的到來讓這個家更忙碌,也更歡樂. 開心果 ...

為啥大海會漲潮退潮?退潮後海水都去哪了?黑洞:不關我的事

為啥大海會漲潮退潮?退潮後海水都去哪了?黑洞:不關我的事
地球是一個蔚藍色的大水球,它有71%的表面積被海洋佔據,海水量超過13.5億萬立方米,佔了地球水量總量的97%.目前,人類對海底的探索領域僅達5%,海底世界對世人來說仍然蒙著神秘的面紗. 一.海洋的形 ...

考編失敗後,我終於和自己和解了

考編失敗後,我終於和自己和解了
文|白鷺 圖|白鷺 2020年7月,我在廣西壯族自治區百色市結束了最後一場編制考試,之後我把隨身攜帶的學習資料扔在了百色市火車站. 01 2016年我畢業,在那所排不上名號的一專學校,我亦不算差. 和 ...

對越自衛反擊戰:他故意帶著全班曬太陽,越軍發現後趁夜偷襲

對越自衛反擊戰:他故意帶著全班曬太陽,越軍發現後趁夜偷襲
新中國成立之後並不是一直就擁有和平的環境,建國之初曾經進行過抗美援朝,改革開放之初也進行過對越自衛反擊,是很多勇敢的人用鮮血鑄就了我們如今的安穩. 1979年解放軍進入越南境內進行一個月的大規模懲罰性 ...

何叔衡犧牲後:死因27年後才查清,妻苦等至死,3女1兒令人欽佩

何叔衡犧牲後:死因27年後才查清,妻苦等至死,3女1兒令人欽佩
"何鬍子是一條牛,是一堆感情." 這是毛澤東年輕時,評價好友何叔衡的一句話,也是對其性格最準確的概括."何鬍子"是同志們給何叔衡取的綽號,毛澤東一直這樣叫他. ...

1940年軍統女特務冒死救下地下黨,建國後被槍決時反被救一命

1940年軍統女特務冒死救下地下黨,建國後被槍決時反被救一命
說起軍統特務,大家腦子裡首先能想到的是:這些人極其陰險狡詐,善於偽裝.暗殺.獲取情報等工作. 軍統最早建立就是在蔣介石上臺後,由特務頭子戴笠掌管和訓練,巔峰時期的軍統特務總人數高達4.5萬人,在國際情 ...