sponsored links

人民中科-自動化所聯合團隊提出計算機生成影象鑑別演算法併發布大規模資料集

前言

由數碼相機拍攝的自然影象(Photographic, PG)能夠準確、客觀地記錄現實生活中的場景,是視覺資訊的重要載體。在我們的日常生活中,自然影象常被用於新聞的準確傳播和證據的有效記錄。計算機生成影象(Computer-generated, CG)具有很強的藝術性和現實感,廣泛應用於影音娛樂活動中。近期,由於計算機渲染技術和生成對抗網路(generative adversarial networks, GAN)的快速發展,計算機生成影象的質量越來越高也越來越逼真,與相機拍攝獲取的真實影象之間的區別越來越小(如圖1)。高質量CG影象一旦被惡意使用,將會帶來嚴重的資訊保安隱患,對現代社會如何看待證據和信任產生巨大影響,例如,利用逼真的CG影象製造的虛假新聞可能會引起群眾恐慌等。因此,研究計算機生成(CG)影象鑑別方法具有重要意義。

人民中科-自動化所聯合團隊提出計算機生成影象鑑別演算法併發布大規模資料集

圖1:自然影象(PG)和計算機生成影象(CG)

01

計算機生成影象資料集

近期,人民中科與中科院自動化所聯合團隊構建了一個包含14萬張圖片的大規模計算機生成影象資料集(Large-Scale CG images Benchmark, NLPR-LSCGB)。相比於現有資料集,NLPR-LSCGB影象資料集具有三方面優勢:

1)資料規模方面:已有資料集規模較小,使得鑑別演算法容易出現過擬合現象,NLPR-LSCGB資料集包含71168張生成影象和71168 張自然影象,比以往的資料集大一個數量級。資料集規模的對比如圖2(a)所示。

2)多樣性方面:已有資料集中CG影象主要來自於單一的3D圖形渲染技術,隨著計算機渲染技術和生成對抗網路的發展,單一的資料來源及場景難以反映實際應用中遇到的生成影象。為了保障資料集的多樣性,我們從245種不同的場景中收集不同的渲染技術生成的計算機影象。

3)類別偏差方面:圖2(b)-(d)展示該資料集中生成影象和自然影象在顏色、亮度、色調和飽和度分佈上都非常接近,說明資料集中的兩類影象在基本影象屬性上具有相近的分佈,減少無關變數對於所訓練模型的干擾。圖3展示了資料集中的部分CG影象。

人民中科-自動化所聯合團隊提出計算機生成影象鑑別演算法併發布大規模資料集

圖2:NLPR-LSCGB資料集統計特徵。(a)NLPR-LSCGB資料集與已有資料集規模大小對比。(b)(c)(d)生成影象和自然影象在色調、飽和度、亮度上的分佈直方圖對比

人民中科-自動化所聯合團隊提出計算機生成影象鑑別演算法併發布大規模資料集

圖3:計算機生成影象(CG)

02

計算機生成影象鑑別模型

基於該資料集,透過大量實驗發現,自然影象和計算機生成影象區別存在於影象的紋理細節中。我們首先透過灰度共生矩陣對生成影象和自然影象進行紋理建模,並提取差異性統計量(dissimilarity)對二者的區別進行定量分析。生成影象在計算機生成的過程中,常常只能計算一定範圍內的畫素相似性,難以完全模擬出自然拍攝影象特有的豐富紋理,表1反映自然影象差異性統計量在不同距離尺度上均大於生成影象,說明自然影象在不同尺度上具有更強的紋理對比度,印證了生成影象和自然影象在紋理上存在統計意義上的差別。

人民中科-自動化所聯合團隊提出計算機生成影象鑑別演算法併發布大規模資料集

表1 生成影象和自然影象在不同尺度上的差異性統計量對比

基於該發現,我們進一步提出了一種多尺度紋理感知的計算機生成影象鑑別模型(圖4)。該模型首先基於影象特徵之間的相關性進行紋理增強,再透過GRAM矩陣進一步提取紋理特徵,然後將多個紋理提取模組應用於特徵提取網路的不同層以提取多尺度紋理特徵。最後基於多尺度紋理特徵進行計算機生成影象的判別。

人民中科-自動化所聯合團隊提出計算機生成影象鑑別演算法併發布大規模資料集

圖4:多尺度紋理感知模型

03

驗證結果

為了驗證演算法的有效性,我們在已有資料集及提出的NLPR-LSCGB上與現有的鑑別演算法進行對比。表2展示不同演算法在不同資料集上的鑑別準確率,已有資料集(Rahmouni、Columbia、Tokuda、SPL),我們的方法準確率超過96%,均優於其他已有演算法。在難度更大的NLPR-LSCGB資料集上,我們的方法準確率仍然能夠達到91.45%,充分體現演算法的有效性。

人民中科-自動化所聯合團隊提出計算機生成影象鑑別演算法併發布大規模資料集

表2 不同演算法在不同資料集上的鑑別準確率

實際應用場景中,影象往往經過不同程度的擾動或者後處理,因此,生成影象鑑別演算法的魯棒性同樣是一項重要需求。我們測試了鑑別演算法的鑑別準確率與各種擾動強度的關係,包括JPEG壓縮、縮放、均值濾波、高斯噪聲等,表3展示魯棒性實驗結果。所有方法在影象受到干擾的情況下均出現了鑑別效能的下降,但是我們的演算法在多種干擾下仍然表現出優於其他演算法的鑑別能力。在多個場景下達到85%以上的準確率(JPEG90:86.02%,Upscale20%:89.01%,Downscale20%:87.76%,Noise:85.76%),展現該演算法較好的魯棒性。

人民中科-自動化所聯合團隊提出計算機生成影象鑑別演算法併發布大規模資料集

表3 魯棒性實驗結果

相關工作Robust Texture-aware Computer-generated Image Forensic: Benchmark and Algorithm於2021年10月發表於IEEE Transactions on Image Processing(TIP)期刊。

論文連結:

https://ieeexplore.ieee.org/abstract/document/9559870

資料庫連結:

https://github.com/wmbai/LSCGB

免責宣告:文章及圖片轉載自人民中科,版權歸原作者和原出處所有,所發內容僅作分享之用,不代表本平臺立場。有事請聯絡人民產經觀察郵箱[email protected]

分類: 科技
時間: 2021-10-11

相關文章

人民中科董事長、中國科學院自動化研究所研究員李兵:人工智慧對文化產業生產模式和生產正規化帶來巨大改變

人民中科董事長、中國科學院自動化研究所研究員李兵:人工智慧對文化產業生產模式和生產正規化帶來巨大改變
9月17日下午,2021世界計算大會專題活動--第二屆"馬欄山杯"國際音影片演算法大賽頒獎盛典暨高峰論壇圓滿舉行.人民中科董事長,中國科學院自動化研究所模式識別國家重點實驗室研究員 ...

數學科學學院林偉團隊提出複雜時空系統節律調製的方法和理論

數學科學學院林偉團隊提出複雜時空系統節律調製的方法和理論
近年來,生物節律被證明與人類的健康息息相關,受到了越來越多科研人員的重視,2017年諾貝爾生理學或醫學獎還授予了生物節律開創性的工作.除了人們熟知的晝夜節律(週期約24小時),生物體內所展現的其他有節 ...

OPPO提出自監督深度估計算法,比肩有監督,泛化效能更佳

OPPO提出自監督深度估計算法,比肩有監督,泛化效能更佳
機器之心專欄 作者:OPPO TECH 室內環境的自監督深度估計向來比室外環境更具挑戰性,OPPO提出了一種新穎的單目自監督深度估計模型:MonoIndoor,透過深度因子化模組和殘差姿態估計模組,提 ...

劉文教授團隊在腦膠質瘤“表觀免疫”聯合治療方面取得重要進展

劉文教授團隊在腦膠質瘤“表觀免疫”聯合治療方面取得重要進展
腦膠質瘤是最致命的惡性腫瘤之一,平均生存期只有15個月,臨床上缺乏有效的治療手段.近期,廈門大學劉文教授團隊在Molecular Therapy期刊上發表題為 BRD4 inhibition boos ...

朱德不愧是我們人民的好領導,看他為我們人民提出的致富經

朱德不愧是我們人民的好領導,看他為我們人民提出的致富經
一 朱德作為黨和國家的主要領導人之一,時刻關心著人民的疾苦,大力主張要讓人民富裕起來,強調黨和國家要把經濟建設的出發點和落腳點放在提高人民生活水平上面. 早在1947年12月,在聽取中共晉察冀中央分局 ...

讓計算機像人類大腦一樣認知思考?看類腦計算有多強大
北京時間2020年10月14日23時,清華大學計算機系張悠慧團隊和精密儀器系施路平團隊與合作者在<自然>(Nature)雜誌發文,首次提出"類腦計算完備性"以及軟硬體去 ...

望遠鏡團隊拍下黑洞第一張照片
對於人類而言,視覺資訊有著強大的力量.當伽利略將望遠鏡指向天空,地心說的根基便開始動搖:當列文虎克將顯微鏡對準水滴,微生物的世界首次向人類敞開.如今,事件視界望遠鏡(EHT)合作組織剛剛拍下黑洞的第一 ...

中科院楊亞鋒團隊:粉體包覆改性技術 加速3D列印複合材料發展

中科院楊亞鋒團隊:粉體包覆改性技術 加速3D列印複合材料發展
為助力優質專案市場推廣,促進科技成果產業化.市場化,中科智匯工場聯合媒體發起以"挖掘發展潛力,見證企業成長"為主題的<見證>企業專訪活動,講好科學家的故事,傳播創新專案 ...

瞭望 | 在“看見”大腦這一世界級工作中,這支團隊全球領先10餘年——專訪中國科學院院士、海南大學校長駱清銘

瞭望 | 在“看見”大腦這一世界級工作中,這支團隊全球領先10餘年——專訪中國科學院院士、海南大學校長駱清銘
中國科學院院士.海南大學校長駱清銘 以工業化的方式大規模.標準化地產生資料並繪製腦圖譜,將改變神經科學已有的研究方式 "全腦介觀神經聯接圖譜"大科學計劃目前已凝練了攻關研究方向,提 ...

Google釋出帶有 AIST++ 的人工智慧,可以利用不同的音樂生成3D舞蹈

Google釋出帶有 AIST++ 的人工智慧,可以利用不同的音樂生成3D舞蹈
Google釋出的一款人工智慧,可以利用不同的音樂生成不同的3D舞蹈影片 舞蹈是幾乎在所有文化中都能找到的通用語言,也是當今許多人用來在當代媒體平臺上表達自己的一種方式.透過組合與音樂節拍一致的運動模 ...

五連發!這個山農團隊在農藥領域連續取得突破!

五連發!這個山農團隊在農藥領域連續取得突破!
提高農藥利用率和環境安全性是當前農藥科學使用的重要研究導向,更是實現我國農藥零增長目標和落實農業可持續發展戰略的重要技術保障.植物保護學院劉峰和慕衛教授團隊基於現有農藥品種,深入開展劑型加工與施藥技術 ...

重構三維植被表型,計算呈現自然之美丨智言智語

重構三維植被表型,計算呈現自然之美丨智言智語
編者按: 智顯未來,洞見新知.中科院之聲與中國科學院自動化研究所聯合開設"智言智語"科普專欄,為你介紹人工智慧相關知識與故事,從最新成果到背後趣聞,帶你徜徉AI空間,看人工智慧如何 ...

數字化轉型之下家居建材市場規模超4萬億,工業軟體建模產品市場潛力成企業成長關鍵
一直以來,在工業領域的新一輪產業技術變革中,工業軟體倍受關注.而目前國產工業軟體自主替代已成為工業領域改革中最重要的課題,但家居行業中的工業軟體變革卻略顯遲緩. 事實上,家居行業一直面臨著生產端供應鏈 ...

中國文旅深度觀察(一)|“曲江模式”成功後的近慮與遠憂

中國文旅深度觀察(一)|“曲江模式”成功後的近慮與遠憂
[編者按] 一個文旅專案影響一座城. 艾瑞諮詢釋出的資料顯示,目前全國有22個省份提出特色小鎮建立計劃,總規劃數量已超過1500個.有分析認為,2017年.2018年是文旅專案的簽約.立項和建設高峰期 ...

高層出手,釋放五大訊號!有房沒房別愁了

高層出手,釋放五大訊號!有房沒房別愁了
隨著城鎮化建設的逐步完善,穩地價.穩房價.穩預期的政策也越來越深入人心.在堅持房子是用來住的不是用來炒定位指導下,房地產調控目標也越來越明確.最近,國家已經下定決心,嚴控高房價,嚴打炒房行為.從上到下 ...

44種模型,RobustART評測CNN、Transformer、MLP-Mixer誰最魯棒?

44種模型,RobustART評測CNN、Transformer、MLP-Mixer誰最魯棒?
機器之心專欄 北京航空航天大學.商湯科技.京東探索研究院等 來自北航.商湯科技和京東探索研究院等機構的研究者提出了第一個在大規模資料集 ImageNet 上面向模型結構和訓練技巧且針對多種噪音型別的模 ...

登上央視,撒貝南點贊!天津大學研發智慧住宅,能自行發電!將亮相冬奧會!

登上央視,撒貝南點贊!天津大學研發智慧住宅,能自行發電!將亮相冬奧會!
你是否想過這樣的生活:當你踏進家門卸下一天疲憊,手機一鍵設好燈光空調模式,溫度亮度都很舒服.屋內木色環繞,綠植盎然.孩子睡得香甜,你也不必擔心老人行動不便,安全扶手和警報器是家的一部分--天津大學聯隊 ...

又登《自然》,南科大近期科研成果一覽

又登《自然》,南科大近期科研成果一覽
南科大國際研究團隊在<自然>雜誌上釋出觀測到原子手性超流的重大研究成果 南方科技大學物理系副教授.量子科學與工程研究院創始研究員許志芳領導的團隊與南科大量子科學與工程研究院和美國匹茲堡大學 ...

專訪廣東省肺癌研究所周清教授:高質量IRC服務助力頂級科研成果產出

專訪廣東省肺癌研究所周清教授:高質量IRC服務助力頂級科研成果產出
*僅供醫學專業人士閱讀參考 IRC正在成為越來越多高質量臨床研究的標配. "高質量發展"是十四五規劃的核心命題之一,而在醫學領域,已有一批研究者為之奮鬥多年. 8月12日,廣東省人 ...