選自Google AI Blog
作者:Po-Hsuan Cameron Chen、Maggie Demkin
機器之心編譯
編輯:陳萍
本文中,來自谷歌、 希伯來大學、 MIT 等機構的研究者提出了一種新的分類器視覺化解釋方法 StylEx,該方法能以不同方式修改影象屬性來更改其分類器輸出。
神經網路可以非常出色地執行各種任務,但它們是如何做出決定的呢?例如,在影象分類任務中,模型是如何確定一張影象屬於這一類而不是屬於另一類,這通常是一個謎題。解釋神經網路如何做決策的過程,可能會在某些領域產生重大的社會影響,例如醫學影象分析和自動駕駛。
以前對分類器進行視覺解釋的方法(例如注意力圖 Grad-CAM)),會強調影象中的哪些區域對分類有影響,但這些方法並沒有解釋這些區域中的哪些屬性決定分類結果:例如是顏色、形狀,還是其他的屬性決定模型進行這樣的分類。另一類方法是透過在一類和另一類之間平滑轉換影象來提供解釋(例如 GANalyze)。然而,這些方法傾向於一次性改變所有屬性(例如顏色、形狀),因此,很難隔離單個屬性帶來的影響。
去年,來自谷歌、 希伯來大學、 MIT 等機構的研究者提出了一種新的分類器視覺化解釋方法,相關論文被 ICCV 2021 接收。他們提出了 StylEx ,可以自動發現和視覺化影響分類器的解耦屬性(disentangled attributes)。StylEx 允許透過單獨操作這些屬性來探索單個屬性的影響(也就是說,更改一個屬性不會影響其他屬性)。StylEx 適用於廣泛的領域,包括動物、樹葉、面部和視網膜影象。該研究結果表明,StylEx 找到的屬性與語義屬性非常吻合,可以生成有意義的特定於影象的解釋,並且在使用者研究中可以被人們所解釋。
- 論文地址:https://arxiv.org/pdf/2104.13369.pdf
- 論文主頁:https://explaining-in-style.github.io/
訓練 StyleGAN 來解釋分類器
解釋貓和狗分類器:StylEx 提供了可以解釋分類的 top-K 個解耦屬性。移動每個旋鈕可以操作影象中的相應屬性,同時保持圖形的其他屬性不變。
例如,要了解給定影象上的貓與狗分類器,StylEx 可以自動檢測解耦屬性,並可視化操作每個屬性如何影響分類器機率。然後使用者可以檢視這些屬性並對它們所代表的內容進行語義解釋。例如,在上圖中,可以得出狗比貓更容易張開嘴(上圖 GIF 中的屬性 #4)、貓的瞳孔更像狹縫(屬性 # 5),貓的耳朵不傾向於摺疊(屬性 #1),等等。
下面的影片提供了該方法的簡短說明:https://v.qq.com/x/page/m3319c0g8zd.html
給定一個分類器和一個輸入影象,該研究希望找到並可視化影響其分類的各個屬性。研究人員採用了可以生成高質量影象的 StyleGAN2 架構,整個過程包括兩個階段:
第一階段:訓練 StylEx
論文《StyleSpace Analysis: Disentangled Controls for StyleGAN Image Generation》中的研究表明,StyleGAN2 包含一個名為「StyleSpace」的解耦潛在空間,其包含訓練影象的單個語義屬性。該研究訓練了一個類似於 StyleGAN 的生成器來滿足分類器需求,從而可以使 StyleSpace 適應分類器特定的屬性。
StylEx 透過使用兩個附加元件訓練 StyleGAN 生成器來實現。第一個是編碼器,它與具有 reconstruction-loss 的 GAN 一起訓練,並強制生成的輸出影象在視覺上與輸入相似,從而允許生成器應用於任何給定的輸入影象。然而,僅僅只有影象的視覺相似性是不夠的,因為它可能不一定捕獲對特定分類器(例如醫學病理學)重要的細微視覺細節。
為了確保這一點,該研究在 StyleGAN 訓練中添加了一個 classification-loss,它強制生成影象的分類器機率與輸入影象的分類器機率相同。這保證了細微視覺細節(例如醫學病理學)包含在生成的影象中,這對分類器來說是很重要的。
訓練 StyleEx:聯合訓練生成器和編碼器。在生成影象和原始影象之間應用 reconstruction-loss,以保持視覺相似性。在生成影象的分類器輸出和原始影象的分類器輸出之間應用 classification-loss,以確保生成器能夠捕獲對分類很重要的細微視覺細節。
第二階段提取解耦屬性
訓練完成之後,研究者在經過訓練的分類器的 StyleSpace 中搜索顯著影響分類器的屬性,他們對每個 StyleSpace 進行操作並測量其對分類機率的影響。對於給定的影象,研究者尋找對影象分類影響最大的屬性。這一過程可以找到 top-K 個特定影象屬性。對每個類的影象重複這個過程,可以進一步發現特定類的 top-K 屬性,這個端到端的系統被命名為 StylEx。
影象特定屬性提取的視覺化說明
StylEx 適用於各種領域和分類器
StylEx 適用於各種領域和分類器(二元和多類),下面是感知性別分類器展示的 top-4 屬性。
對於性別分類器,以下是每個分類器檢測到的前四個屬性。對於每個屬性,該研究在源影象和屬性操作影象之間進行變換。屬性(例如鬍子、眉毛等)對分類器機率的影響程度顯示在每個影象的左上角。
感知性別分類器 Top-4 屬性
感知年齡分類器 Top-4 屬性
StylEx 揭示了給定分類器可以從資料中學會利用影象不同屬性,這些屬性可能不一定代表現實中類別標籤(例如年輕或年長)之間的實際物理差異。特別是,這些檢測到的屬性可能會揭示分類器訓練或資料集中的偏差。StylEx 可以進一步用於提高神經網路的公平性,例如,透過增加訓練資料集的示例來補償 StylEx 方法揭示的偏差,有針對性的進行補償。
對於分類嚴重依賴精細細節的任務,將 classifier loss 新增到 StyleGAN 訓練中至關重要。舉例來說,在沒有 classifier loss 的情況下,在視網膜影象上訓練的 GAN 不一定會產生與特定疾病對應的精細病理細節。而新增 classification loss 使得 GAN 生成這些微妙的病理,作為分類器的解釋。下面以視網膜影象分類器(DME 疾病)和不健康 / 健康樹葉分類器為例。StylEx 能夠發現與疾病指標一致的屬性,例如視網膜的「硬滲出物」。
視網膜影象 DME 分類器的 Top-4 屬性
不健康 / 健康樹葉影象 Top-4 屬性
特定於鳥的分類器(200 個類),事實上 StylEx 檢測到與 CUB(鳥類資料集) 分類中的屬性相對應的屬性
原文連結:https://ai.googleblog.com/