編輯/凱霞
傳統的材料設計依賴於人的直覺,但隨著材料化學和加工變得越來越複雜,這變得越來越具有挑戰性。隨著人工智慧發展,生成式深度學習(Generative deep learning)正在推動材料設計領域的一波創新浪潮。
「我們在新聞中聽到了很多關於深度造假的訊息——人工智慧可以生成與真人不相符的逼真人臉影象,」賓夕法尼亞州立大學材料科學與工程系、計算與資料科學研究所助理教授 Wesley Reinhart說。「這與我們在研究中使用的技術完全相同。我們基本上只是將這個人臉影象示例換成高效能合金的元素成分。」
賓夕法尼亞州立大學的科學家,透過對用於超高溫的難熔高熵合金進行案例研究,討論了這些方法的基本操作原理及其相對於合理設計的優勢。初步結果表明,生成模型是一種很有前途的材料設計新方法。
該文章以「Generative deep learning as a tool for inverse design of high entropy refractory alloys」為題,發表在《Journal of Materials Informatics》雜誌上。
鎳基高溫合金因其在高溫下的特殊效能,而成為渦輪機等高溫應用的流行材料系統。然而,當前這一代鎳基元件的執行溫度接近其熔點 (1100 °C),並且內部冷卻通道和傳統熱障塗層等額外的熱管理策略也已達到極限。
耐火合金是有希望的候選者。然而,傳統的難熔合金在室溫下具有低延展性,且容易氧化。為了解決這些缺陷,已經採用了各種各樣的處理技術。其中一種途徑是從難熔元素生產高熵合金(HEAs)。
然而,迄今為止,已經發現的 HEA 效能超過鎳基高溫合金的數量非常有限。因此,使用傳統的試錯法設計滿足這些要求的新 HEA 是一項具有挑戰性的任務。
在這裡,科學家選擇對高熵耐火合金進行案例研究。該文章主要分以下幾部分:
- 首先,討論使用傳統設計方案的挑戰,甚至最近的機器學習方法加速的設計方案,以及生成式深度學習如何提供解決方案。
- 接下來,描述了支援科學家的方法的資料生態系統,並提供了對這些資料進行訓練的生成模型的初步結果。
- 最後,簡要評論了將這些技術應用於材料設計的未來挑戰。
高熵難熔合金的設計
資料驅動的理性設計
在過去十年中,基於熱力學的穩定相預測和評估的相圖計算 (CALPHAD) 方法和密度泛函理論 (DFT) 的第一原理已經成熟,並將繼續為日益豐富的資料生態系統做出貢獻。
豐富的合金相穩定性資料庫可以透過專家直覺或更復雜的數值技術實現合理設計。但是,要透過資料探勘和預測建模軟體使一般科學界可以訪問這些資料,還有更多工作要做。
基於這些豐富的資料集,深度學習等機器學習方法可以用於快速預測假設化合物的性質。此外,可以透過特定材料特性的替代模型來實現有針對性的合金設計。
近年來,HEA 設計尤其受益於資料驅動的建模。各種資料驅動的方法已用於預測 HEA 的穩定相。不幸的是,即使這些前向模型(forward models)取得了成功,傳統的組合候選方法,在物理上不可能完全研究非等原子 HEAs 的情況。
生成式建模
目標是基於最近在依賴隱式特徵學習的其他材料設計環境中使用的端到端 DNN 架構的成功的基礎上。這些模型的核心優勢是能夠學習複雜設計空間的有意義的表示。此外,學習空間是低維且平滑的。
這些模型中最受歡迎的是生成對抗網路(GAN)。該方案允許生成器在沒有太多訓練資料的情況下學習高質量的表示。
走向逆向設計
在 vanilla GAN 中,無法控制生成器產生的輸出,這意味著在找到合適的候選者之前必須抽取許多樣本。然而,這可以在條件 GAN (cGAN) 架構中進行控制,生成器提供了一個額外的條件向量,該向量強制執行潛在空間和所需品質因數之間的對映。透過這種方式,生成器學習了基於合金成分的基礎合金效能資料的機率分佈,因此,從多維分佈中提取的樣本將代表具有可預測效能的可行成分。
圖 1:使用條件生成對抗網路進行材料逆向設計的生成建模示意圖。(來源:論文)
cGAN 方法已在鋁合金設計中得到證明。在這種情況下,在逆問題中使用條件密度估計可以非常有效地探索高維設計空間,從而設計出數十種新的穩定合金。這些模型解決設計問題的成功在很大程度上依賴於可逆性。
值得注意的是,除了 GAN 之外,還有其他生成架構也適用於這個問題,例如條件變分自編碼器 (CVAE)。然而,由於訓練過程固有的噪聲注入,以及對重建誤差的預定義度量的要求,VAE 已被證明產生的結果不如 GAN。
儘管 cGAN 具有優勢,但其難以使用,並且需要進行大量調整才能獲得良好的結果。在訓練過程中必須為條件向量提供合適的分佈,以確保生成器和鑑別器都有機會探索聯合分佈。這些模型也可能遭受梯度消失、收斂問題和模式崩潰。
案例研究:耐火封頭的逆向設計
資料生態系統
任何生成材料設計工作都需要與現有文獻資料和科學技術密切整合,來驗證超出已知集合的生成樣本。科學家透過在本案例研究中建立一個高階資料生態系統來實現這一點,如圖 2 所示。
圖 2:支援逆向設計的資料生態系統示意圖。(來源:論文)
這種以獨特材料的自動識別為中心的安排,允許在資料庫知識的當前狀態下有效且全自動地識別空隙。每當檢測到資料庫中的變化時,例如每當 GAN 設計一種新合金時,生態系統的適當元件就可以動態處理這些空隙。
在本案例研究中,這是透過一個持續執行的雲虛擬機器伺服器透過高吞吐量應用程式程式設計介面連結到資料庫來實現的。
在這個案例研究中,發現元素特性的結構感知線性組合特別有用。然後使用具有各種屬性的無空隙材料資料集來建立生成模型,其中材料用作樣本,相關屬性用於調節模型。使用經過訓練的 GAN,生成新的候選物件,並將其作為需要驗證的新材料上傳回低階資料集。
這種生態系統設計的固有地導致獨立但互動迴圈中的資料流,如圖 3 所示,為設計過程提供了許多好處。最重要的是,它允許文獻、逆向設計和驗證之間的互動完全自動化,確保在任何給定時間,GAN 都在所有可用資料上進行訓練,並在最近的候選選擇上執行驗證。一旦執行,它消除了任何等待階段,從而最大限度地提高給定資源的發現率。
圖 3:生態系統中的四個主要資料流動路徑。(來源:論文)
構建生成模型
收集到足夠的資料集,然後,開始推動資料生態系統的逆向設計元件。為了展示具有所需特性的新型難熔 HEA,使用來自資料庫的 529 個 HEA 文獻衍生組合物訓練基於具有四個完全連線層的簡單前饋神經網路架構的 cGAN 模型。GAN 的對抗性損失相對於其他競爭方法(如 VAE 的重建損失)的一個優勢是目標函式的簡單性。
接下來,將透過實驗或透過其他計算方法驗證生成的材料成分的屬性,例如結合 CALPHAD 模型的 ab-initio DFT 計算,並反饋到資料生態系統中作為 cGAN 的新訓練資料集。此迴圈將確保連續生成新的候選合金,每次迭代都會增加達到目標效能的機率。
科學家首先表明 cGAN 可以學習耐火 HEAs 的潛在分佈。為了評估發生器,考慮了圖 4 中生成的合金成分整體的一些不同測量。雖然可以觀察到一些細微的差異,但發生器似乎已經在很大程度上捕獲了難熔 HEA 的基本定義——例如相關性不同元素之間以及不同組成元素的數量——除了收集合金成分的原始資料之外,我們不需要為模型提供任何指導(例如,設計規則)。
圖 4:真實(頂行)和生成(底行)組合的比較。(來源:論文)
除了生成有效的成分外,還了解了成分和材料屬性之間的聯合分佈。為了評估這一點,科學家根據圖 5 中的參考屬性值繪製了提供給生成器的條件。
圖 5:科學家資料庫中組合物的參考值和 cGAN (A) 剪下模量和 (B) 斷裂韌性值的比較。(來源:論文)
剪下模量近似為元素剪下模量值的簡單線性組合(LC),而斷裂韌度使用萊斯(Rice)模型獲得,由方程給出,
其中 EUSF 是不穩定的堆垛層錯能,G 是沿滑動面滑動的剪下模量,v 是穩定單元參考結構的泊松比。在具有更普遍的訓練資料 (40 GPa < G < 100 GPa) 的區域中有很好的一致性,而觀察較少的外圍區域 (G > 100 GPa) 顯示出較弱的擬合。總體而言,cGAN 模型在大部分資料域中都很好地捕獲了剪下模量和斷裂韌性值。
逆向設計
接下來展示如何使用經過訓練的模型來執行 HEA 組合物對剪下模量和斷裂韌性的逆向設計。透過提供具有所需屬性值的調節向量,生成器可以偏向於可能表現出這些屬性的組合物,如圖 6 所示。研究發現,cGAN 模型選擇合適的元素來生成最接近目標屬性的組合。
圖 6:透過將剪下模量值固定在 (A) 30 GPa、(B) 60 GPa、(C) 90 GPa 和 (D) 120 GPa 生成的剪下模量和斷裂韌性(頂部)和樣品組成(底部)的直方圖。(來源:論文)
雖然圖 6 中的目標 (A-C) 看起來相當匹配,但發電機與 (D) 相抗衡,對應於 120 GPa 的剪下模量。生成器偏向於建立與強加條件匹配的有效組合。因此,生成器依賴於建立具有高於和低於目標的廣泛剪下模量值的組合物以進行補償。
此外,當發生器不要求特定的斷裂韌性值時,增加剪下模量的值自然會導致生成的組合物中的斷裂韌性增加。這兩種特性之間一般相關性的結果如圖 7 所示。因此,cGAN 模型隱式地學習了剪下模量和斷裂韌性值之間的相關性,並傾向於生成具有一致剪下模量和斷裂韌性值的組合物。
圖 7:(A) 實際組合物的剪下模量和斷裂韌性值之間的相關性。a、b、c 和 d 代表四個感興趣的條件情況。(B) 使用面板 (a) 中所示條件生成的組合物的剪下模量和斷裂韌性的直方圖。直方圖中藍色的強度表示具有相應剪下模量和斷裂韌性值的組合物數量較多。(來源:論文)
發現新合金而不是簡單地從已知成分中取樣,通常需要 cGAN 模型能夠生成具有這些屬性相反值的成分(例如,高剪下模量和低斷裂韌性)。科學家生成了一組組合(如圖 8 所示)來評估這種能力,並具有條件向量中指定的兩個屬性。在這些情況下,單一元素的優勢表明生成器依賴於一些具有不尋常屬性的特定元素來實現這些相反的目標。
圖 8:使用圖 7 中指定的條件生成的樣品成分。(來源:論文)
結論和展望
生成式深度學習正在影響一系列科學領域,材料資訊學也不例外。例如,科學家已經展示了使用 cGAN 逆向設計難熔 HEA 的初步進展。從文獻中僅觀察到幾百個 HEA 組合物,模型就能夠捕捉資料中的重要趨勢並重現逼真的組合物。
訓練後的模型具有目標效能的新合金的能力,基於在近似力學效能和生成器使用的潛在程式碼之間的學習相關性。雖然它不能產生完美的匹配,但這種條件會嚴重偏向模型生成的組合型別。
科學家表示:「我們相信這些生成模型是一種很有前途的材料設計新方法,將與更傳統的計算技術結合使用。」
論文連結:https://jmijournal.com/article/view/4294
參考內容:https://techxplore.com/news/2021-11-ai-deepfakes-power-materials.html