編輯/凱霞
奈米多孔材料(NPM)有許多基於吸附的應用,從吸收空氣中的二氧化碳或甲烷,到儲存氫氣作為燃料,再到檢測空氣中的有毒化合物。
這些材料具有微小的奈米級孔隙,可用於許多可持續性應用,但由於它們是由化學家在實驗室中一個分子一個分子地構建的,因此,開發起來既麻煩又昂貴。
華盛頓州立大學和俄勒岡州立大學的一個研究團隊提出利用一種獨特的計算機演算法——貝葉斯最佳化 (BO) ,快速縮小數千種可能的分子設計,以最少的成本和精力找到最佳的設計。並在實驗中得到了證明。此外,與隨機搜尋、進化搜尋和一次性監督學習相比,BO 的搜尋效率更高。
該研究以「Bayesian optimization of nanoporous materials」 為題,於 2021 年 10 月發表在《Molecular Systems Design and Engineering》雜誌上。
論文連結:https://pubs.rsc.org/en/content/articlelanding/2021/ME/D1ME00093D
奈米多孔材料的貝葉斯最佳化
奈米多孔材料的選擇性氣體吸附特性,使其在氣體的儲存、分離、感測方面具有許多應用。例如,金屬有機骨架 (MOF)、金屬有機多面體 (MOP)、共價有機骨架 (COF) 和多孔有機籠(POC)是幾類 NPM。
圖示:COF 的模組化合成。(來源:論文)
「關鍵的挑戰是奈米多孔材料是不同化學元素的混合物,你必須組合這些元素並找出最佳組合。」該研究的第一作者 Aryan Deshwal 說。
電氣工程與計算機科學學院的博士生 Deshwal 說,「奈米多孔材料有各種各樣的潛在分子構建塊和排列,幾乎可以無限地混合。」
「如果我們每次都在實驗室中嘗試這些元素及其結構的新配置,那將是非常昂貴的,因此,計算挑戰是如何找出具有你關心的屬性的元素的正確組合,「Deshwal 說。「這就是我們基於人工智慧的演算法工作的用武之地。」
給定吸附任務,我們經常希望在 NPM 庫中搜索具有最佳吸附特性的 NPM。由於 NPM 合成和氣體吸附測量的高成本,無論這些實驗是在實驗室中還是在模擬中,通常都無法進行詳盡的搜尋。
NPM 研究界採用了多種方法來有效地搜尋 NPM 庫以獲得最佳 NPM。常用的有幾種方法是:監督機器學習模型、遺傳演算法、蒙特卡羅樹搜尋。
在本研究中,研究人員提倡貝葉斯最佳化(BO)以積極有效地搜尋具有給定吸附任務最佳效能的 NPM。
圖示:BO 是一種主動搜尋方法,用於查詢最佳化黑盒目標函式 f(x) 的輸入 x。(來源:論文)
研究發現,只評估候選庫中的一小部分 NPM, BO 就可以找到最佳 NPM。在特定任務的 NPM 設計中採用 BO 將透過 (1) 加快其進度、(2) 減少基礎設施需求和 (3) 降低成本來影響 NPM 的發現和部署。
作為概念驗證研究的一部分,研究人員透過使用 BO 搜尋約 70 000 個假設共價有機框架(COF)的開放資料庫,來找到具有最高模擬甲烷輸送能力的 COF,來證明 BO。BO 找到最優 COF,且在僅評估 140 個 COF 後,就獲得了排名前 100 個 COF 中的 30%。
圖示:與隨機搜尋、進化搜尋和一次性監督學習相比,BO 的搜尋效率。(來源:論文)
結果表明,與隨機搜尋、進化搜尋和一次性監督學習相比,BO 的搜尋效率更高。
BO 演算法表現良好的原因之一,是它查看了材料本身的三維結構。
Deshwal 說:「我們正在嘗試進行更智慧的搜尋,現有的方法並未嘗試利用材料結構與其特性之間的關係模型。」 「我們明確地建立了統計模型,這使我們能夠預測未知材料的屬性,並具有經過良好校準的不確定性,這意味著你知道你不知道的事情,因此,當我們探索空間時,我們以更聰明的方式探索,而不是隨機的。」
進一步最佳化
研究人員現在的目標是進一步自動化和推廣該方法。他們已經在一篇將在 2021 年神經資訊處理系統會議 (NeurIPS) 上發表的新論文中朝著這一目標取得了根本性的進步。
論文連結:https://arxiv.org/abs/2111.01186
當函式評估的數量很大時,潛在空間上的 BO 表現出良好的成功。但是,這種方法在小資料設定中可能無效。
在最新的研究中,該研究團隊提出了一種稱為 LADDER 的新方法來克服小資料設定的上述缺點。關鍵思想是定義一個新穎的結構耦合核心,該核心將來自解碼結構的結構資訊與學習的潛在空間表示顯式整合,以實現更好的代理建模。
LADDER 具有多種優勢。首先,我們可以利用對結構化資料的核心的大量研究。其次,允許使用深度生成模型 (DGM) 作為即插即用技術來學習潛在空間。這意味著 DGM 的進步將直接提高 LADDER 的有效性。
圖示:LADDER 方法。(來源:論文)
實驗表明,LADDER 的效能優於或類似於最先進的方法,並且在問題設定中明顯優於 Naïve 潛在空間 BO 方法。研究人員還憑經驗證明了 LADDER 效能的優越性是由於所提出的組合表示的方法產生的更好的代理模型。
在化學設計任務中評估了這種方法的一個例項(帶有指紋核心的 BO),結果如下表所示:(1)與 BO w/Fingerprints 方法相比,LADDER 對大量初始 BO 迭代具有更好的準確性;(2)單獨使用指紋核心的 BO 最終達到了比 LADDER 稍好的準確度。應該注意的是,如果我們透過在大量無監督結構上訓練深度生成模型來改進潛在空間,與帶有指紋核方法的 BO 相比,LADDER 將能夠達到相當或更好的準確性。
由於 LADDER 的主要貢獻是在 BO 程式的代理模型部分,它具有使用任何採集功能的靈活性,這為各種型別的擴充套件開闢了道路,包括多目標、多保真和受約束的 BO。
研究人員希望使用這種獨特的演算法來改進其他型別的實際應用中的搜尋,例如在工業過程中使用的催化劑設計中。
參考內容:https://techxplore.com/news/2021-11-aialgorithm-nanoporous-materials.html