【研究背景】
設計節能和環保的技術是本世紀最具挑戰性的科學課題之一。與此同時,人們對安全、清潔和可持續的新型能源供應提出了強烈要求。當前,有機材料正在成為下一代能源相關技術的一個有前途的選擇。從能量收集到電能儲存,有機物呈現出一系列有吸引力的特點,如低成本、多功能的合成路線、輕質、可定製的特性和可再生資源的生產。有機材料的效能在很大程度上取決於電池迴圈過程中工作的電化學反應型別。這些材料通常可以根據其在氧化還原反應中的電荷狀態分為n型、p型或雙極型。然而,對上千億個有機材料進行合成和表徵,以充分探索所有的可能性,顯然是不可行的。同時,基於量子力學的傳統計算方法也受到了技術上的限制,因為解決相關方程的計算量很大。
最近,在機器學習(ML)技術的框架內,一種替代性的途徑已經得到了關注,可能會加速新型材料的發現。事實證明,ML是一個有用的工具,可以篩選電池的新材料,預測半導體的帶隙和小分子的一般特性。然而,一些方法仍然嚴重依賴需要從昂貴的量子力學計算中提取的資訊,這可能是材料發現過程中的一個障礙。在這種情況下,透過機器學習等超快技術探索有機物所呈現的化學世界可能有助於OEMs的智慧設計。為此,搞清楚這些分子系統的固態結構及其電化學特性,揭示結構與效能的關係,以便透過ML框架獲得。
【成果簡介】
基於此,作者結合密度泛函理論(DFT)和機器學習,以加速發現新型有機電活性材料。所建立的工具構成了一個由人工智慧(AI)輔助的材料設計包,能夠直接預測鋰離子插入電壓,完全避開了傳統的基於量子力學的方法所帶來的苛刻的計算工作。該人工智慧核心僅依靠活性分子的結構資訊作為輸入,在此編碼為簡單的結構字串,以評估其還原電位和預期的電池開路電壓(vs Li/Li+)。此後,這一機制被用於高通量篩選GDB17資料庫中的2000萬個有機分子,以確定新的正極活性化合物。按照電壓和容量的兩級過濾系統,作者得到了1001個n型正極候選材料。這一數量僅佔總篩選分子的0.005%,這進一步表明了尋找n型有機正極的挑戰。作為高通量篩選的最後一部分,已使用高水平的DFT方法重新計算了所選候選物的分子特性,其目的有三個方面。(i)評估人工智慧核心的準確性;(ii)透過消除由於統計噪音而可能產生的非物理性結果來減少候選材料數量;(iii)反饋分子資料庫。透過這一步驟,正極候選材料被進一步減少到459個有希望的化合物,其中有可能提供高於1000W h kg-1的理論能量密度。相關成果以“Artificial intelligence driven in-silico discovery of novel organic lithium-ion battery cathodes”為題發表在了Energy Storage Materials期刊上,瑞典卡爾斯塔德大學工程和物理系C. MoysesAraujo教授為該文章的通訊作者。
【核心內容】
圖1(a)為一些化合物的脫硫結構。基於二羧酸鹽的構件可以透過不同的機制進一步定製,從而提供可調整的熱力學特性。這些晶體的一個共同特徵是形成了一個由有機對應物夾層的鹽層。另一個有趣的特點是迴圈結構的存在,其中包括不同的雜原子(如N、S和O)和官能團,從而允許對氧化還原化學進行適當的設計。在圖1(b)中,所有這些化合物(vs Li/Li+)都以相同指數基數顯示。從0.58 V到高達3.29 V,這組化合物表現出負極和正極電位區間,適合用於LIBs。正如預期的那樣,僅基於羧酸鹽或-NH2基團功能化的分子顯示出最低的電位(1、3、9、13、16、19、20、22、24),而那些用-NO2功能化或由N雜原子組成的分子顯示出最高的電位(4、6、7、12、15、21、25、26、28)。
圖1
線性模型的建立是為了在作為分子描述符的基礎上評估開路電壓,即對模型的輸入。除了上一步預測的有機晶體外,還從文獻中獲得的實驗結果中引入了幾個有機電極的鋰化電壓。這一事實擴大了模型的多樣性,並提高了其預測的有效性,也進一步用實驗結果驗證了該方法。圖2顯示了迴歸技術的效能及其各自的方程式。值得注意的是預測電壓和目標電壓之間有很好的相關性,特別是對於實驗性的分子。
圖2
為了建立神經模型,對指紋和網路結構的不同組合進行了基準測試,以產生最有效的模型。所有CM和MBTR組合的神經網路是在TensorFlow框架上編碼的,而SMILES是在PyTorch上開發的。在分析不同指紋和架構的一般效能時,平均絕對誤差(MAE)被選為網路的訓練標準。訓練是在有18528個樣本的OMEAD分子資料庫的一部分中進行的,而2290個樣本被保留用於測試目的。令人驚訝的是,SMILES表示法與MBTR的表示法取得了相似的效能,這種指紋更加穩健,能夠編碼更多的結構資訊。因此,SMILES架構是最終的選擇。此外,這種方法有利於獲得更大的取樣範圍,因為避免了其他指紋所需的多體結構處理,如計算原子對距離、角度等。
圖3
圖3(a)是最終神經模型的總體示意圖,以對苯二甲酸SMILES為例。在將SMILES的初始索引輸入NLP後,資料被翻譯成嵌入向量。這些嵌入的序列被送入四個獨立的RNN(簡單命名為A、B、C和D),它們的輸出被轉發給四個獨立的FC層。這第一部分也可以看作是一個編碼方案,在這個方案中,網路正在建立每個分子結構的內部表示,同時透過嵌入過程學習SMILES元素(原子種類、鍵等)的含義,並透過遞迴層學習其排序背後的知識。之後,一個連線操作負責合併來自四層的輸出,然後將其轉發給兩個連續的全連線層。按照編碼方案,這最後一步可以理解為解碼過程,即網路翻譯所需的結構-屬性關係。圖3(b)顯示了預測測試資料集的還原潛力時的神經模型效能。
隨著線性和神經模型的訓練,人工智慧核心已經確定。下一步是在生產中應用該框架來探索有機物世界,並透過高通量篩選方法來確定新的可能的LIBs電極。為此,從GDB17資料集中共提取了2000萬個分子,並由人工智慧核心處理,以預測它們的鋰化電壓。值得強調的是,除了文字預處理外,預測步驟在個人電腦上對所有2000萬個SMILES的預測需要不到40分鐘。如果對所有這些化合物進行相應的量子力學計算,這項任務將需要最先進的超級計算機10年以上。
圖4
為了深入瞭解人工智慧推薦的分子特徵,圖4顯示了低和高鋰化電壓下原子種類(以其化學符號表示)的出現率(%)和選擇率,以及分子由環結構組成的數量(以整數表示)。比較選擇從而說明了所選分子由特定原子種類和環的數量組成的可能性。因此,它揭示了這些元素影響鋰化電壓的可能性大小。可以看出,對於高電壓化合物,硫、溴和氯顯示出最高的選擇率,其次是氟。相反,對於低電壓電極,這些元素顯示出明顯較低的選擇率,其中環結構的數量似乎是最相關的特徵。在這方面,具有較多環狀結構的分子似乎更適合作為負極化合物,而正極的情況恰恰相反,在這種情況下,兩環的情況顯示出最高的得分。對於氧氣和氮氣,單獨的選擇比率並不能提供任何直接的結論,但是當與發生率分析相結合時,就會發現人工智慧略微傾向於選擇含氧/氮的分子作為正極。然而,這種計算發生率的方法不能確定功能組。例如,不可能識別出甲基,這種基團通常作為電子捐獻者,從而降低鋰化電壓。
在選擇過程之後,作為高通量工作流程的一部分,對所有2501個分子進行了第二輪DFT計算以評估其還原電位。這個DFT步驟作為第三層過濾器,透過清除資料驅動方法中常見的統計噪音來改進最終擬生產的分子。此外,2501個分子現在都可以被送入OMEAD,形成一個連續的反饋迴路。同時,這些新的結果可以被用來進一步分析人工智慧核心的效能。圖5展示了DFT和AI資料之間的基準集合。圖5(a)和(b)顯示了還原電位的機率密度函式(PDF),圖5(c)和(d)分別顯示了負極和正極範圍的開路電壓。PDF是對資料分佈的高斯擬合,表示找到某種結果的可能性。圖5(e)和(f)分別顯示了負極和正極候選材料的二維柱狀圖。圖中的深色區域代表了來自DFT和AI的數值之間較高的資料關聯性。在低電位和高電位範圍內,資料分佈都在預期的0 V∼3 V的區域。
圖5中的整體結果顯示DFT和AI之間有很好的一致性,這再次證明了該模型的效能。小的偏差主要是由於離群值造成的,這些離群值主要來自於DFT計算中氧化還原過程經歷了重大結構變化的分子。這些異常值往往導致非常大/小的電壓,擴大了機率密度。這種不現實的電壓不應該被考慮到最終的人工智慧核心效能。此外,它們的出現與氧化還原反應期間發生的物理化學過程有關,而AI-kernel不能評估這些過程,例如導致解離的鍵裂開或不可逆的結構變化。SMILES沒有隱含地編碼任何關於帶電相位變化的資訊,因此預計會有異常值的存在。另一方面,這一事實可以幫助識別在鋰化過程中容易降解的不需要的分子,這也可以為未來化合物的智慧設計提供一個新的途徑。
圖5
【結論】
一個以人工智慧為基礎、以密度泛函理論計算為支撐的框架已經被開發出來,以加速發現新型有機電池材料。該工作流程由四個主要步驟組成:(1)使用進化演算法對OEMs的第一性原理晶體結構進行預測,以及在電池迴圈過程中插入離子和電子時相應的結構變化;(2)開發有機能源材料資料庫,包括透過高階DFT計算評估的關鍵分子特性;(3)透過結合兩種機器學習(神經和線性)模型設計人工智慧核心,以允許快速訪問更大的有機化合物化學空間;(4)在搜尋新的有機正極候選材料時對2000萬分子進行高通量篩選。
可以看到,使用基於AI的方法可以加快鋰離子電池新電活性材料的發現過程,併成為開發巨大的有機材料世界的革命性工具。最後,作者提出了一個新型高壓正極的清單,作為下一代有機電池的最有希望的候選材料,其中一些化合物有可能表現出超過1000W h kg-1的能量密度。
Carvalho R P, Marchiori C F N, Brandell D, et al. Artificial intelligence driven in-silico discovery of novel organic lithium-ion battery cathodes[J]. Energy Storage Materials, 2021. https://www.sciencedirect.com/science/article/pii/S240582972100489X#!