當電子問題遇到了神經網路,會碰撞出什麼樣的火花呢?
DeepMind 的最新研究向我們揭曉了答案。刊登在最新一期 Science 論文 Pushing the frontiers of density functionals by solving the fractional electron problem 顯示,神經網路可以用來構建比以前更精確的電子密度和相互作用圖。
這一結果無疑會幫助科學家們更好地理解電子之間的相互作用,向著深入的研究進一步邁進,這也表明了深度學習(DL, Deep Learning)有望在量子力學水平上精確模擬物質——這可能使得研究人員在奈米水平上探索關於材料、藥物和催化劑的問題,從而改進計算機的設計。簡而言之,這是一次電子和分子的深度結合。
DFT 是什麼?
這次研究涉及一個非常重要的理論——密度泛函理論(DFT, Density functional theory)。
早在 50 多年前,這個用來描述量子物質基本性質的理論首次建立,實現了在量子水平上描述物質,該方法將電子在給定原子組中的位置與原子共享的總能量相關聯,以確定分子的化學和物理特性。
作為人類智慧的結晶之一,很快地,它便成為物理、化學、材料科學等多個領域的強有力工具,是學習計算凝聚態物理/計算材料學/計算化學的必修基礎理論。
通俗來說,密度指的是電子數密度,泛函則表示能量是電子密度的函式,而電子密度又是空間座標的函式。那麼,函式的函式,便稱之為泛函(Functional)。也就是說,這是一種透過電子密度研究多電子體系電子結構的方法。
如果放到具體的操作中,DFT 可以透過各種各樣的近似,把難以解決的包含電子-電子相互作用的問題化繁為簡,變為無相互作用的問題,再將所有誤差單獨放進一項中(XC Potential),進而對誤差進行分析。
然而,困擾已久的問題是:電子密度和相互作用能之間對映的確切性質,即所謂的密度泛函(density functional),仍然是未知的。
傳統的 DFT 工具可以對具有一兩個電子的系統進行建模,但它們無法對具有 1.5 個電子的系統進行建模,而這在一個電子被多個原子之間共享的情況下是很重要的。
一方面,這種帶小數點的電子是虛構的物體,沒有這樣的電子,根據定義,電子是整體的,但是透過解決這些電子問題,我們能夠正確描述化學系統。
正因為如此,即使是最先進的 DFT 在描述分數電子電荷(fractional electron charges)和自旋(spins)時,也會受到基本的系統誤差的困擾。
“功力強大”的 DM21 框架
DeepMind 的神經網路可以用於構建比先前更精確的電子密度和相互作用圖,擺脫了此前的諸多限制。
作為 DeepMind 的研究科學家,James Kirkpatrick 和他的同事使用 DeepMind 平臺開發了“DM21”(DeepMind 2021)框架,可以利用精確的化學資料和分數電荷約束來訓練神經網路。
根據研究報告,DM21 能夠避免兩個重要的系統誤差(離域誤差和自旋對稱性)的破壞,從而學習泛函,更好地描述廣泛的化學反應類別。
研究人員用 2235 個化學反應示例訓練了他們的人工智慧,並提供了有關所涉及的電子和系統能量的資訊。其中,1074 個代表了分數電子會對傳統 DFT 分析造成問題的系統。
然後,他們將人工智慧應用於未包含在訓練資料中的化學反應。
DeepMind 21 不僅正確地表示了分數電子,而且其結果比傳統的 DFT 分析更精確。它甚至可以處理關於具有奇怪屬性的原子的資料,這些資料與訓練資料中的任何東西都不相似。
DM21 正確描述了人工電荷離域和強相關性的典例,並且在主族(main-group)原子和分子的全面基準評估上優於傳統泛函。此外,DM21 可以準確地模擬複雜系統,如氫鍵鏈(hydrogen chains)、帶電荷 DNA 鹼基對和雙自由基體系的過渡態。
更為關鍵的是,該研究中的方案依賴於不斷改進的資料和約束,因此,它代表著一條通向泛函的可行途徑。
DM21 之所以極大地提高了效能,因為它服從兩類分數電荷系統的約束:
1)具有非整數總電荷的分數電荷(FC, Fractional Charge)系統;
2)具有非整數自旋磁化的分數自旋(FS, Fractional Spin)系統。
儘管 FC 和 FS 系統是虛構的,但實際電荷密度可以包括具有 FC 或 FS 特性的區域,因此,正確建模這些理想化問題有助於確保泛函在各種分子和材料中的正確表現。
實驗結果顯示,在 55 個不同熱化學分子性質、大而多樣的資料集上,DM21 的加權絕對誤差為 4 kcal/mol。
這個非常小的誤差與大多數泛函誤差相比,是由大量精心選擇的成分和擬合的分子資料造成的。無論是否包含分數電荷和自旋資料,誤差本質上是相同的。然而,這些資料的加入提高了 DM21 在電荷轉移和強相關性問題上的效能。
圖丨區域性電子約束的訓練解決了電荷和自旋定位和去定位錯誤。
DM21可以與強約束和適當賦範泛函(SCAN, Strongly Constrained and Appropriately Normed)進行比較,該泛函是透過假設方程滿足 17 個精確約束,但不滿足分數電荷和自旋約束而建立的。SCAN 產生的誤差為 8 kcal/mol。然而,當 SCAN 進行密度校正時,該誤差降低到 6 kcal/mol。這說明,密度校正可以消除 SCAN 的電荷轉移誤差。
Jon Perdew 在相關觀點中寫道:“由 Kirkpatrick 等人開發的 DM21 的重要性,並不在於產生了最終密度泛函,而是用一種 AI 方法解決了分數電子和自旋問題,該問題一直無法透過直接解析方法來建立泛函。”
整個研究工作表明,透過結合約束滿足和 AI 擬合大而多樣的資料集,可以設計出更具有預測性的精確密度函式。
DeepMind 演示了神經網路如何提高密度泛函的近似值,有力地顯示了 DL 在量子力學水平上精確模擬物質的前景。此外,DeepMind 還開源了程式碼,為研究者提供了探索研究的基礎。
對於這一成果,James Kirkpatrick 表示:“瞭解微觀尺度現象對於幫助我們應對 21 世紀的一些重大挑戰,從清潔電力到塑膠汙染,正變得越來越重要……這項研究朝著正確方向邁出的關鍵一步,使我們能夠更好地理解電子之間的相互作用,而電子就是將分子粘在一起的‘膠水’。”
從短期來看,這將使研究人員能夠透過程式碼的可用性,獲得一個改進的精確密度函式的近似值;從長遠來看,這是 DL 在量子力學水平上精確模擬物質的更進一步——這可能使研究人員能夠在奈米水平上探索材料、藥物和催化劑的問題,從而在計算機上實現材料設計。
來源:學術頭條