過去科學研究通常有兩種正規化,一種是基於歸納的正規化,另一種是基於演繹的正規化。這兩種研究正規化有各自的特點也使得它們有不同的限制。
歸納與演繹結合,數量級提升物理模型效率
以藥物設計為例,由於其求解物件過於複雜,只能透過密度泛函這種底層、準確的方式來求解,即使用演繹正規化求解。
這樣的求解是非常昂貴的,需要大量的算力支撐,因為需要計算體系內原子、分子間的相互作用和它們之間的能量,其本質上是一個高維函式。
面對如此高成本的計算,深勢科技團隊成員提出了Deep Potential系列方法,成功在傳統的演繹正規化計算流程中加入了基於歸納正規化的AI技術,有效結合了兩種科學研究途徑的優勢
深勢科技團隊將AI處理高維複雜函式的能力運用於表示微觀粒子間相互作用對應的標量函式,直接在分子動力學的框架之下對原子體系進行演化,大幅提升了藥物設計階段的效率。這套方法在完整保留第一性原理分子動力學精度的同時,把計算的速度提升到此前的多個數量級,可以同時實現對數十億個原子第一性精度模擬。
(對於有機分子、高熵合金、半導體等不同體系,DP均給出符合第一性原理DFT計算的結果)
Deep Potential在集合了歸納正規化和演繹正規化的優勢之後,既有效地繼承了DFT精度,又大幅降低計算複雜度,同時計算效率還呈現出線性的擴充套件。在這樣的底層原理的支撐下,機器學習、物理模型能真正有效地結合起來,從而數量級地提升物理模型的效率。
(克服維數災難,計算量隨原子數量線性增長)
深度學習分子動力學,對算力提出要求
上述這種深度學習分子動力學在大幅提升計算效率的同時,也對基礎算力提出了新的需求。
首先,深度學習模組的加入對異構資源提出了新的需求:模型訓練往往需要在海量異構資源上進行,以滿足模型的開發迭代速度以及模型預測準確度。
因此,為了將深度學習分子動力學的優勢最大化,需要充足的通用和異構計算資源。其次,雖然深度學習分子動力學大幅降低了計算成本,但面對比第一性原理分子動力學更大規模的求解過程時,深度學習分子動力學仍然需要海量的算力資源,超大計算規模場景下所需的算力資源往往令大多數計算中心難以滿足,因此限制了深度學習分子動力學在材料計算、藥物設計領域的應用。
基於智算+API,完成海量計算資源對接
目前,曙光智算和深勢科技推出“多尺度模型+AI+高密度計算”聯合解決方案,底層使用曙光智算海量通用和異構算力,支援超大規模作業任務,為深度學習分子動力學提供廣闊舞臺,依靠“無界算力”徹底消除“算力不足恐懼症”。
基於智算+API,深勢科技Lebesgue管理平臺已與曙光智算海量資源完成對接,並在計算中心成功部署DeePMD-kit、DP-GEN工具。背靠海量可擴充套件計算資源,聯合解決方案打造高效的“AI+Science”研發新正規化,助力臨床前藥物設計和新材料研發。
在藥物設計領域,解決方案整合深勢科技臨床前計算機輔助藥物設計平臺 Hermite(hermite.dp.tech),藉助深勢科技自主研發的全新藥物設計解決方案及眾多業界優秀的藥物設計工具,以使用者友好的圖形化操作介面,提供了演算法-資料-算力三位一體的一站式解決方案:蛋白質結構預測模組 Uni-Fold 與增強取樣演算法 RiD 可完成實驗級精度的蛋白結構建模與最佳化和高效的正構、別構口袋預測;虛擬篩選模組可實現數十億分子庫量級的虛擬篩選;結合自由能計算模組 Hermite Uni-FEP 將自由能微擾理論、分子動力學、增強取樣演算法與高效能計算相結合,以化學精度高效評估蛋白與配體的結合自由能,實現工業規模的先導化合物最佳化篩選,提升藥物最佳化效率。
在材料計算領域,解決方案依靠曙光智算底層算力和深勢科技自研的新一代分子模擬技術,能夠實現效率與精度的統一,將過去業內以“炒菜”式實驗為主的試錯式研發模式,逐漸轉變為“計算設計-實驗驗證”的理性設計研發模式,將研發週期縮短至原來的十分之一。此外,這種新型科研基礎設施可以解決傳統方法難以計算的多元電極、離子輸運、表面介面模擬問題,有望為現有材料體系中的未解問題給出解答,成為新能源材料研發升級的新引擎。