2022 ASC世界大學生超級計算機競賽(ASC22)已進入預賽階段,全球五大洲超過300支隊伍正在向決賽席位發起衝擊,他們將挑戰一項前沿尖端應用——機器學習分子動力學DeePMD-kit訓練最佳化。該賽題將引導大學生進行一場人工智慧+科學研究+高效能計算(AI+Science+HPC)的前沿探索。
DeePMD,AI+Science+HPC的新正規化
分子動力學(Molecular Dynamics, MD)是一門結合物理、數學和化學等多種學科的綜合技術,其基本原理是透過牛頓經典力學計算物理系統中各個原子的運動軌跡,然後使用一定的統計方法計算出系統的力學、熱力學、動力學性質。時下最熱門的抗新冠病毒療法和疫苗研究就是分子動力學的典型應用場景。
過去三十多年來,分子動力學研究主要利用AIMD模擬方法,分析原子和分子在固定時間段內如何運動和相互作用。但這種方法只能研究千、萬數量級原子,以及皮秒時間尺度的小型系統,對複雜的化學反應、電化學電池、奈米晶體材料和輻射破壞之類的模擬已經很難有所突破。
以機器學習、深度學習為代表的人工智慧成為分子動力學研究的突破口。而人工智慧+科學研究+高效能計算(AI+Science+HPC)則意味著AI的複雜資料處理能力和Science的第一性原理與HPC的超強算力的結合。其代表性成果就是榮獲2020年戈登·貝爾獎的機器學習分子動力學應用DeePMD-kit。
DeePMD-kit成功推動了分子動力學的跨越式發展,而高效能計算的加入將機器學習分子動力學的潛力持續釋放。DeePMD-kit每天能夠模擬1億個原子超過1納秒(1納秒=1000皮秒)的軌跡,其在超級計算機頂點(Summit)上達到了雙精度91P的峰值效能,到解時間快於之前基線水平1000倍以上。可以說DeePMD-kit的出現,定義了AI+Science+HPC的新正規化。
DeePMD賽題專家、戈登·貝爾獎獲得者之一、深勢科技首席科學家張林峰表示:“AI+Science+HPC的結合有著非常廣闊的應用前景,其中AI具有對複雜資料的處理能力,以及對高維、非線型函式的表示能力,這些能力融入科學計算和高效能計算形成新的正規化,極大地提高了科學計算模擬現實世界的能力。”
跨學科交叉碰撞,ASC22挑戰DeePMD最佳化
作為AI+Science+HPC正規化的代表,DeePMD將原子間的相互作用,由量子力學準確求解的解作為資料,然後透過AI的方式來表示這樣的原子間所謂的勢能鏈、能量和受力,並進一步進行模型訓練,使得分子動力學的模擬工具兼具量子力學的精度,卻能夠比量子力學的解決方案快多個數量級。
AI+Science+HPC具有廣泛的應用前景,張林峰介紹說:“DeePMD不只是在高效能計算上樹立了一個新的正規化,而且在很多實際科研過程中被廣泛使用。過去幾年,物理、化學、材料、天文、地質等各個學科都在利用DeePMD去進行前沿的科學探索,包括物質的相圖、複雜的化學反應等。”
在這個過程中,AI+Science+HPC的新正規化也帶來了諸多底層支援的新需求和新挑戰,例如高效能硬體規模化之後的排程最佳化等,這也是DeePMD賽題考察的重點。參賽選手需要在給定的資料集上,使用DeePMD-kit對DeePMD模型進行訓練,並對訓練過程進行改進和分析,透過高效能最佳化提升訓練速度。在這一過程中,參賽大學生能夠對DeePMD-kit的模型構建過程和AI+Science+HPC新正規化建立直觀認識。
對於AI+Science+HPC新正規化的本質需求,張林峰認為是人才和生態。因為新正規化需要HPC、科學計算、AI等不同學科背景人才充分“碰撞”帶來“化學反應”,這有賴於一個創新生態的建立。他希望透過ASC大賽主辦方、協辦方和參賽選手的積極參與,有效推動AI+Science+HPC人才培養和生態建設。
ASC 世界大學生超算競賽由中國發起組織,並得到亞洲及歐美相關專家和機構支援,旨在透過大賽平臺推動各國及地區間超算青年人才交流和培養,提升超算應用水平和研發能力,發揮超算的科技驅動力,促進科技與產業創新。ASC超算大賽迄今已舉行至第 10屆,吸引超萬名世界各國大學生參賽,是全球最大規模的超算競賽。ASC22共有全球300多支高校隊伍參賽,經初賽選拔的隊伍將參加5月7日-11日在位於合肥的中國科學技術大學舉行的總決賽。