科學界和工業界正開始利用 AI 與資料中心規模的加速計算相結合的強大指數級算力
研究人員正在尋找能使他們的工作所需計算效能提升 百萬倍 的“燃料”。
不斷增長的資料導致計算需求飛漲。面對此情況,他們無法完全依靠已是明日黃花的摩爾定律。
因此,他們利用三大“推進器”,獲取所需的指數級加速。
縱向加速和橫向擴充套件
加速計算是科技的三大現代驅動力之一。在過去的十年中,藉助五代 GPU 的進步以及我們在這些 GPU 之上構建的完整軟體棧,加速計算已實現了 1000 倍效能提升。
擴充套件能力是第二個驅動力,已取得近十萬倍的效能提升。這是因為資料中心正在成為新的計算單元。
例如,在 2015 年,使用一個 Kepler GPU 訓練 ResNet-50(熱門的計算機視覺模型之一)花了將近一個月的時間。今天,我們在 Selene 上訓練同樣的模型只用了不到半分鐘的時間。Selene 是世界上效能超強的工業超級計算機,其包含數千個 NVIDIA Ampere 架構 GPU。
我們開發了許多關鍵技術來實現這種擴充套件,例如 Megatron 軟體、用於多 GPU 和多節點處理的 Magnum IO,以及用於網路計算的 SHARP。
開啟深度學習的新時代
當今時代的第三個,也是最具變革性的驅動力是 AI。
去年,深度學習在一毫秒的時間尺度內對 3.05 億個原子進行了模擬,揭示了新冠病毒 SARS-CoV-2 的內部結構。這項工作標誌著與 15 年前在 20 秒內對 100 萬個原子進行模擬的最先進技術相比,其效能增加了 1000 萬倍以上。
這就是 AI 和高效能計算的結合正在席捲科學界的原因。研究人員去年在 arXiv 上發表了近 5000 篇關於利用 AI+HPC 進行工作的論文,而五年前此類論文還不到 100 篇。
最近的一篇論文來自 NVIDIA 的研究人員。它展示了一種將神經網路與經典物理方程式相結合的方法,可令傳統模擬獲得 1000 倍的速度提升。
加快藥物研發
如今,加速計算、大規模擴充套件和 AI 的結合正在推動科學和工業計算的發展。
在疾病治療領域,加速藥物研發是一切工作的重中之重。這項工作頗具挑戰,開發者需要解碼 3D 蛋白質結構,瞭解其工作原理,然後發現能夠阻止它們感染健康細胞的化合物。
使用 X 射線和電子顯微鏡的傳統方法只解碼了大約 25000 種人類蛋白質中的 17%。DeepMind 去年在其 AlphaFold 系統中使用了一套 AI 模型,實現了重大飛躍,預測了超過 20000 種人類蛋白質的 3D 結構。
無獨有偶,NVIDIA 和美國加州理工學院的研究人員將機器學習和物理相結合,創造了 OrbNet,可加速多個數量級的分子模擬。初創公司 Entos 利用 OrbNet,令其蛋白質和候選藥物之間的化學反應模擬速度提高了 1000 倍,在三個小時內就完成了原本需要超過三個月時間的工作量。
瞭解氣候變化
類似情況在其他領域也屢屢發生。科學家希望儘快以千米級解析度模擬全球氣候,以幫助我們適應不斷變化的天氣模式,更好地為災難做好準備。
但是,為了準確追蹤雲層和風暴的運動模式,科學家需要在一米的解析度級別進行研究。這需要高達 1000 億倍的計算能力。
按照摩爾定律,我們要到 2060 年才能獲得這個能力。因此,尋求百萬倍效能飛躍的科學家正在透過大規模加速計算和 AI 來構建我們星球的數字孿生。
多行業已應用數字孿生
研究人員已經在利用這些技術來構建工廠和城市的數字孿生。
例如,西門子能源公司使用在雲中數十個 GPU 上執行的 NVIDIA Modulus AI 框架,模擬了整個發電廠。它可以預測蒸汽的腐蝕性影響造成的機械故障,減少宕機時間,節約成本並持續運作。
這種模擬技術可打造更高效的農場、醫院,以及幫助任何行業轉型。這就是我們開發 Modulus 原因:使建立 AI 驅動、物理級準確的模擬變得簡單。
這是在當今新計算引擎的助力下,我們打造出的又一個工具,可實現下一個百萬倍的飛躍。
資料中心規模的 AI 加速計算將帶來百萬倍的效能提升,從而解決諸如瞭解氣候變化、研發藥物和推動工業轉型等問題。
敬請關注NVIDIA創始人兼執行長黃仁勳的GTC主題演講, 瞭解更多資訊。