NVIDIA 推出 “AI 改變行業未來” 系列文章,邀你一起見證科技力量。本週帶來第七期 “AI 改變行業未來” 之高等教育和研究。
高等教育機構處在重大全球挑戰的前沿,負責培養 AI、加速計算和資料科學領域的創新者。同時,各大機構需要滿足人們對更靈活,更易獲取的教育方案的需求。從本地到雲,NVIDIA 提供的工具可隨時隨地推動重要學科的探索發現。
擴充套件基礎設施
藉助集中式基礎設施和優秀的計算能力,處理大型工作負載、提高效率並降低運營成本。
推動創新
使用加速探索、實驗和部署的工具,掃清發現道路上的障礙。研究人員可以藉助由 GPU 加速的 AI 和高效能計算 (HPC),運用建模、模擬和實驗資料來解決艱難挑戰。
強化學習
讓學生掌握關鍵的 AI 和高效能計算技能,促進其職業發展。為教育機構提供培訓和基礎設施解決方案,促進新一代的研究。
虛擬GPU加速印第安納州課堂
印第安納大學(IU)正在建造兩臺 AI 超級計算機,它們共裝有 616 個 A100 GPU。由慧與建造的 Big Red 200 將為印第安納大學的九個校區提供服務。由戴爾科技建造的 Jetstream-2 將為康奈爾大學,及夏威夷大學等多家合作機構的工作提供支援。
A100 能夠將處理器的處理效能分成多個部分,使得 Jetstream-2 能夠承載數百名學生同時參加的課程,每名學生都能使用一部分 GPU 效能來學習流行的影象分類等 AI 技能。印第安納大學的一名研究人員在去年11月提交了一篇論文,描述了對該虛擬 GPU 功能所進行的基準測試。
目前超過 2500 名學生使用印第安納大學目前的 GPU 加速系統。去年,該大學創紀錄的 10 億美元研究合同和撥款分佈在 178 個學院,其中超過 40%的工作由這些系統執行。
印第安納大學普適技術研究所營運長、AI-for-everyone 計劃負責人 Winona Snapp-Childs 表示:“資助機構意識到機器學習在 AI,加速計算等學術領域的重要性有助於推動科學發展。我可以想象,在未來的 5 到 10 年內,可能近一半的研究都將用到這些技術,它們將變得無處不在,併成為學術研究中必不可少的技術。”
密西西比州立大學乘上 400G 網速列車
密西西比州立大學將使用 NVIDIA Quantum-2 InfiniBand 平臺。它是構建 Orion 新系統的首選網路,Orion 是密西西比州立大學管理的四個叢集中最大的一個叢集,這四個叢集全部使用較早版本的 InfiniBand 網路所構建。
Orion 和新系統均由美國國家海洋和大氣管理局 (NOAA) 所資助,由戴爾科技建造。Orion 和新系統將承擔 NOAA 的工作任務,以及密西西比州立大學的各項研究課題。Orion 在 2019 年 6 月首次登上 TOP500 榜單,並被列為美國第四大學術超級計算機。
密西西比州立大學高效能計算總監 Trey Breckenridge 表示:“我們在密西西比州立大學的四代超級計算機中都使用了 InfiniBand,所以我們知道它既強大又成熟,可以可靠地執行我們需要的大型工作。”
DPU 助力杜倫大學創新和改進超算基礎設施
杜倫大學的計算宇宙學院和計算機科學系,他們正在對地震波和引力波的傳播進行大規模模擬,該模擬使用動態笛卡爾網格和 ExaHyPE 程式碼將大部分的計算轉化為多工操作。
在過去幾年中,他們付出了大量的精力來標記和識別那些需要與其它網格發生變化的節點或任務同步的關鍵任務。由於存在大量的低優先順序任務,保證整個系統的負載平衡的工作量將會很大。即使達到最佳負載平衡後,一旦域內任何引數發生變化,系統立刻就會隨之變得不平衡,要想再次達到最佳負載平衡會非常困難並且會耗費大量的時間或成本。
為了提升系統的應變能力,研究人員必須將輕量任務和閒置任務轉移到其它資源上,但是,編排就會變得十分困難,同時透過調節 MPI 執行時來確保在正確的時間用正確的步長來進行計算,也會搶佔計算資源。
憑藉 BlueField DPU 計算核,杜倫大學可以使用 DPU 作為 MPI 處理引擎來節省計算資源,例如觀察和引導任務,以及及時快取/接受任務等。這項工作延伸了 ExaHyPE 組織內部的研究合作,尤其是 TUM 的 Michael Bader 小組,對於以 CPU 核心的計算任務提出來一個全新的觀點,即開始由智慧網路承擔起資料處理工作。
敬請期待下一期 “AI 改變行業未來” !