作為資訊社會的數字底座,資料中心已經成為推動社會發展的戰略性基礎設施。如今,完全基於零信任的大環境下,資料中心既要有無限算力,又需要高安全效能。“要應對這樣的環境,目前最好的技術就是雲原生技術。”NVIDIA網路事業部宋慶春表示。
會計算的Quantum-2平臺
上個月初,NVIDIA釋出了新一代 InfiniBand 網路平臺—— NVIDIA Quantum-2平臺 。據介紹,NVIDIA Quantum-2將為雲計算提供商和超級計算中心提供極致的效能、廣泛的接入能力及強大的安全性。
“Quantum-2平臺的推出是基於現在的資料和計算量爆發性增長的現狀。 ”宋慶春表示,“傳統方式對於雲服務的需求主要是靈活便捷,但是當需要大的算力資源時,往往需要利用超算中心的資源。如何把超算的效能和雲的靈活性、安全性整合起來提供一種更新的架構支援現有的不斷增長的算力業務需求?”宋慶春強調:“需要透過雲原生超算技術把超級計算技術帶入資料中心中,讓資料中心擁有了超算技術的同時,也兼具靈活性和安全性。雲原生將會是未來提供算力平臺的發展趨勢。”
據介紹,NVIDIA Quantum-2平臺即400Gbps的InfiniBand網路平臺,包括NVIDIA Quantum-2交換機、ConnectX-7網絡卡、BlueField-3 InfiniBand DPU(資料處理器)和所有支援這種新架構的軟體。憑藉其雲原生技術,NVIDIA Quantum-2提供每秒 400Gb/s 的高吞吐量和先進的多租戶支援功能,能夠滿足眾多使用者的需求。
據悉,當超級計算機和雲原生超算系統要實現高效能時,需要所有的資源都參與到計算裡面來。Quantum-2的目標是實現資料在哪裡,計算就在那裡。基於上述優勢,Quantum-2可以幫助企業實現對AI業務一個至關重要的技術——網路計算技術(In-Network Computing)。
NVIDIA 網路事業部高階副總裁 Gilad Shainer曾表示:“如今,超級計算中心和公有云的訴求正在走向融合 —— 它們必須為新一代高新能計算(HPC)、AI 和資料分析的應用提供儘可能高的效能,同時還應安全隔離應用,並響應使用者對流量的不同需求。憑藉 NVIDIA Quantum-2 InfiniBand 平臺,現代資料中心已經可以將這一遠景變為現實。”
3U一體賦能無限算力
伴隨著計算力的提升,尤其是異構計算的發展,近些年,GPU加速計算成為了人工智慧、深度學習和大資料分析應用的關鍵。大資料時代,資訊和資料呈現爆發式增長的趨勢,DPU成為資料中心加速計算模型中繼CPU、GPU之外的的第三個計算單元。
在NVIDIA GTC 2021峰會上,NVIDIA正式釋出了新一代資料處理器NVIDIA BlueField-3 DPU,為資料中心提供強大的軟體定義網路、儲存和網路安全加速功能。NVIDIA的BlueField DPU為3U一體架構奠定了基礎。
據介紹,使用BlueField DPU後,可以將所有的CPU資源用於執行業務應用程式,不再需要部分CPU資源來支援SDN。除此之外,還能夠使擴充套件能力提升,雲原生應用程式是高度分散式的應用程式,帶來資料中心內密集的“東西向”流量,BlueField DPU 可為擴充套件應用程式提供高吞吐量、低延遲的網路環境。
另外,雲資料中心的多租戶和基礎設施彈性會帶來隱私和機密性風險,而 BlueField DPU可很好地應對這些風險。BlueField DPU還可提供穩健而強大的網路,用於應對 GPU 加速計算在雲、企業和邊緣領域中不斷增強的廣泛應用的需求。
宋慶春表示:“DPU的出現彌補了資料中心中基礎設施加速能力不足的問題,實現了DPU、GPU、CPU 3U一體新型資料中心架構,讓資料中心成為新的計算單元。給了我們一個最佳化算力資源時,從資料中心這種更高層次、更高粒度、更大空間裡來進行最佳化的一個思考空間,3U一體已經成為資料中心的一個必然的架構。”
零信任挑戰
目前,企業面臨著資料量越來越大,資料傳輸速度越來越快。各種異構資料頻繁出現,非結構化資料的量遠遠大於結構化資料,在處理非結構化資料時,複雜程度會遠遠大於處理結構化資料。再加上需要做跨平臺的整合,各種模型迭代、計算迭代、平臺迭代越來越快,網路安全已經成為資料安全的最大的威脅。
如何解決此問題呢?為助力企業應對日漸複雜的威脅,NVIDIA 釋出了一款零信任網路安全平臺。利用該平臺的一整套功能,網路安全行業可構建實時保護企業資料中心的解決方案。零信任安全平臺結合了三種技術 —— NVIDIA BlueField DPU、NVIDIA DOCA 和 NVIDIA Morpheus 網路安全人工智慧框架。
據介紹,NVIDIA DOCA 1.2是專門面向零信任安全框架的SDK,在DOCA1.2中提供了面向Load Balancers、DPI、 IPS、IDS、下一代防火牆等安全業務的API,設計安全軟體的使用者或者安全軟體的供應商,可以直接透過DOCA API呼叫在DPU裡的硬體加速引擎,讓資料中心更安全。
此外,NVIDIA Morpheus 是NVIDIA在DPU+DOCA安全資料中心裡的一個深度學習網路安全框架。最新版本包括一個新的工作流程,該工作流程使用無監督學習來建立數字指紋,以檢測網路入侵者何時接管使用者帳戶或機器。NVIDIA Morpheus可加速資料科學處理、透過NVIDIA AI 訓練生成預訓練模型或推理模型,並將新的Policy下發給NVIDIA DPU,使企業能夠同時檢查其資料中心網路中的所有遙測資料。
宋慶春指出:“資料中心對算力的需求變得越來越大,大規模的模型層出不窮,要執行大的模型需要很多的GPU來並行處理,資料並行和模型並行在未來工作訓練中同時使用將成為一個趨勢。在這種大規模使用場景下面,如何既保持很高的算力,又能夠在多租戶情況下保證訓練效能,保證業務的安全性?雲原生技術對這樣一個趨勢是必不可少的。”