王朔有一部小說《動物兇猛》,寫的是幼時軍區大院兒的孩子們,“不管天不管地” “請勿靠近”的“生不愣子們”“不吝秧子的主兒”,“一切都無須爭取,我只要等待,十八歲時自然會輪到我”,這是主人公的表述,也是那個時代孩子的心聲。
NVIDIA最新發布的NVIDIA Quantum-2 – 新一代InfiniBand網路平臺同樣擁有世道輪迴、順利稱霸的潛質,因為其效能表現同樣的兇猛,這是我對Quantum-2的第一印象。
讓我們看看NVIDIA Quantum-2的效能表現:
NVIDIA Quantum-2 平臺屬於400Gbps InfiniBand網路平臺,由NVIDIA Quantum-2交換機、ConnectX-7網絡卡和BlueField-3資料處理器DPU(資料處理器)組成,也包括所有支援這種新架構的軟體。
NVIDIA Quantum-2相關產品全部採用7納米制程工藝製造,其中Quantum-2交換機包含了570億個電晶體,略多於含 540億個電晶體的NVIDIA A100 GPU,它具有64個400Gbps埠或128個200Gbps埠,並將提供不同埠數的交換機系統,最多達2048個400Gbps埠或4096個200Gbps埠——交換能力上,超出上一代Quantum-1約 5倍。
NVIDIA ConnectX-7網絡卡包含80億個電晶體,可以支援RDMA、GPUDirectStorage、GPUDirect RDMA和網路計算,效能相比NVIDIA ConnectX-6實現了翻番, ConnectX-7樣片將於明年1月問世。BlueField-3 InfiniBand包含220億個電晶體,提供16個64位的Arm CPU,以解除安裝和隔離各種資料中心基礎設施服務。BlueField-3樣片將於明年5月問世。
如此彪悍的效能可以派何用場呢?
此前我們介紹過:海量資料時代馮・諾依曼架構CPU的侷限,“資料在哪裡,計算就在那裡;當資料在GPU上,計算就在GPU上;當資料在CPU上,計算就在CPU上;當資料在網路中傳輸的時候,計算就在網路中。”這是資料中心時代的主要訴求。
但是無論架構如何調整,強大網路連線能力都有助於減輕架構的壓力。相比於10G/40G乙太網絡,400Gbps/ 200Gbps低延遲InfiniBand都有碾壓的實力。高達2048個400Gbps埠,堪稱恐怖的存在。
對於全球超算中心和雲服務提供商而言,NVIDIA Quantum-2 平臺是他們的福音,這讓他們有能力將強大的算力面向企業級使用者開放,提供多租戶服務的效能保障。
NVIDIA網路高階副總裁Gilad Shainer 表示,“如今,超級計算中心和公有云的訴求正在走向融合——它們需要為新一代高效能計算(HPC)、AI和資料分析的應用提供儘可能高的效能,同時還應安全隔離應用,並響應使用者對流量的不同需求。憑藉NVIDIA Quantum-2 InfiniBand平臺,現代資料中心已經可以將這一遠景變為現實。”
憑藉每埠400 Gbps的高吞吐量,NVIDIA Quantum-2 InfiniBand將網速提高了一倍,網路埠數量增加了三倍。它在效能提升3倍的同時,還將對資料中心網路所需的交換機數量減少了6倍,於此同時,資料中心的能耗和空間各減少了7%。
NVIDIA Quantum-2平臺實現了多租戶之間的效能隔離,這使得一個租戶的行為不會干擾到其它租戶,同時透過利用先進的基於遙測且支援雲原生的擁塞控制機制,確保了可靠的資料吞吐量,並且不受使用者或應用需求高峰的影響。
NVIDIA Quantum-2 SHARPv3網路計算技術可為AI應用提供超出上一代產品32倍的加速引擎能力,藉助NVIDIA UFMCyber-AI平臺,將為資料中心提供先進的InfiniBand網路管理功能,包括預測性維護等。
NVIDIA Quantum-2平臺中集成了納秒級精度的時鐘系統可以同步分散式應用,如在資料庫處理中,有助於減少等待及空閒時間。這一新功能,其使得雲資料中心可成為電信網路的一部分,可以託管軟體定義的5G無線服務。