DPU(資料處理器)將伺服器和儲存之間的 IOPS 效能提升至 4100 萬以上,超過之前世界紀錄的四倍。
資料中心需要超高速儲存訪問,而目前還沒有哪個 DPU 的速度能比 NVIDIA BlueField-2 更快。
NVIDIA 近期測試顯示,兩個 BlueField-2 DPU(資料處理器)的每秒輸入/輸出(IOPS)效能達到 4150 萬次,超過任何其他 DPU 效能的 4 倍。
BlueField-2 DPU 使用標準網路協議和開源軟體打破效能紀錄,使用業界常用的儲存介質訪問方法 NVMe over Fabrics(NVMe-oF)以及最通用的網際網路協議之一 TCP 網路,其 4KB IOPS 效能超過 500 多萬,而 512B IOPS 則達到 700 萬至 2000 萬以上。
為了加速 AI、大資料和高效能計算應用,BlueField 還支援流行的 RoCE 網路傳輸選項以提供更高的儲存效能。
在測試中,initiator 端和 target 端都部署了 BlueField,使用不同型別的儲存軟體庫和不同的應用來模擬真實世界的儲存配置,都展現出超強的效能。BlueField 在 InfiniBand 網路上還支援快速儲存連線,而 InfiniBand 是許多 HPC 和 AI 應用的首選網路架構。
測試方法
BlueField 所達到的 4150 萬 IOPS,是之前使用專有儲存產品創造的 1000 萬 IOPS 世界紀錄的 4 倍多。這一效能是透過連線兩臺快速 Hewlett Packard Enterprise Proliant DL380 Gen 10 Plus 伺服器實現的,其中的一臺作為應用伺服器(儲存 initiator),另一臺作為儲存系統(儲存 target)。
每臺伺服器均配備兩個英特爾 “Ice Lake” 至強白金 2.3GHz 8380 處理器,支援 160 個超執行緒核以及 512GB 的 DRAM、120MB 的 L3 快取(每個處理器60MB)和 PCIe Gen4 匯流排。
為了加速網路和 NVMe-oF,每臺伺服器均配備了兩塊 NVIDIA BlueField-2 P系列 DPU 卡,每塊卡帶有兩個 100Gb 乙太網埠,在 initiator 和 target 之間有四個網路埠合計 400Gb/s 線速頻寬,並透過 NVIDIA LinkX 100GbE Direct-Attach Copper(DAC)無源電纜背對背連線。兩臺伺服器均安裝 Red Hat Enterprise Linux(RHEL)8.3 版本。
對於儲存系統軟體,測試 SPDK 和標準 upstream Linux 核心 target,使用預設核心 4.18 和最新核心之一 5.15。對三種不同的儲存 initiator 進行了基準測試,分別為 SPDK、標準核心儲存 initiator 和 SPDK FIO 外掛。使用 FIO 和 SPDK 生成負載並進行測量,使用 4KB 和 512B 這兩種常見的中型和小型儲存 I/O 大小來測試。
在網路傳輸層使用了 TCP 和 RoCE 兩種協議來測試 NVMe-oF 儲存,每種配置都在全雙向網路的條件下以 100% 讀取、100% 寫入和 50/50 讀取/寫入負載模型進行測試。
測試顯示 BlueField DPU 還具有以下效能特點:
- 用較小的 512B I/O 大小測試,結果顯示 IOPS 更高,但吞吐量低於埠線速,而用 4KB I/O大小測試,結果顯示吞吐量很高,而 IOPS 有所降低。
- 100% 讀取和100% 寫入兩種負載的 IOPS 和吞吐量效能類似,而 50/50 讀/寫混合負載由於充分使用網路連線的兩個方向產生了更高的效能。
- 使用 SPDK 測試,得出的效能高於核心軟體效能,但同時帶來了更高的伺服器 CPU 利用率,這是因為 SPDK 在使用者空間中執行並不斷進行輪詢,因此這一情況在預期之內。
- 由於 Linux 社群會定期加入儲存改進,因此較新的 Linux 5.15 核心比 4.18 核心表現更好。
創紀錄的 DPU 儲存效能
為儲存安全提供了效能保障
在如今的儲存領域,絕大多數雲和企業部署都需要快速、分散式、透過乙太網或 InfiniBand 訪問的網路快閃記憶體。更快的伺服器、GPU、網路和儲存介質都要求伺服器的 CPU 能夠跟上,而最好的方法就是部署具有儲存功能的 DPU。
BlueField-2 DPU 所展現的驚人儲存效能,使整個資料中心的應用伺服器和儲存裝置都具有更高的效能和效率。
在快速儲存訪問的基礎上,BlueField 還支援對乙太網儲存流量和儲存介質本身的硬體加速加密和解密,這有助於防止資料被盜或外洩。
它能以高達 100Gb/s 的速度解除安裝 IPsec(線上資料),以及高達 200Gb/s 的速度解除安裝 256 位 AES-XTS(靜態資料),能夠在對手入侵儲存網路或者物理儲存驅動器被盜、被出售或被不當處置的情況下,減少資料被盜的風險。
客戶和領先的安全軟體廠商正在使用最近更新的 BlueField 的 NVIDIA DOCA 框架,以在 DPU 上執行分散式防火牆,或提供微分段的安全組等網路安全應用,來進一步提高計算伺服器的應用和網路安全,降低伺服器儲存的不當訪問或資料修改風險。
NVIDIA BlueField-2 DPU 測試結果細節如下圖:
使用 NMe-oF on TCP 測試 NVIDIA BlueField-2 DPU。測試結果是配置了兩個 BlueField-2 DPU 的合併效能。
使用 NVMe-oF RoCE 測試 NVIDIA BlueField-2 DPU。測試結果是配置了兩個 BlueField-2 DPU 的合併效能。