11月9日,AMD CEO蘇姿豐在線上活動中公佈了最新的Zen 4構架CPU的路線圖,當中包括96核的Genoa和128核的Bergamo伺服器CPU。
活動中釋出了Instinct MI250X GPU和4款EPYC Milan-X處理器(最高配的EPYC 7773X是64核128執行緒,搭載高達768MB L3快取。而最低的EPYC 7373X是16核32執行緒),
新路線圖涵蓋了第四代的EYPC伺服器CPU,它們會使用臺積電5nm,聲稱電晶體密度和能效比是現在EPYC 7nm工藝的2倍,效能提升25%(對消費端的Ryzen Zen 4也是好訊息)。
新的96核Genoa(熱那亞)是Zen 4架構,單核和多核效能都會有提升,支援DDR5記憶體、PCIe 5.0和CXL 1.1(Compute Express Link),為高效能計算(HPC)、通用型的資料中心、企業、雲端伺服器而設計,正在向客戶進行抽樣調查,將在2022年釋出。
而128核的Bergamo(貝加莫)預計在2023年釋出,它是為雲端原生應用專門定製的高密度多執行緒架構,整合128個Zen 4c核心,這裡的“c”代表為雲端原生工作負載設計。也就是說,AMD Zen 4架構也會有2種核心,而Zen 4c明顯就是“小核”。
Bergamo(貝加莫)也支援DDR5記憶體、PCIe 5.0、CXL 1.1、相同的RAS和全套Infinity Guard安全功能。其指令集、針腳都和Genoa(熱那亞)相容,意味著你可以把兩代CPU放在同一臺處理器裡面。
新的Zen 4c核心,應該會比標準的Zen 4核心更小,去掉某些不需要的功能以提升計算密度。但它有專門為密度最佳化的快取結構來增加核心數目,從而應對需要多執行緒效能的雲端伺服器負載。
新核心的獨立快取可能會更小,甚至可能會少一級快取,但AMD沒有透露更多的細節。
除了基於3D V-Cache堆疊快取的升級版霄龍7003x系列處理器,AMD還為資料中心帶來了另一款神器:Instinct MI200系列加速卡(加速器)。
這是AMD的第一款ExaScale百億億次級別加速卡產品,號稱在同類產品中擁有世界上最快的HPC效能、AI效能。
Instinct MI200系列升級為新的CDNA2計算架構,搭配升級的6nm FinFET工藝,並使用2.5D EFB橋接技術,業內首創多Die整和封裝(MCM),內部集成了兩顆核心。
還有第三代Infinity Fabric匯流排互連技術,頻寬100GB/s,最多8條與第三代霄龍處理器互通,實現CPU/GPU記憶體一致性。
軟體API支援OpenMP、OpenCL、HIP、ROCm Open、TensorFlow、PyTorch、Kokkos、RAJA。
新系列分為兩款型號,Instinct MI250X集成了220個計算單元、14080個流處理器核心,最高頻率1.7GHz,並有第二代矩陣核心,峰值效能為:FP16半精度383TFlops、FP32單精度/FP64單精度47.9TFlops、FP32單精度/FP64雙精度矩陣95.7TFlops、INT4/INT8/BF16 383TFlops。
記憶體/視訊記憶體搭配8192-bit位寬的128GB HBM2e,頻率1.6GHz,峰值頻寬3276.8GB/s,並支援全晶片ECC。
整卡採用OAM模組形態(未來也會推出PCIe擴充套件卡形態),支援PCIe 4.0 x16,被動散熱(系統散熱),典型功耗500W,峰值功耗560W。
Instinct MI250精簡為208計算單元、13312流處理器核心,各項效能指標也順應下降約5.5%,其他規格完全不變。
AMD宣稱,Instinct MI200系列效能雙精度效能比競品高出最多4.9倍,比上代提升最多4倍。
MI200系列已經贏得了多項客戶解決方案,包括ATOS BullSequana X410-A5 2U1N2S(雙CPU四GPU)、戴爾PowerEdge R7525(雙CPU三GPU)、技嘉G262-Z00(雙CPU四GPU)、HPE Cray EX235a(單CPU四GPU)等等,其他客戶還有話說、聯想、KOI Cmputers等等。
尤其是與美國國防部橡樹嶺國家實驗室、HPE合作打造的超級計算機“Frontier”,採用第三代霄龍處理器、MI250X加速卡,峰值算力高達150億億次浮點計算每秒。