1. 誘人的CPU
如果沒有幾個吸睛的新CPU,任何關於資料中心晶片的總結都是不完整的。隨著英特爾、AMD和Ampere的新晶片的出現,有很多東西值得興奮。
英特爾預計將率先登場,部分原因是其即將推出的Sapphire Rapids Xeon可擴充套件處理器在最後一刻被推遲。新的至強處理器定於今年年初發布,擁有許多誘人的新功能,包括全新的多晶片架構,英特爾最先進的10納米制造工藝,以及片上的高頻寬記憶體。
釋出會上,AMD對基於Zen 3的EPYC Milan處理器進行了更新,該公司聲稱,在 "目標技術計算工作負載 "中,其效能可提高50%。然而,AMD的重要釋出要到2022年下半年才會發生,屆時將推出代號為Genoa的EPYC 4。
雖然對AMD的下一代資料中心晶片知之甚少,但我們確實知道它將基於TSMC的5納米制造工藝,擁有多達96個核心。
AMD執行長Lisa Su在去年11月的一次主題演講中說:"當它被推出時,我們預計Genoa將成為世界上效能最高的通用計算處理器。
新興的基於Arm的資料中心晶片製造商Ampere也不甘示弱,將在今年晚些時候推出其首個基於完全定製核心架構的晶片。該晶片製造商的上一代Altra處理器是基於Arm Neoverse核心設計的,在300瓦的功率範圍內實現了多達128個核心。
"這個下一代部件將比我們的Altra Max的效能顯著提高。它有更多的核心,是一個新的平臺,"Ampere公司首席產品官Jeff Wittich在早些時候的一次採訪中透漏。
與AMD一樣,Ampere即將推出的晶片將採用5納米制造工藝。然而這些晶片將提供更多的核心數量。雖然Ampere公司沒有說該晶片將有多少個核心,但我們可以預計它將超過Ampere公司Altra Max晶片中的128個。
2. 大量快如閃電的記憶體
所有即將推出的CPU都增加了對DDR5記憶體的支援。雖然這聽起來並不那麼令人興奮,但對於執行大量記憶體密集型工作負載的資料中心來說,這是一個福音。
與以往的升級一樣,DDR5將具有比DDR4更高的單模組容量,同時將記憶體傳輸率大幅提高。與上一代記憶體的不同,DDR5還標誌著將片上糾錯程式碼作為一項標準功能,並集成了電源管理以提高效率。
為了讓你瞭解DDR5有多大的升級,世界上最大的記憶體製造商之一三星在2021年的Hot Chips大會上預告了512GB的模組,傳輸速度達到7Gb/s。
這意味著我們可以在不久之後看到伺服器的板載記憶體達到8甚至16terabytes。相比之下,大多數伺服器上的DDR4最高只有128gigabytes,每個模組3.2Gb/s。
3. PCIe 5.0,CXL打開了可組合基礎設施的大門
下一代CPU還引入了PCIe Gen.5.0,使外圍裝置的可用頻寬增加了一倍,是上一代產品的兩倍。
上個月,三星宣佈其PM1743 PCIe 5.0固態硬碟的讀取速度達到每秒13gigabyte,寫入速度達到每秒6.6gigabytes,輸入/輸出操作達到25萬次。這是一個巨大的效能提升,這將使人工智慧工作負載的解除安裝速度大大加快,從而使人工智慧加速器和NVMe儲存的速度加快。
除了更高效能的儲存和對頻寬要求很高的AI工作負載,PCIe 5.0代還引入了Compute Express Link(CXL),使CPU和外圍裝置之間有了直接的記憶體介面。
CXL的早期應用之一將是實現大型永續性記憶體池,不需要像英特爾的Optane那樣的專有介面。相反,系統整合商和OEM廠商可以利用每個現代主機板上的標準PCIe介面。
除了永續性記憶體,CXL聯盟還在關注其他外圍裝置的機會,包括GPU、FPGA和乙太網網絡卡。從理論上講,CXL可以透過高速乙太網實現直接的記憶體介面,使資料中心運營商能夠在沒有明顯效能瓶頸的情況下組成資源池。
4. 400G網路的到來
說到網路,PCIe 5.0對於下一代網絡卡和DPU也是必不可少的,其中有幾個計劃在今年下半年推出。
隨著網路頻寬的增加,PCIe現在成為了限制因素。今天最好的網絡卡僅有雙埠100Gb/s,這足以使PCIe Gen.4.0 16x介面完全飽和。
雖然PCIe Gen 5.0實現的400 Gb/s的吞吐量對於一臺伺服器來說可能聽起來有些過剩,但這並沒有阻止網路供應商進一步抬高邊界。
Nvidia本月推出的ConnectX-7 NIC,是首批利用這些頻寬進展實現一對200Gb/s介面的產品。同時,Nvidia的BlueField-3 DPU將於5月推出,它建立在ConnectX-7的基礎上,面向更廣泛的輸入/輸出(I/O)工作負載,如網路、安全、儲存和虛擬化。
Nvidia並不是今年推出高吞吐量DPU的唯一供應商。Marvell公司的Octeon 10 DPU預計將在2022年下半年推出,擁有PCIe 5.0,聚合頻寬高達400Gb/s。
5. 大量的人工智慧加速器
Nvidia的A100 GPU在2021年主導了高效能計算(HPC)領域,該晶片為今天Top500和Green500中許多最強大的超級計算機提供動力。
然而,在去年11月AMD推出第二代Instinct GPU之後,這種領先地位已經受到威脅。
AMD的MI200系列具有兩個GPU晶片,基於6納米制造工藝,共有580億個電晶體。這意味著有220個計算單元和880個矩陣核心,比上一代MI100增加了1.8倍。
GPU由多達8個封裝的高頻寬記憶體模組提供,總記憶體為128G。
從紙面上看,GPU應該讓AMD在人工智慧和HPC領域超越Nvidia。AMD公司資料中心和嵌入式解決方案高階副總裁兼總經理Forrest Norrod聲稱,MI200在高精度浮點64計算中比Nvidia的A100快490%。"他說:"這對於需要最高精度的HPC工作負載至關重要,比如天氣預報。“
美國能源部的橡樹嶺國家實驗室計劃在其即將推出的Frontier超級計算機中使用新的GPU。而且,假設正在共同開發該系統的惠普企業公司(HPE)不會再次意外地擦除研究資料,該超級計算機預計在今年年初上線時將提供1.5 exaFLOPs的計算能力。
當然,現在還不要把Nvidia算進去。你可以期待身著標誌性皮夾克的Nvidia執行長Jensen Huang,在今年晚些時候推出其Ampere Next架構來回擊。
不幸的是,我們至少要等到4月份才能看到綠隊的更新。