明敏 發自 凹非寺
量子位 報道 | 公眾號 QbitAI
AMD造勢已久、面向高效能計算的MI200,終於來了!
在拿下元宇宙大客戶Meta後,AMD乘勢而上官宣一系列新晶片,其中就包括這張不斷有訊息曝出的計算加速卡。
它採用6nm工藝,擁有580億個電晶體、超過14000個核心、128GB的HBM2e視訊記憶體,FP32效能達到95 TFLOPs 。
官方表示,它可以加速機器學習等任務,對標英偉達A100。
沒錯,是要和老黃搶盤中餐的節奏。
並且該晶片之後還將被用於美國橡樹嶺國家實驗室的超算系統中。
所以,MI200效能到底如何呢?
FP64效能是A100的4.9倍
本次釋出的MI200系列中,包含Instinct MI250X和Instinct MI250兩款晶片。
與120個計算單元(CU)、7689個核心的MI100相比,其效能有了大幅提升。
- MI250X有220個計算單元 (CU) 和14080個核心。
- MI250則有208個計算單元 (CU) 和13312個核心。
它們採用了全新的CDNA 2 架構,可加速FP64和FP32矩陣運算,與上一代MI100相比,FP64理論峰值效能最多可高出4倍。
2.5D Elevated Fanout Bridge(EFB)封裝技術讓MI200在核心數上較上一代增加了1.8倍,記憶體頻寬增加了2.7倍,聚合理論峰值記憶體頻寬也高達每秒3.2TB。
與此同時,第三代AMD Infinity Fabric 技術可管理8條Infinity Fabric鏈路,讓MI200計算節點可與第三代霄龍(EPYC)處理器或其他GPU相連,從而實現統一的CPU/GPU一致性、並最大限度地提升系統吞吐量。
既然說對標英偉達A100,那具體表現如何呢?
製作工藝上,A100採用7nm製程,整合超過540億個電晶體,視訊記憶體為80GB。
MI200系列則採用6nm工藝,擁有580億個電晶體,視訊記憶體達到了128GB。
效能對比中,MI200的FP64效能是A100的4.9倍。
在處理加速任務中,AMD也對MI200系列和A100進行了對比:
以處理分子動力任務為例,MI250的效能表現是A100的2.2倍。
在其他幾項任務中,MI250的表現也都優於A100(具體資料可參看文末參考連結4)
AMD愈加搶眼
此次除了釋出MI200之外,AMD還發布了首款採用3D V-Cache 技術的伺服器處理器產品——EPYC Milan-X。
這款晶片之後將被用於微軟的Azure雲計算服務。
而在產品之外,AMD近期的財務表現也非常搶眼。
先與Meta達成合作,後又釋出系列新晶片,讓AMD的股價也在這周第一個交易日大漲10%以上。
上個月釋出的Q3財報中顯示,AMD營收同比增長54%,較老對手英特爾表現亮眼,也讓不少人更加看好AMD。
這一次,AMD的這次動作更是瞄準英偉達的王炸A100釋出對標產品。
而且網友表示,與Meta合作意味著AMD的卡將來可能可以移植Pytorch,英偉達在機器學習上的壟斷地位或許會被撼動。
參考連結:
[1]https://ir.amd.com/news-events/press-releases/detail/1032/new-amd-instinct-mi200-series-accelerators-bring
[2]https://www.reuters.com/technology/amd-lands-meta-customer-takes-aim-nvidia-with-new-supercomputing-chips-2021-11-08/
[3]https://www.tomshardware.com/news/amd-instinct-mi200-chiplet-datacenter-gpu
[4]https://www.amd.com/en/graphics/server-accelerators-benchmarks
— 完 —
量子位 QbitAI · 頭條號簽約
關注我們,第一時間獲知前沿科技動態