AMD yes！拿下Meta後釋出晶片，FP64效能是A100 4.9倍，面向HPC

明敏發自凹非寺

量子位報道 | 公眾號 QbitAI

AMD造勢已久、面向高效能計算的MI200，終於來了！

在拿下元宇宙大客戶Meta後，AMD乘勢而上官宣一系列新晶片，其中就包括這張不斷有訊息曝出的計算加速卡。

它採用6nm工藝，擁有580億個電晶體、超過14000個核心、128GB的HBM2e視訊記憶體，FP32效能達到95 TFLOPs 。

官方表示，它可以加速機器學習等任務，對標英偉達A100。

沒錯，是要和老黃搶盤中餐的節奏。

並且該晶片之後還將被用於美國橡樹嶺國家實驗室的超算系統中。

所以，MI200效能到底如何呢？

FP64效能是A100的4.9倍

本次釋出的MI200系列中，包含Instinct MI250X和Instinct MI250兩款晶片。

與120個計算單元（CU）、7689個核心的MI100相比，其效能有了大幅提升。

MI250X有220個計算單元 (CU) 和14080個核心。
MI250則有208個計算單元 (CU) 和13312個核心。

它們採用了全新的CDNA 2 架構，可加速FP64和FP32矩陣運算，與上一代MI100相比，FP64理論峰值效能最多可高出4倍。

2.5D Elevated Fanout Bridge（EFB）封裝技術讓MI200在核心數上較上一代增加了1.8倍，記憶體頻寬增加了2.7倍，聚合理論峰值記憶體頻寬也高達每秒3.2TB。

與此同時，第三代AMD Infinity Fabric 技術可管理8條Infinity Fabric鏈路，讓MI200計算節點可與第三代霄龍（EPYC）處理器或其他GPU相連，從而實現統一的CPU/GPU一致性、並最大限度地提升系統吞吐量。

既然說對標英偉達A100，那具體表現如何呢？

製作工藝上，A100採用7nm製程，整合超過540億個電晶體，視訊記憶體為80GB。

MI200系列則採用6nm工藝，擁有580億個電晶體，視訊記憶體達到了128GB。

效能對比中，MI200的FP64效能是A100的4.9倍。

在處理加速任務中，AMD也對MI200系列和A100進行了對比：

以處理分子動力任務為例，MI250的效能表現是A100的2.2倍。

在其他幾項任務中，MI250的表現也都優於A100（具體資料可參看文末參考連結4）

AMD愈加搶眼

此次除了釋出MI200之外，AMD還發布了首款採用3D V-Cache 技術的伺服器處理器產品——EPYC Milan-X。

這款晶片之後將被用於微軟的Azure雲計算服務。

而在產品之外，AMD近期的財務表現也非常搶眼。

先與Meta達成合作，後又釋出系列新晶片，讓AMD的股價也在這周第一個交易日大漲10%以上。

上個月釋出的Q3財報中顯示，AMD營收同比增長54%，較老對手英特爾表現亮眼，也讓不少人更加看好AMD。

這一次，AMD的這次動作更是瞄準英偉達的王炸A100釋出對標產品。

而且網友表示，與Meta合作意味著AMD的卡將來可能可以移植Pytorch，英偉達在機器學習上的壟斷地位或許會被撼動。

參考連結：
[1]https://ir.amd.com/news-events/press-releases/detail/1032/new-amd-instinct-mi200-series-accelerators-bring
[2]https://www.reuters.com/technology/amd-lands-meta-customer-takes-aim-nvidia-with-new-supercomputing-chips-2021-11-08/
[3]https://www.tomshardware.com/news/amd-instinct-mi200-chiplet-datacenter-gpu
[4]https://www.amd.com/en/graphics/server-accelerators-benchmarks

— 完 —

量子位 QbitAI · 頭條號簽約

關注我們，第一時間獲知前沿科技動態

分類： 寵物

時間： 2021-11-09