按照社交軟體上的網友 Greymon55 的爆料,NVIDIA 的下一代 GPU 旗艦晶片 AD102 頻率將達到 2.2 GHz,結合之前傳聞該晶片的 CUDA Core 數量高達 18432,按照每個 CUDA Core 可以跑一條相當於兩個浮點操作的 FMA 指令,這將意味著 AD102 的完全體單精度浮點會高達 81TFLOPS。
這是什麼概念?
讓我們重溫一下目前 NVIDIA 的旗艦遊戲 GPU GA102,GA102 的 CUDA Core 數量是 10752 個,基於該 GPU 的 RTX 3090 採用削減版的 GA102-300 版,擁有 10496 個 CUDA Core,加速模式時的頻率為 1695MHz,此時的單精度浮點效能是 35.6 TFLOPS,可以預期,AD102 單憑浮點效能就可以做到 GA102 的兩倍以上。
需要注意的是,單純憑底層浮點效能是無法真正瞭解晶片的實際表現,例如 NVIDIA 安培架構的 CUDA Core 演算法是依照浮點單元來計算的,浮點單元數量是整數單元的兩倍,而在之前的圖靈架構裡,浮點單元數量和整數單元數量是對等的,這意味著如果遊戲的整數指令較多的話,安培的每 CUDA Core 效能攤分其實是要低一些的。
這次 Greymon55 除了爆料頻率外,還透露了 AD102 的記憶體型號依然是 GDDR6X,這就有點奇怪了,不過考慮到目前的 GPU 越來越傾向於整合更大的快取記憶體來改善記憶體頻寬的做法,GDDR6X 其實也是一個合理的選擇。
讓我們拭目以待吧。