今天我們說一說NVIDIA RTX4000這個GPU卡,挖掘一下這個卡的過人之處。
在NVIDIA的官網上,這個卡的規格是這樣的:
注意:這不是 GeForce 產品。今年早些時候,英偉達放棄了他們工作站產品的“Quadro”綽號,只是將 RTX A2000、A4000、A5000 和 A6000 用於各種基於 Ampere 的工作站 GPU。
簡而言之,RTX A4000 使用於 RTX 3070 Ti 相同的 GA104 晶片,這意味著它具有 6144 個 CUDA 核心、192 個 TAU 和 96 個 ROP。 效能上大約是3070的檔次,還不太到3070Ti,主頻比3070要低。
但是A4000有其它的特色:
1.大視訊記憶體
首先的特色是視訊記憶體:同檔次的3070或者稍微高一點點的3070Ti,只有8GB視訊記憶體,而這個卡有16GB視訊記憶體,視訊記憶體大一倍。
2.具備ECC
視訊記憶體有ECC。這點能吸引很多需要大視訊記憶體的使用者(例如深度學習的入門使用者),也能吸引經典科學計算的使用者(這畢竟是有ECC的專業卡,雖然沒有double),避免算了1個月,發現算錯了就坑爹了。類似的,整數計算也需要ECC來保證視訊記憶體中的資料的完整性的。
3.單槽和低功耗
這點可以看作是NVIDIA T4的直接對標和升級。價格比T4便宜好多好多;效能也好很多;同時NV吸取了T4的教訓,散熱和功耗都放開了:TDP從T4的75W幾乎快翻倍了,同時主動散熱(渦輪型,單向風道)能同時用於普通機箱和伺服器,散熱好很多。
但是依然維持T4的大家喜歡的單槽不變,能高密度堆積。可以用於1U的伺服器(至少能上2個),或者2U的伺服器(這個就多了,7-8個應該不成問題,2U的單槽多)。
這樣等於T4的外形,便宜的多的價格,改進了以前的溫度牆和功耗牆。
4.效能更穩定
回到卡的效能本身上來說,這卡的SP數量和3070Ti一樣,都是頂配的GA104. 為啥之前說基本是3070檔次?因為為了穩定,同樣數量的SP,基頻和Boost都比3070Ti低,所以說效能和3070差不多。同時視訊記憶體400GB/s出頭,和3070差不多。也就是計算上為了穩定,故意降頻一點點(你可以手工拉回來,拉掛了無保修)。
而且視訊記憶體上,用了3070一樣的GDDR6,不是更高的(從3070Ti+)的GDDR6X。所以訪存上是比不了3070Ti的(正常計算應用)。綜合看,等於是3070的計算和訪存效能,但是穩定了很多很多。
5.某些演算法
某些演算法的實現(就是某些計算量少,但是訪存量很高的一些演算法.....),在GPU上跑的時候,GDDR6X體現不出優勢(因為某些小單位的離散型訪問),計算效能又幾乎完全用不了,同時NV還限制了某些演算法。而正好A4000完美解決——自帶GDDR6,SP頻率低(省電),無限制。導致這卡成了執行某些演算法實現的神卡了,一個2U的機箱堆積7個或者8個卡,簡直不要太香。
6.不限制編碼路數
Quadro不限制編碼路數,家用卡有限制,做影片編碼,極好。
7.價格
目前A4000的價格不到9000元,geforce普遍暴漲情況下 這卡價格只比3070貴3000塊,要知道它是單槽的專業卡啊,系出名門,加上上面提到的這些優勢,就算是很超值了。
注意這卡不支援虛擬化,但是這卡這麼小,單槽,就應該直接雲平臺,一個使用者單獨分配一個,自身不需要虛擬化的。