前言
英偉達找神奇怪獸(注1)打牌,兩人鬥地主,英偉達甩出四個2,沒想到神奇怪獸用雙王炸。
注1:神奇怪獸,AMD公司名稱為Advanced Micro Devices,Inc ,站長為其取了一個別號:Amamzing Monster Digital, Inc(神奇怪獸公司)
英偉達有些懵:“運氣這麼好?”
神奇怪獸嘿嘿一笑:“是啊,一張是剛摸到的,一張是到新規中心領的,怎麼,你沒去領啊?”
原來打牌還有這個操作,可以先去“領”一張王。
神奇怪獸摸到的這張王,是“Infinity Cache(無限快取)”技術,而領的這張王,是“SAM”,正是憑藉雙王炸,在最新一代的顯示卡能耗比大戰中,擊敗了老牌勁旅英偉達。
此文就扯扯這雙王是咋回事。
正文
RDNA2的研發面臨著頻寬嚴重不足,要麼用功耗成本都高的HMB2、GDDR6X,要麼就另闢蹊徑。
第一張王牌(大王)——無限快取(INFINITY CACHE)技術,既憑實力,也有運氣成分。
AMD同時擁有CPU和GPU事業部,不知道是哪位天才的建議,把EPYC霄龍處理器上的L3快取(高密度SRAM)加以改進,用來作GPU的快取,同時把銳龍處理器的“Infinity Fabric”匯流排技術應用進來,雙劍合璧後可以提升頻寬,但提升的比例在設計之初並不明朗。這有點類似我們改進了學習方法,都知道能提分,但提升的幅度多少?並不清楚。
最終的成績讓人驚喜,256bit GDDR6 視訊記憶體加128MB無限快取,等效頻寬相當於384-bit GDDR6視訊記憶體的2.17倍,同時功耗僅為對方的90%。
下面大概算筆賬。
根據公式:
視訊記憶體頻寬(GB/s)=視訊記憶體速率(Gbps)x 視訊記憶體位寬(bit)/8
GDDR6 位寬384-bit,速率16Gbps的頻寬=768GB/s
對比:無限快取技術配合256bit的GDDR6視訊記憶體,其等效頻寬可達到768X2.17=1666GB/s,要注意2.17倍是對比的384bit視訊記憶體,相比256bit實際為3.25倍!
英偉達這邊,GPU倒是厲害,但視訊記憶體頻寬不夠,RTX3090無奈採用成本和功耗更高的GDDR6X,384bit,速率19.5Gbps,頻寬只有384X19.5/8=936GB/s,假設不惜血本強上512bit和21Gbps視訊記憶體,頻寬也只有1344GB/s,而對手只用了128MB快取,就達到等效1666GB/s。
這效果太恐怖了!一個平時只能考45分的普通生,換了種學習方法,原以為能考80、90分就不錯了,竟然直達146分!一個學霸開著跑車遙遙領先,只聽得耳邊“嗖”得一聲,有人坐著火箭超了過去,在現實中就類似這麼個情況。
一石二鳥
無限快取不僅大幅度提升了頻寬,還提升了能耗比。
據美光提供的資料,同為8顆視訊記憶體,GDDR6X能效比較GDDR6的每位元能耗要低15%,與此同時多35%的視訊記憶體頻寬。
因為其速率更高,GDDR6X的“能效比”更出色並不等於功耗更低。19.5Gbps的GDDR6X視訊記憶體的功耗大約比14Gbps的GDDR6高18.4%。由此,RTX3090和RX6900XT對比,拋開GPU功耗不說,RX6900的僅視訊記憶體功耗就比對手低一截。
第二張王牌(小王)——SAM(Smart Access Memory智慧定址視訊記憶體)
在普通windows計算機中,處理器一次只能訪問一小部分視訊記憶體 ,因此限制了系統性能。
透過 AMD SAM技術,擴充套件了資料通道,利用 PCI-E頻寬消除效能瓶頸,可以充分發揮GPU和視訊記憶體的潛力。
開啟SAM之前,處理器通只能直接訪問視訊記憶體的一小部分(256MB),開啟後可以識別和使用顯示卡的全部視訊記憶體,不少遊戲的幀數均有明顯提升,官方資料是平均6%。
SAM並非萬能藥,目前只對部分遊戲有明顯療效。不過,由於這項效能的提升是“白撿”,白撿的永遠是“最好的”,使用者關注度極高,主機板工廠深諳此道,紛紛推出新版BIOS來支援,以博取消費者的垂青。
AMD平臺開啟SAM需要三個條件——
1、CPU:AMD Ryzen 5000系列的處理器
2、主機板:X570/B550的主機板(400系列主機板看工廠心情,有些品牌已經提供新BIOS支援)
3、顯示卡:AMD Radeon RX 6000系列顯示卡。
這張牌是從PCI-E規範那裡領出來的
SAM並非AMD獨家秘笈,是PCI-E規範“ resizable Base Address Register(可變大小基址暫存器)”的應用。
銳龍5000系列處理器增加了一個新的物理層(full-rate_pdep_u32/64)以支援SAM,之前的4000、3000、2000等老系列則無法支援。(注:有傳言ZEN2也可以,但未經證實,估計效果不佳)
讓人吃驚的是,Intel 從第四代酷睿Haswell(對應主機板為Z97/Z87/B85/H81),就已經支援Resizable-BAR,換句話說,如果主機板廠家大發慈悲,i5-4590/i7-4770等處理器同樣可以開啟SAM。(當然,沒有人會有閒心去給老大爺打生長激素)
現在,華碩、技嘉、微星等廠商,為其Z590/Z490/Z390、B560/B460等主機板提供新版本BIOS,以支援智慧視訊記憶體定址。
因此,intel平臺+RX6000系列顯示卡,同樣可以領取到這張小王牌。
N卡能否開啟SAM?
目前,NVIDIA這邊已經發布了新驅動來支援Resizable Bar,但暫時只有RTX3000系列能享受這一待遇。
與此同時,有些廠商開始提供新BIOS,讓AMD主機板支援RTX3000系列開啟SAM(下圖)
綜上,我們可以得出以下結論,在符合相關條件的基礎上,
1、AMD主機板+AMD顯示卡
2、AMD 主機板+NVIDIA顯示卡
3、intel 主機板+AMD顯示卡
4、intel 主機板+NVIDIA顯示卡
這四大平臺,均有資格領取SAM這張小王牌。
總結
對英偉達來說,拿到SAM(小王牌)並無多大難度,困難的是要摸“大王”這張牌,需要開發類似無限快取的技術,這不僅有較高的壁壘,同時還需要避開AMD的相關專利。
AMD這幾年的進步確實讓對手冒冷汗,RDNA和RDAN2,基因突變的力量,隔著螢幕都能體會到。