在年初CES上,Intel就說過今年會推出兩代處理器,包括11代的Tiger Lake-H移動高效能處理器和Rocket Lake-S桌面處理器,還有12代酷睿處理器Alder Lake,當時並不以為然,覺得Intel大機率不會這麼快推出桌面版的12代處理器,因為以往都是移動低電壓版先行的,畢竟11代的Rocket Lake-S是3月才推出。然而,令人驚喜的是Intel真的在10月就把Alder Lake-S拿出來了,11和12這兩代桌面處理器之間才隔了7個月,這也是Intel更新得最快的一次了,之前的記錄是2017年推出的第7代與第7代,中間也隔了10個月。
12代酷睿處理器這麼快到來固然驚喜,其實更讓人驚喜的是,Alder Lake可以說是近年來x86處理器的一次大變革,是首次大規模在主流市場上應用混合x86架構,2019年Intel已經在Lakefield處理器上試驗過這種類似ARM big.LITTLE的異構計算架構,而現在正是那次試驗修成正果之時。
與第11代酷睿Rocket Lake相比,Alder Lake採用了許多新特性,製作工藝從成熟的14nm升級到最新的Intel 7,並首次應用了DDR5記憶體和PCI-E 5.0,CPU介面也從LGA 1200變成了LGA 1700,當然最重要的是,它採用了全新的混合架構設計,目前最高階的有8+8的核心組合。
Alder Lake架構解析
在談論Alder Lake處理器之前,我們需要了解組成Alder Lake的兩種核心:能效核(E-Core)與效能核(P-Core),以及為了讓系統更好的調配兩種不同架構不同功能的核心所推出的技術:Intel硬體執行緒排程器。
能效核
Gracemont是能效核的曾用代號,它是Atom處理器所用的Mont系列的第七代架構,它更追求能效,會在多執行緒以及執行緒吞吐上有所加強。此高能效x86微架構在有限的體積內實現多核任務負載,並具備寬泛的頻率範圍。它能夠透過低電壓能效核降低整體功率消耗,為更高頻率執行提供功率熱空間。這也讓能效核提升效能,以滿足更多動態任務負載。
能效核可以利用各種技術進步,在不額外增加處理器功率的情況下對工作負載進行優先順序排序,並改進處理器的IPC效能。
Gracemont大幅擴大了分支預測器,現在擁有5000個條目的分支目標快取區,實現更準確的分支預測。一級指令快取增大到64KB,在不耗費記憶體子系統功率的情況下儲存可用指令,它還擁有Intel的首款按需指令長度解碼器,可生成預解碼資訊,加速具有大量程式碼的現代工作負載。採用兩組三寬度的簇亂序執行解碼器,可在保持能效的同時,每時鐘週期解碼多達6條指令。
後端執行單元拓寬了,具備5組寬度分配、8組寬度引退、256個亂序視窗入口和17個執行埠,共計擁有4個整數ALU、2個載入AGU、2個儲存AGU、2個跳轉埠、2個整數儲存資料、2個浮點/向量儲存、2個浮點/向量堆疊、以及第3向量ALU。
儲存系統採用了雙載入雙儲存的配置,每4個核心共享4MB二級快取,快取頻寬高達64 Bytes/cycle,延遲則是17時鐘週期,並支援深度緩衝、高階預取器和Intel資源調配技術。
指令集方面,支援控制流強制技術和虛擬化技術重定向保護等功能;同時它也是首款支援AVX2指令集的“Mont”核心,以及支援整數人工智慧操作的新擴充套件。
與Skylake核心相比,能效核能夠在相同功耗下實現40%的單執行緒效能提升,或者只有不到40%的功耗提供相同的效能。與雙核四執行緒Skylake相比,四個能效核能夠在功耗更低的情況下同時帶來80%的效能提升,或者在提供相同效能的同時功耗減少80%。
效能核
效能核的曾用代號是Golden Cove,是Sunny Cove與Willow Cove這條核心線路下的直系後代。Tiger Lake所用的Willow Cove核心與Ice Lake上的Sunny Cove相比只是改動了快取部分,改動非常小,而Golden Cove與Willow Cove相比改動則非常大。
效能核旨在提高速度,突破低時延和單執行緒應用程式效能的限制。工作負載的程式碼體積正在不斷增長,需要更強的執行能力。資料集也隨著資料頻寬的需求提升而大幅增加。全新效能核微架構帶來了顯著增速同時更好地支援程式碼體積較大的應用程式,與現有CPU架構相比,效能核的改動可以歸納為更寬、更深、更智慧。
從Skylake到Sunny Cove,前端的改動非常小,主要是增大了緩衝區,而Golden Cove這次則是直接拓寬了前端,解碼長度從16位元組翻倍到32位元組,解碼器由4個增至6個,每時鐘週期執行微指令從6增至8。微指令佇列每個執行緒從70條目增加到72條目,單執行緒則從70增加到144。微指令快取從2.25K擴大到4K,增加了命中率與前端頻寬。
增強了編碼預取能力,4K指令TLB從128條目增加到256條目,2M/4M指令TLB從16條目增加到32條目,分支目標從5K增至12K,同時改進了分支預測精度,具備更智慧的編碼預取機制。
亂序引擎分配由5路增至6路,執行埠由10個增至12個,重排序緩衝區當年Sunny Cove已經從224條目增加到384條目,現在Golden Cove進一步增加到512條目,重新命名和分配階段也可以執行更多指令。
整數執行引擎增加了第五個通用執行埠,五個埠都有ALU和LEA單元,增加ALU數量很重要,因為ALU操作非常普遍,很多軟體都對其加以利用。
向量執行引擎在埠1和埠5下方各加了一個FADD快速加法器,此前Intel的處理器浮點加發都是交由FMA單元處理的,在埠0和1上需要4個時鐘週期,而埠5上則要6個時鐘週期,現在交由FADD做的話只需要3個時鐘週期,效率更高而且延遲更低。
FMA單元現在支援FP16浮點資料型別,它屬於AVX-512指令集的一部分,這在加速網路應用方面非常有效。
此外埠5上還多了個AMX單元,它的全稱是Advanced Matrix Extensions高階矩形擴充套件,它可執行矩陣乘法運算,現在支援AVX512_VNNI的處理器每個核心每時鐘週期可執行256次int8運算,而現在藉助AMX可讓這效能提升至8倍,達到每時鐘週期執行2048次int8運算,這可用於AI學習推理和訓練,讓處理器的AI效能大幅加速。
快取系統方面,增加了一個AGU Load的埠,載入埠從2個增加到3個,吞吐量提高了50%,可同時載入3組256bit的資料或2組512bit的資料,這有效的降低了L1快取延遲, 同時加深了載入與儲存快取區,使其具備更強的記憶體並行性,對大型資料和程式碼體積較大的應用程式提供更好的支援。
L1資料TLB從64條目增加到96條目,L1資料快取可並行多獲取25%以上的未命中,資料預取器得到了增強,可面對更強的亂序執行架構,可同時服務4個page-table walks,較上代架構翻了一倍,這對現代大型、不規則資料集的工作負載更為有利。
L2快取桌面與移動端每核心還是和Tiger Lake一樣是1.25MB,但與現在11代桌面處理器相比則是增加了150%,伺服器的Sapphire Rapids則是每核心2MB,優化了全寫入預測頻寬,減少記憶體讀取。
Golden Cove相比目前第11代酷睿桌面處理器的Cypress Cove,在通用效能的ISO頻率下,針對大範圍的工作負載實現了平均約19%的效能提升,大家可以理解成IPC提升了這麼多。
兩種核心的效能差距
那麼效能核與效能核之間到底有多少效能差距呢?
傳統的處理器,單執行緒效能與多執行緒效能是呈線性關係的,核心架構的單執行緒效能越強,多執行緒效能就越強
但在Alder Lake這種混合架構處理器中就不一樣了,P-Core效能核的目的是提升處理器的單執行緒效能,而E-Core效能核的目的設計目的則是用更低的功耗來提升多執行緒效能,根據Intel的示意圖,四個效能核加起來才等於一個性能核那麼大。
在相同頻率下,P-Core的效能比Comet Lake(也就是Skylake)提升了28%,比Rocket Lake提升了14%,而E-Core的效能也是要比經典的Skylake高一個點的,當然P-Core與E-Core的同頻差距還是蠻大的。
效能核在同功耗的情況下單執行緒效能比效能核高出50%,而且實際情況是效能核的頻率與功耗會比效能核高得多,所以這個差距會更大,當然了,效能核本身的效能不差,別把他們看作ARM處理器的小核。
多執行緒的時候就會變得很有趣,4個性能核與2個性能核加8個效能核的晶片尺寸應該是差不多的,前者有8個執行緒,後者則是4+8共12個執行緒,而Intel給出的測試結果是2+8的組合比單純4個性能核多執行緒要領先50%。
很明顯想提升多執行緒效能堆效能核其實更省芯片面積,更加划算,當然了實際使用時大部分應用不會直接把CPU的執行緒數佔滿,這時就需要效能核展現其高效的單執行緒了,Intel肯定是實際考量過各種日常應用的負載情況才有了各種不同核心數量組合的Alder Lake處理器。
在製程和架構雙升級的情況下,第12代酷睿處理器與上一代產品能耗比有非常大的提升。
上一代酷睿i9-11900K的PL2是250W,而酷睿i9-12900K的PL2降低到241W,雖然功率下降了,但多執行緒效能依然可以領先50%。如果把功率降低到125W的話,它依然會比上一代有30%的效能提升,而要做到和酷睿i9-11900K相同的效能,酷睿i9-12900K只需要65W的功率就能做到了。
英特爾硬體執行緒排程器
Alder Lake處理器內有效能核與效能核兩種核心,為使作業系統能夠更為正確的使用兩種核心,Intel開發了一種改進的排程技術——Intel Thread Director,也就是英特爾硬體執行緒排程器。
硬體執行緒排程器直接內置於硬體中,可提供對核心狀態和執行緒指令混合比的低階遙測,讓作業系統能夠在恰當的時間將合適的執行緒放置在合適的核心上。硬體執行緒排程器具有動態性和自適應性——它會根據實時的計算需求調整排程決策——而非一種簡單的、基於規則的靜態方法 。
傳統的作業系統排程器會根據有限的資料來分配任務,如前臺和後臺任務,硬體執行緒排程器則是根據實時的監控核心狀態然後做出一個動態和智慧的反應,從而幫助作業系統做出更智慧的排程決策,將需要更高效能的執行緒引導到當時適合的效能核上 ,它只需大概30ms就能識別出工作負載的型別並反饋給系統的排程程式。
這一點帶來的最大好處是軟體不需要重寫程式碼,如果是固定執行緒調配,軟體就需要考慮把哪些執行緒放到更高效能的核上,哪些執行緒要放到更追求能耗的核上面,而透過硬體執行緒排程器這種實時動態智慧調整,軟體不需要做這樣的適配和調優。
其次是透過與微軟合作,在Windows 11系統上實現了硬體級別的執行緒調整,硬體執行緒排程器能夠把更多核心資訊透過回報給作業系統的排程器,作業系統就可以更好的在系統級別去做執行緒的排程,這套體系能更好服務於Alder Lake混合的效能核和能效核。
至於Windows 10系統,要用上硬體執行緒排程器還有一些工作要做,現在還沒有更多資訊可披露。
第12代酷睿處理器Alder Lake
上面說了這麼多架構方面的東西,其實都是第12酷睿Alder Lake處理器的一部分,而接下來終於要介紹這款處理器的規格了。
Alder Lake是Intel首款大規模推向各級市場的混合架構處理器,而此前的Lakefield只是一個試點,新一代處理器將採用Intel 7工藝生產,也就是原本的10nm Enhaned SuperFin,會囊括TDP 9W到125W的產品,新的處理器支援DDR5、PCI-E 5.0、Thunderbolt 4以及WiFi 6E。
Alder Lake處理器有三種不同的封裝方式,包括桌面的Socket LGA 1700,移動版的BGA Type3以及低功耗移動版BGA Type4 HDI,兩種移動版的都會與PCH一同封裝在同一塊PCB上。
桌面版的最多8個效能核8個性能核,16核心24執行緒,配備32個EU的核顯,TDP最高125W,從方框圖上可以看出桌面版的沒有整合Thunderbolt 4控制器,也沒有用來處理影象輸入資料的IPU影象處理單元。
移動版最多8個效能核6個性能核,14核心20執行緒,配備96個EU的核顯,TDP應該在15W到45W之間,BGA Type3的封裝尺寸為50*25*1.3mm。
低功耗移動版最多8個效能核2個性能核,10核心12執行緒,配備96個EU的核顯,TDP小於9W,BGA Type4 HDI的封裝尺寸是28.5*19*1.1mm。
目前釋出的只有六款桌面版處理器,包括Core i9-12900K/KF、i7-12700K/KF和i5-12600K/KF。其中酷睿i9有完整的8個P-Core和8個E-Core,16核24執行緒;酷睿i7少4個E-Core,12核20執行緒,酷睿i5則少了2個P-Core和4個E-Core,10核16執行緒。
Alder Lake的每個效能核心可提供1條執行緒,而每個效能核心則可提供2條執行緒,所以才有了16核24執行緒這樣的組合。L3快取的話則是每個效能核心最多3MB,每4個效能核心也最多3MB,所以桌面版的最多會有30MB L3快取,而移動版的應該是最多24MB。
各款處理器的具體睿頻設定如下表所示:
核顯從上一代的UHD 750升級到UHD 770,影片編碼器翻倍到兩個,最大輸出從3屏增加到4屏,最大解析度也從5120*3200 @60Hz提升至7680*4320 @60Hz,核心依然是Xe-LP架構,32個EU,不過由於製程的升級,頻率從最高1300MHz提高到1550MHz,效能也有對應的提升。
12代的預設功耗設定也進行了升級,現在不用TDP了,PL1叫處理器基礎功耗,PL2則叫作最大睿頻功耗,12代酷睿K系列處理器預設的功耗設定都是PL1=PL2,以酷睿i9-12900K為例,它預設的設定就是PL1=PL2=241W,你在BIOS裡面改回原來的那種設定,此時PL2=241W,PL1=125W,後續的非K系列處理器則會明確區分PL1與PL2功耗。
12900K/12700K/12600K處理器圖賞
我們手頭上12代酷睿處理器K系列處理器是齊的,有酷睿i9-12900K、酷睿i7-12700K以及酷睿i5-12600K,這三顆都是正式版。
第12代酷睿處理器的介面從LGA 1200變成了LGA 1700,外形也從LGA 775一直沿用的37.5*37.5mm的正方形變成了45*37.5mm的長方形,頂蓋大小從上上一代的31.6*27.65mm增大到38.25*28.25mm,表面積增加約24%,理論上能提供更好的散熱能力,同時也為散熱器升級提供了契機,另外CPU防呆缺口位置也從左右兩側改成上下佈置,缺口從兩個增加到四個。
LGA 1700(左)與LGA 1200(右)觸點對比,注意LGA 1700的觸點形狀不是完全一致的
左邊是酷睿i9-12900K,右邊是酷睿i9-11900K
此外CPU的PCB與頂蓋厚度也有所變化,經測量,PCB厚度從上代的1.21mm降低到1.12mm,但PCB加頂蓋的整體厚度從4.35mm增加4.42mm,說明頂蓋的厚度是有增加的。
實際上第12代酷睿處理器晶片的封裝厚度以及所用的TIM材料與第10以及11代處理器相比是變薄了的,但頂蓋厚度增厚了,Intel說這樣有助於改善散熱能力。
此外LGA 1700插座的散熱孔距從LGA 15xx/1200插座的75mm改為78mm,但底座的高度降低了0.8mm,根據我們實測,底座再加裝上CPU的高度總體上比上一代降低了約0.9mm,雖然有主機板同時提供兩種孔距,但使用LGA 15xx/1200的扣具時會出現壓力不足的問題,對散熱效能有一定影響,主機板廠提供舊孔距是為了方便玩家可以使用原來的舊散熱器,但如果散熱器廠家推出LGA 1700扣具的話請立即更換。
搭配的Z690晶片組
桌面版Alder Lake可提供16條PCI-E 5.0通道與4條PCI-E 4.0,很明顯PCI-E 5.0是給顯示卡的,PCI-E 4.0則是給M.2 SSD,16條PCI-E 5.0是可以拆分成兩條x8的,但不能拆分成x8+x4+x4的模式。
CPU與Z690 PCH是用x8 DMI 4.0通道相連的,頻寬相當於PCI-E 4.0 x8,與11代酷睿的x8 DMI 3.0相比頻寬翻了一倍,是10代酷睿的4倍,現在CPU與PCH相連的通道是主流桌面平臺上最寬的。
Z690 PCH最多可提供12條PCI-E 4.0與16條PCI-E 3.0。整套平臺可提供PCI-E 5.0/4.0/3.0各16條,一共48條PCI-E通道,作為對比,現在11代酷睿搭Z590可提供20條PCI-E 4.0與24條PCI-E 3.0,共44條PCI-E通道,而AMD銳龍3000/5000處理器搭X570平臺則可提供36條PCI-E 4.0。
其他的變化包括USB 3.2 Gen2*2介面數量從最多3個增加到4個,SATA口數量從6個增加到8個,整合的無線網絡卡也從WiFi 6升級到WiFi 6E標準,需要搭配AX210無線網絡卡使用。
DDR5記憶體與XMP 3.0
Alder Lake的一大新特性就是支援DDR5記憶體,是第一款支援DDR5的處理器,根據JEDEC的標準DDR5起步傳輸速率就要達到4800MT/s,這也讓DDR5在最初就會擁有比DDR4高出50%的傳輸頻率。
當然DDR5並不是透過提升頻率來提高傳輸率的,而是提高資料預讀取位寬,DDR4和DDR3都是8-bit預取寬度,在DDR5上每個時鐘週期都會預取16-bit的資料,讓等效頻率的倍數再翻倍,在與DDR4核心頻率相同的情況下,DDR5記憶體的等效頻率要比DDR4高出一倍,並引入判決反饋均衡器幫助改善訊號純度。
此外在使用DDR5記憶體時會發現安裝兩條記憶體時CPU-Z裡就會顯示你在用四通道,當然這並不是傳統意義上的四通道,總記憶體位寬還是128-bit沒變的,DDR5將單條DIMM分割成了兩個更小的通道。原本每根DIMM上只有一個64-bit寬度的資料通道,現在總的資料寬度沒有變化,但它是由兩個32-bit的子通道所組成的,兩個相互獨立的子通道將可同時進行資料讀寫操作,大大提升了記憶體操作的靈活度。
DDR5與DDR4的防呆缺口位置是不一樣的
供電方面,DDR5除了把標準電壓從1.2V降低到1.1V外,還把記憶體供電模組轉移到記憶體上,以往這部分是主機板負責的,現在記憶體可以自己管理電壓,這樣可提供更好的供電環境,使其工作更為穩定,速度更快、容量更大的DDR5記憶體對供電純淨度的要求更高,另一個是可以減小主機板設計的複雜程度,降低主機板的成本。
Intel在DDR3時代推出了XMP 1.0,DDR4時推出了XMP 2.0,現在DDR5來了,XMP 3.0也來了,與上代相比主要改進地方有三點:
1、預設檔案從原來的兩個增加到五個,其中三個是出廠就寫死不可再更改的,另外兩個可供使用者自行更改,這樣玩家就可以把自己設定好的時序、電壓直接寫到記憶體上,換了主機板也只需要開啟對應的XMP檔案就可以了。
2、現在可以用16個英文字母來命名自己的XMP檔案,這樣使用時會更加便利,也有利於分享。
3、現在電源管理晶片在記憶體上面,有VDD、VDDQ和VPP三個電壓,XMP 3.0也包含這三個電壓。
12代酷睿桌面版同時支援DDR5和DDR4兩種記憶體,官方給出的頻率是DDR5能到4800MHz,DDR4能到3200MHz,並且支援動態記憶體頻率調整技術,如果說CPU負載比較高,就會跳到比較高的頻率,也就是XMP的頻率。沒有負載時它會調回它自己的預設頻率,此功能可以在BIOS裡面開啟,只要是支援XMP的DDR4和DDR5記憶體均可開啟。
PCI-E 5.0
Alder Lake也首次把PCI-E 5.0引入消費市場,與之前的PCI-E 4.0相比,PCI-E 5.0依然採用同樣的128b/130b編碼方式、目標位元誤位元速率(BER)、信令和加擾方案等,但更改了EIEOS和資料位元率定義等。此外,還有其他的設計更改,比如二階響應的時鐘資料恢復(CDR)和CEM聯結器。
PCI-E 5.0帶來了更高傳輸速度,x16頻寬(雙向)從PCI-E 4.0的64 GB/s提升到了128 GB/s,提高了裝置傳輸速率的上限,以滿足資料中心、高效能計算、邊緣計算、機器學習、人工智慧和5G網路等場景裡日益增長的頻寬需求,也可以讓裝置製造商用更少的通道數實現同樣的頻寬。
在PCI-E 5.0的物理和電氣介面規範基礎上推出了對應的CXL 2.0規範,增加了記憶體池的支援,以最大限度地提高記憶體利用率,並且提供了對永續性記憶體的標準化管理,允許與DDR同時執行,從而可以釋放DDR用於其他用途,同時向後相容CXL 1.1和CXL 1.0版規範。CXL作為一種開放性的互聯協議,能夠讓CPU與GPU、FPGA或其他加速器之間實現高速高效的互聯,滿足現今高效能異構計算的要求,並且提供更高的頻寬及更好的記憶體一致性。
CXL 2.0使得PCI-E 5.0的應用進一步拓展,解決了CPU到裝置、裝置到裝置之間的記憶體一致性和統一問題。
測試平臺與說明
這次要測試的處理器包括12代的酷睿i9-12900K、酷睿i7-12700K、酷睿i5-12600K,我們拿了上代對位的酷睿i9-11900K與酷睿i5-11600K來對比,由於酷睿i7-11700K與酷睿i9-11900K的差距不大所以就不對比了, 但加了個採用Skylake核心的酷睿i9-10900K給大家作參考,至於對手AMD那邊我們也基本把銳龍5000全拿出來了,包括銳龍9 5950X、銳龍9 5900X、 銳龍7 5800X和銳龍5 5600X。
LGA 1700平臺使用華碩ROG MAXIMUS Z690 HERO主機板,LGA 1200平臺則是ROG MAXIMUS XIII HERO,AM4平臺用的是ROG CROSSHAIR VIII FORMULA,為了避免顯示卡上的瓶頸,採用了NVIDIA GeForce RTX 3090 Founder Edition顯示卡。記憶體方面LGA 1700平臺是兩條16GB芝奇RIPJAWS S5 DDR5-5200,時序是CL40-40-40-76,而LGA 1200與AM4平臺則採用兩根16GB的皇家戟DDR4-3600,時序是CL16-19-19-39。
散熱器統一使用華碩ROG 龍神II 360一體式水冷,比如還有像APEX Plus i360這樣的LGA 1700平臺專用的散熱器,為了統一測試平臺,我們選擇了龍神II 360。
酷睿i9-11900K在測試中全程開啟Adaptive Boost Technology,溫度與功耗限制採用主機板設定,不過Intel平臺功耗設定都是解除的。12代酷睿處理器是可以把能效核全部關閉的,但效能核至少得開一個,所以純能效核的效能是測不了的,但可以測試純效能核的成績,我們就拿酷睿i9-12900K把所有效能核關閉單獨測一個成績 ,經過我們測試,把效能核全關後AVX-512就能開啟。
CPU快取與記憶體測試
12代酷睿處理器同時支援DDR5和DDR4記憶體,DDR4記憶體控制器分頻設定和上代是一樣的,頻率在3600MHz下時會工作在1:1模式,而超過3600MHz就會工作在1:2模式,而DDR5記憶體預設就會工作在1:2模式,此外DDR5還有個1:4模式,但以目前DDR5的頻率,尚需要一段時間才能找到分頻點是多少。
現在DDR5記憶體才是剛起步階段,頻率不高但時序非常高,結果就是酷睿i9-12900K搭配DDR5-5200記憶體與DDR4-3600相比記憶體頻寬高出將近50%,但記憶體延遲也從55ns暴增到74ns,此外酷睿i9-12900K在使用DDR4時記憶體延遲是要比酷睿i9-11900K要高的,但依然比銳龍9 5950X低。
再來看看快取,AIDA64的一級和二級快取頻寬是算所有核心平均值的,所以測出來這個值並不代表性能核的表現,但延遲是用效能核來跑的,可以看得出二級快取的延遲是略微所上升,三級快取的頻寬翻了一倍,但延遲也加了許多。
基準效能測試
Sisoftware Sandra的處理器多媒體測試是支援AVX-512指令集的, 處理器多媒體測試的浮點專案是支援該指令集的,所以酷睿i9-12900K在關閉所有效能核後在這測試裡得分反而高了。正常跑的話酷睿i9-12900K整數和浮點效能基本都和銳龍9 5950X差很多,但浮點效能可以做到與銳龍9 5900X互有勝負。而酷睿i7-12700K基本上能浮點效能都比用AVX-512的酷睿i9-11900K更高,也要高於銳龍7 5800X。酷睿i5-12600K的浮點效能也要優於酷睿i5-11600K和銳龍5 5600X。但處理器多媒體測試專案裡面12代酷睿的表現有點奇怪,我懷疑這項測試只用到了效能核。
處理器計算測試的話,酷睿i9-12900K的整數效能比銳龍9 5900X要好,但弱於酷睿i9-10900K和銳龍9 5950X,但精度浮點效能它是最好的,但雙精度時下滑得非常厲害,12代酷睿都有這個現象,比較有趣的是雙精度浮點計算只使用效能核的酷睿i9-12900K效能下滑幅度和前兩代產品是差不多的,所以有一定可能性是效能核沒參與這項測試。
得益於DDR5記憶體的高延遲Alder Lake跑SuperPi反而比上一代Rocket Lake還要慢,這測試雖然說是頻率至上,但CPU與記憶體的延遲也是一個很重要的因素,在L3和記憶體延遲大幅增加的情況下Alder Lake在這項表現不太好,但依然要比對手的Zen 3要好。
另外這次沒有wPrime測試,因為Alder Lake會把這測試的執行緒全扔給效能核去跑,得出來的成績根本不正常,不過這也是很古老測試,程式不更新不適應新處理器也是沒辦法。
國際象棋這測試最多隻能測試16執行緒,並不適用於這次的全部受測產品,所以我們只用它來測試CPU的單執行緒效能,酷睿i9-12900K的效能和銳龍9 5950X沒太大區別,酷睿i7-12700K的效能略低於上代旗艦酷睿i9-11900K,而酷睿i5-12600K的表現比酷睿i5-11600K好得多,和銳龍5 5600X很接近。
7-zip使用最新版本內建的Benchmark測試,在壓縮測試裡面酷睿i5-12600K的表現其實已經比上代旗艦酷睿i9-11900K更強了,比十核的酷睿i9-10900K弱一點,只使用效能核的酷睿i9-12900K表現都比對手8核的銳龍7 5800X強不少,但8+8的酷睿i9-12900K依然比不過12核的銳龍9 5900X。
解壓縮測試,酷睿i5-12600K要優於銳龍5 5600X,但與只有8個性能核的酷睿i9-12900K差距還蠻大的,酷睿i7-12700K表現優於酷睿i9-11900K與酷睿i9-10900K,但略低於銳龍7 5800X,酷睿i9-12900K表現比銳龍7 5800X好得多,但與銳龍9 5900X差距很大。
3DMark CPU Profile測試可以測試CPU在不同執行緒下的效能表現,其實酷睿i9-12900K和在1到8執行緒時效能都是由於對手銳龍9 5950X的,但16執行緒則是對手高一點,最大執行緒依然是酷睿i9-12900K好,估計是銳龍9 5950X在32執行緒全開時頻率下降比較厲害。酷睿i7-12700K在任何執行緒下表現都比銳龍9 5900X好,但在1到8執行緒時效能表現低於酷睿i9-11900K,同樣酷睿i5-12600K在任何執行緒下都比銳龍7 5800X強。
關閉效能核的酷睿i9-12900K在4執行緒與8執行緒的跑分結果下降幅度很大,16執行緒時全開的酷睿i9-12900K會有優先把輔助交給效能核而不是用效能核的超執行緒,此時只有效能核的酷睿i9-12900K效能會下降10%,在特定執行緒下效能核作用還是很大的。
創作能力測試
x264以及x265是兩個老牌開源編碼器,應用相當廣泛,這次我們使用了新版本的Benchmark,它能更好的支援AVX 2指令集,此外x264的測試是支援AVX-512的,這測試酷睿i9-12900K的結果和銳龍9 5950X相當接近,酷睿i7-12700K的表現略低於銳龍9 5900X,但比銳龍7 5800X好得多,而酷睿i5-12600K的表現則強於酷睿i9-11900K。
X265的測試裡面酷睿i9-12900K與酷睿i7-12700K的差距沒拉開很多,表面這測試沒有充分利用這些處理器的全部執行緒,他們兩個的表現都優於銳龍9 5900X,酷睿i5-12600K的效能表現強於銳龍7 5800X,和酷睿i9-11900K畢竟接近。
Corona Renderers是一款全新的高效能照片級高真實感渲染器,可以用於3DS Max以及Maxon Cinema 4D等軟體中使用,有很高的代表性,這裡使用的是它的獨立Benchmark。這測試裡酷睿i9-12900K和銳龍9 5950X差距還蠻大的,但表現優於銳龍9 5900X,而少了四個效能核的酷睿i7-12700K表現則不如銳龍9 5900X,但比酷睿i9-11900K和酷睿i9-10900K強,酷睿i5-12600K表現則強於銳龍7 5800X。
POV-Ray是由Persistence OF Vision Development開發小組編寫的一款使用光線跟蹤繪製三維影象的渲染軟體,其主要作用是利用處理器生成含有光線追蹤效果的影象幀,軟體內建了Benchmark程式。單執行緒測試12代酷睿表現得十分生猛,對上代基本上是兩位數的效能提升,多執行緒的表現也不弱,酷睿i9-12900K領先銳龍9 5950X,酷睿i7-12700K也領先銳龍9 5900X,酷睿i5-12600K也比銳龍7 5800X強,順便把自家上兩代旗艦也超了。
V-Ray是由專業的渲染器開發公司CHAOSGROUP開發的渲染軟體,是業界最受歡迎的渲染引擎,其核心可應用在3Dmax、Maya、Sketchup、Rhino等多個軟體內,測試使用的是官方Benchmark。這項測試裡,酷睿i9-12900K的表現略低於銳龍9 5950X,但比9 5900X強,酷睿i7-12700K得分比銳龍9 5900X低一些,但比酷睿i9-11900K和酷睿i9-10900K好得多,酷睿i5-12600K的效能表現和銳龍7 5800X是比較接近的。
Blender是一個開源的多平臺輕量級全能三維動畫製作軟體,提供從建模,雕刻,繫結,粒子,動力學,動畫,互動,材質,渲染,音訊處理,影片剪輯以及運動跟蹤,後期合成等等的一系列動畫短片製作解決方案,我們使用的是2.93.5版本,現在只用測試工程來測試CPU的單執行緒效能,多執行緒測試使用官方的Benchmark工具。12代酷睿處理器單執行緒效能表現依然非常優秀,即使效能核頻率最低的酷睿i5-12600K單執行緒都比上代的酷睿i9-11900K更快。
這次多執行緒測試跑了全部六個專案,其實酷睿i9-12900K和銳龍9 5950X、酷睿i7-12700K和銳龍9 5900X、酷睿i5-12600K和銳龍7 5800X在不同測試裡面是互有勝負的,但總耗時其實AMD那邊還是要低一點,但12代酷睿與自己上兩代相比確實提升非常大。
CINEBench使用MAXON公司針對電影電視行業開發的Cinema 4D特效軟體的引擎,該軟體被全球工作室和製作公司廣泛用於3D內容創作,而CINEBench經常被用來測試物件在進行三維設計時的效能,R20與R23的差別其實不算大,主要區別是R20的預設測試是隻渲染一次,而R23則是最低渲染10分鐘。這兩個測試12代酷睿處理器提升非常大,單執行緒與11代酷睿有兩位數的效能提升,多執行緒即使是酷睿i5-12600K都比酷睿i9-11900K要高,酷睿i9-12900K領先銳龍9 5950X,酷睿i7-12700K也領先銳龍9 5900X。
UL Procyon的圖片編輯測試,會使用PhotoShop與Lightroom兩個軟體,其實可以把圖片修飾測試看作PhotoShop的結果,而批次處理看作Lightroom的測試結果,其實這兩個軟體測試關掉效能核的酷睿i9-12900K表現是最好的,但和核心全開的也沒太大差距,整體表現的話酷睿i7-12700K其實比銳龍9 5950X還好一些,酷睿i5-12600K比銳龍9 5900X好一點,但沒酷睿i9-11900K強。
而影片編輯測試用的就是Premiere Pro,測試分CPU與GPU的渲染匯出,在GPU渲染時是利用顯示卡來加速影片的編碼與解碼,但主渲染執行緒還是得由CPU來負責,所以即使用顯示卡加速匯出影片,CPU依然有數個執行緒佔用會比較高,而純CPU匯出的時候其實也用不到CPU的所有執行緒,但這測試依然反饋了這CPU在執行Premiere Pro時的實際表現,相當有參考價值,測試的總成績是12代酷睿全部都名列前茅,其實原因就是它們在CPU匯出測試裡面比其他的快得多,所以總分自然高。
遊戲效能測試
遊戲測試為了反映CPU的真實效能,測試全部都是在1080p解析度下進行的,儘量減少顯示卡上的瓶頸,不過畫質依然是開啟最高,但《銀河破碎者》是沒有開光追的,FSR也沒開。
很明顯《地鐵:離去 重製版》 的瓶頸依然是顯示卡上,Extreme畫質的需求太強了,其他遊戲基本上都是12代酷睿的天下,畢竟上代的酷睿i9-11900K基本上就能在遊戲上贏過AMD的銳龍5000系列處理器,現在的酷睿i5-12600K在遊戲上的表現基本上可以與酷睿i9-11900K打平了,而核心數量更多頻率更高的酷睿i7-12700K和酷睿i9-12900K會提供更好的遊戲體驗。
需要注意的是酷睿i7-12700K在《塵埃5》、《地鐵:離去 重製版》和《銀河破碎者》裡面開啟全部核心會報錯,把效能核關掉就不會出現這問題,但酷睿i9-12900K和酷睿i5-12600K在測試時並沒有出現這個問題,12代酷睿的遊戲相容性其實還比較迷,但等遊戲更新後應該就能解決問題。
酷睿i9-12900K在關閉效能核後遊戲效能基本沒有影響,部分遊戲甚至還能跑出更高的幀數,表明遊戲的執行緒基本上不會被分配給效能核的,即使會分配過去也是不太重要的後臺程序。
溫度與功耗測試
在功耗測試方面,我們使用專用的裝置直接測量主機板上CPU供電介面的供電功率,但也會給出軟體記錄的CPU Package功耗資料,雖然CPU的供電主要來源是CPU供電介面,但我們也發現有一小部分是來自24pin介面的。
此外必須說明的是,目前我們測量的是主機板上CPU供電介面的輸入功率,並非直接的CPU供電功率,因此從該理論上來說應該是略高於CPU的實際供電功率,而且會更因為主機板的不同而產生變化,但是這個測試資料仍然有很高的參考價值,因為電源實際上是對主機板進行供電而非直接對CPU進行供電,因此對於電源的選擇來說,直接測試CPU供電介面的供電功率更有實際意義。
主機板的溫度保護和功率設定都維持預設值,AIDA 64 FPU烤機並沒有使用AVX-512。
其實從CPU Package功耗來看的話,酷睿i9-11900K的功耗比酷睿i9-12900K和酷睿i9-10900K是要更高一點的,不過溫度的話則是酷睿i9-12900K比較高,FPU負載下滿載達到了93.5℃,以龍神II 360水冷來看還是壓制住了。不過如果我們把酷睿i9-12900K的效能核關閉後,其核心電壓會自動升上去,雖然看上去功耗有所降低,但溫度更高且頻率更低,顯然是進入到溫控保護狀態了。
至於酷睿i7-12700K和酷睿i5-12600K,他們兩個就溫和得多,前者CPU Package功耗只有172W,後者只有114W,兩者的溫度也不算高,比酷睿i9-12900K好壓多了。
待機測試並不是完全桌面待機,而是開著HWinfo在一旁監控的,有很輕度的負載,但這樣其實更貼近日常使用的待機狀態,在待機是Alder Lake的效能核價值體現出來了,待機功耗非常的低,如果把效能核關閉的話待機功耗會提升很多,酷睿i9-12900K就從9.8W提升到了14.4W,不過即使是純效能核待機時功耗依然比對手以及自己的一眾14nm處理器更低。
DDR4與DDR5記憶體的選擇
第12代酷睿處理器是同時支援DDR5和DDR4記憶體的,都有不少對應的Z690主機板,我們簡單對比了酷睿i9-12900K在使用DDR5-5200和DDR4-3600時的效能,給大家在選擇記憶體時做個參考。
CINEBench R20測試用DDR4還是DDR5差別不大。
對記憶體頻寬比較敏感的壓縮軟體7-Zips結果比較有趣,壓縮測試頻寬更高的DDR5是明顯比DDR4快的,但解壓縮DDR4卻比DDR5更快。
遊戲裡面頻寬更高的DDR5記憶體會比DDR4快一點,但整體差價不會很大,總體來說用DDR4和DDR5不會有太大差別。
總結
Alder Lake對於x86處理器來說是一個重大的變革,能效核與效能核這種混合x86架構是首次大規模應用到消費級市場上,而PCI-E 5.0與DDR5記憶體也是由Alder Lake處理器首次消費級市場,兩年前被AMD搶了PCI-E 4.0的首發後,這次Intel直接拿下了PCI-E 5.0與DDR5的首發,說Alder Lake是一款非常激進的處理器也不為過。
此外陪伴多年的Intel 14nm終於要說拜拜了,第12代酷睿處理器採用了最新的Intel 7製程,再加上全新的Gracemont與Golden Cove核心,能耗比大幅提升,單執行緒效能至少比上一代產品提升了11%,達到官方宣稱的19% IPC提升是完全可能的,多執行緒方面,採用8+8組合的酷睿i9-12900K比上一代8核的酷睿i9-11900K提升了43%之多,就如Intel所說那樣,效能核其實是引爆處理器多執行緒效能的關鍵。
當然了目前開著效能核可能會出現遊戲或者軟體相容性的問題,這是因為系統執行緒排程引發的,這些問題是有機率的,現在也不好說這機率是大還是小,不過如果真碰到的話可以把效能核關了基本都可以解決,當然這也會引起處理器功率與溫度上升的情況,這個問題我們日後再探討。
隨著單執行緒效能的提升,遊戲效能也隨之一齊提升,上一代的酷睿i9-11900K其實已經可以在遊戲方面戰勝全部AMD銳龍5000系列處理器,但酷睿i5-12600K的遊戲效能是要比它還要高1.5個百分點的,更別提效能更強的酷睿i7-12700K和酷睿i9-12900K。
CPU迷你天梯榜 (完整CPU天梯榜)
從我們的CPU天梯榜上可以看到,12代酷睿處理器在多執行緒效能上其實是要比對位的銳龍5000系列處理器弱一點,但他們的單執行緒效能是絕對領先的,如果應用程式不能利用全部執行緒的話他們就會有很大的領先優勢,上面的Adobe的PhotoShop、Lightroom以及Premiere Pro的測試結果就很能說明這個問題,真正能完全利用CPU全部執行緒的應用估計就只有模擬以及渲染類應用了。
售價方面,旗艦級的酷睿i9-12900K是4998元,酷睿i7-12700K是3198元,酷睿i5-12600K是2298元,完全對位對手的銳龍9 5950X、銳龍9 5900X和銳龍7 5800X,與對手相比,第12代酷睿處理器可提供更強的單執行緒效能,遊戲效能是徹底領先的,而且與之搭配的Z690平臺可提供強得多的擴充套件能力,12代酷睿的到來對AMD來說是一個非常大的衝擊。
對於遊戲玩家來說,酷睿i9-12900K代表著目前最強的遊戲效能,價格自然也很貴,少4個效能核的酷睿i7-12700K其實是一個性價比非常高的選擇,酷睿i5-12600K少了兩個效能核所以差距還是很明顯的,但在遊戲方面影響不算大,所以酷睿i7-12700K和酷睿i5-12600K對追求價效比的玩家來說都是一個不錯的選擇,至於DDR5記憶體,想嚐鮮的可以去試下,日後還可以換頻率更高的,但對於務實的玩家來說,DDR4才是最佳的選擇。