日前 ,蘋果釋出了新品 14 英寸、16 英寸 MacBook Pro,分別取代 13 英寸高配版與 16 英寸英特爾版 MacBook Pro。
新款Macbook Pro使用的M1max 是一顆10 核 CPU,包括 8 個高效能核心、2 個高效能核心;兩種組合的 GPU,分別包含 16 個、32 個 GPU 核心;統一記憶體規格也升級了,最高可達 64GB。
按照蘋果的效能演示,M1max的CPU效能達到i9的2.7倍。而GPU的效能在50W功耗的時候,已經能媲美對比的移動版3080了,這個效能是相當恐怖的。
財大氣粗的蘋果,一直使用臺積電的先進工藝,產品在能耗比上有優勢是大家可以意料到的。但是這次蘋果的優勢太大了,功耗低效能高,同樣功耗下的效能直接碾壓競爭對手,蘋果是怎麼做到的,蘋果的成功會給業界帶來什麼影響呢?我們來看一下。
與遊戲機晶片異曲同工
蘋果的M1晶片與蘋果的手機晶片很類似,有一些移植的意思。但是到了M1max,蘋果終於理清了桌面SOC的設計思路。
對桌面端應用來說,小核多了用處不大。多個小核心依然不能滿足高效能需求,所以M1max只設計了兩個,用作低負載和待機使用。
理論上桌面大核心越多越好,但是實際的程式要用到全部大核心,對程式設計有要求。目前,八個大核心差不多現在的主流程式都能用盡。
蘋果這一點與遊戲機看法相同,遊戲也用了8個大核心,而在遊戲上,充分利用多核心程式設計已經是非常困難了。遊戲沒有問題,我們日常用的大多數程式都沒有問題。
蘋果的GPU效能其實不算太強,我們計算一下電晶體,蘋果M1max的浮點效能,與用掉的電晶體數相比,並沒有領先nVIDIA和AMD。
但是,蘋果GPU卻有更高的效能功耗比,除了臺積電的5nm工藝,還要感謝蘋果的單晶片設計。
把CPU和高效能GPU整合到一起,可以減少傳輸對電力的損耗,降低總體功耗有利。這是遊戲機晶片的做法,最早是微軟Xbox360的Slim版本把兩塊晶片合併起來,後來遊戲機全部都這樣做了。
手機因為要低功耗,一直這樣做,蘋果的M1從手機SOC發展而來,雖然GPU做了高效能的,但是依然繼續單晶片設計。有效的提升了能效比。
超規格的統一記憶體架構
在PC上,很早就有整合顯示卡,GPU呼叫系統記憶體的做法。但是那僅僅是記憶體共享,不是統一記憶體架構。
統一記憶體架構是GPU和CPU不用分別佔用記憶體,而是在同一內部地址中訪問。這樣的好處是資料不用在記憶體視訊記憶體中傳輸,也不需要透過緩慢的系統匯流排,而且在GPU不需要的時候節省記憶體。
統一記憶體架構最早也是出現在Xbox360遊戲機上,有了PS4,Xbox one,PS5等等都一脈相承。
統一記憶體架構有一個缺點。因為CPU和GPU對記憶體的要求不同。CPU要求低延遲,大容量,GPU要求高頻寬。所以通常CPU用DDR記憶體,而GPU用GDDR。雖然有HBM2這種方案能兼顧一下,但是這種折衷方案太貴。
而蘋果M1max,用了最新的LPDDR5,選擇了低延遲,而對於頻寬採用大力出奇跡的方案,我們同樣用記憶體,單通道是64位,雙通道是128位。蘋果M1max上了四顆多通道記憶體顆粒,搞到了512位,晶片中記憶體控制器用掉的電晶體數量都快趕上CPU了。
結果,這種大力出奇跡的做法,把記憶體頻寬,把總頻寬拉到400GB/S。這已經很接近用GDDR的PS5和移動版3080了,它們是448GB/S。這樣,蘋果M1max既有高頻寬,又有低延遲。
在不跑遊戲的時候,這個頻寬給CPU就太奢侈了,普通CPU的頻寬只有80GB/S。
而且統一記憶體還可以統一快取,AMD證明,給GPU加點快取,對頻寬改善很有利。這個大快取給CPU用,對單執行緒,多執行緒也有很大幫助。蘋果給M1max塞了巨大的共用快取,進一步提升了頻寬。
超大核心的昂貴代價
蘋果的解決方案看起來很完美,大核心,大GPU,超級豪華的記憶體控制器,超大系統快取。還有AI加速模組……
但是,這樣做也是有代價的。因為塞了這麼多東西,蘋果M1max的晶片用掉了570億電晶體。
這是一個什麼概念?Nvidia的RTX 3090只用了280億電晶體,AMD的Zen3處理器只有41億。XBOX Series X用的SOC已經是巨獸了,不過153億而已。
雖然用的是最新的臺積電5nm工藝,但是這個面積也是驚人的,價格自然也驚人。
按照晶片的規律,超大的芯片面積,會大幅度降低良率,導致晶片昂貴。
所以蘋果需要閹割降級來降低成本,類似於微軟遊戲機有X和S。蘋果手機低端4個GPU,高階5個GPU。
所以,我們在蘋果網站看到了有意思的報價。
8核CPU加上14核GPU的是基本款,CPU用10核心的,加1500元,GPU再加到16核,加2500元,GPU加到24核,加4000元,滿血的GPU才是32核,加5500元。
基本上,蘋果是發現一個級別的次品,就遮蔽掉不合格的部分,降級降價出售。
這算是蘋果方案的唯一弱點了。
蘋果或將帶來膝上型電腦的革命
其實蘋果選擇的解決方案,最早出現在xbox360的slim版本上。
因為遊戲機是固定硬體,不考慮升級,不考慮標準介面。所以,可以用用單晶片,快取記憶體,統一記憶體的模式來提升效能降低功耗。
蘋果M1max給我們的啟示是,其實現在的膝上型電腦,也沒有太大的升級必要。放棄了標準介面升級。英特爾和這AMD完全可以用同樣的方案來提升效能,降低功耗。
對AMD來說,在遊戲機上早就做過了,只是AMD目前沒有搞統一快取架構,而這對AMD來說,就是舉手之勞。
所以,AMD只要想做,下一代就可以學蘋果搞這種方案。
英特爾手裡有更好的牌,英特爾有EMIB技術(Embedded Multi-Die Interconnect Bridge,嵌入式多核心互聯橋接),這個技術可以用比較小的效能損耗,把小晶片連線起來獲得更高的效能。
就是說,如果英特爾選擇走蘋果的路線,可以不造一塊巨大的,昂貴的,廢品率高的大晶片,而是可以造很多便宜的小晶片,然後用EMIB技術把小晶片連線起來。
譬如四個酷睿12大核心兩個小核心一組,輕薄筆記本用一組,高效能用兩組。GPU多組,共用快取多組,記憶體靈活配置,可以像蘋果一樣用多通道的DDR,可以用HBM2,甚至可以用一塊大的SRAM做四級快取……
雖然,這樣做的代價是膝上型電腦以後都不能升級了。但是,筆記本的效能功耗比可以再上一個臺階。而價格又不會像蘋果那麼昂貴。