一直以來,蘋果A系列晶片無論是CPU還是GPU的效能、能效都領先高通驍龍很多,但我不覺得是研發團隊的絕對實力差距導致,而是商業模式的問題。
蘋果團隊確實很優秀,但高通,聯發科和ARM的架構師們作為頂級人才也不是傻子。蘋果晶片領先的原因在哪?
- 超大規模:A14 Firestorm大核心架構的8解碼,630的ROB等帶來大幅領先的IPC表現
- 超級小核:A15小核心的高效能本質上是規模遠大於ARM的A55小核心,接近於A78大核心
- 快取堆料:A15沒有L3,32MB的SLC快取遠遠大於S888和K9000
A站的A14大核心架構圖
那做大核心,加寬微架構設計,堆快取這些方法高通,聯發科設計師不知道嗎?即便蘋果架構設計領先,但安卓SoC設計做了上邊幾點改進也不至於落後這麼多。那為什麼不做呢?
因為蘋果A系列晶片沒有基帶,而且對成本不敏感。A15的GPU領先S888至少50%,但是A15的核心面積在沒有基帶的情況下達到了107mm²,這是非常誇張的。
大面積核心良率低,配合現在昂貴的先進工藝,成本壓力很大,而蘋果又額外購買高通X60基帶,總成本絕對不低。
Techinsight
但是蘋果出貨都是旗艦手機,有充足的利潤空間來cover這些成本。同時A系列晶片每年上億的出貨量遠遠大於S888和K9000,再加上蘋果作為臺積電第一大客戶,常年享受最優惠價格,所以成本才能hold住。
而對高通來說,下游客戶對成本敏感,5G SoC核心面積限制下,基帶又要佔用空間,留給CPU和GPU的空間十分有限,所以只能在規模和快取上動刀。
同時S888選擇了比較便宜的三星5nm LPE工藝,三星的工藝密度(約120MTr/mm2)遠低於臺積電的5nm工藝(約170MTr/mm2),這導致規模設計進一步受限。
而定位更低端的聯發科就會進一步砍快取和周邊配置,同時選擇ARM公版的GPU,所以整體能效表現比高通更差。
還有一個例子是華為麒麟9000:
眾所周知,ARM的Mali系列GPU的效能和能效比高通Adreno和蘋果自研GPU差很多,所以以前用Mali的麒麟GPU效能都落後於同代驍龍。
但到了K9000這一代,Mali-G78直接堆滿了上限24核心,這導致在上一代K990落後於S865達17%的情況下,這一代直接追上,甚至反超S888的Adreno 660:
雖說24核心能效也十分拉垮,但最起碼絕對效能上來了,這說明堆料是有用的,而華為能堆料也是做大規模,同時麒麟晶片內部自用,配合華為出貨量越來越大的旗艦手機,成本也能cover住。
可以預見的是,如果沒有美國製裁,華為接下來勢必會逐漸加大規模,然後公版設計無法滿足需求時就會開始自研核心,效能提升帶來出貨量進一步提高,然後再攤平成本,形成正向迴圈最後就走上了蘋果現在的道路。
所以高通什麼時候能追上?
在下游高階市場無法開啟,先進工藝代工愈發昂貴的情況下,恐怕很難追上。即便收購Nuvia也未必解決問題。
在5nm工藝上,截止2021年10月,蘋果和華為已經發布臺積電5nm晶片一年時間,蘋果已經推出了第二代5nm晶片,而高通選了三星5nm和臺積電6nm,聯發科依然沒有5nm晶片。
那等到臺積電未來更貴的3nm,甚至2nm出來的時候,除了蘋果其他家都未必用得起。亦或者用得起也要落後1-2年時間,那還怎麼追呢?