Arm架構是當今世界上最受歡迎的處理器架構之一,經過多年的發展和經營,ARM在經典處理器,嵌入式處理器和應用型處理器方面研發設計出了多個系列的產品。ARM Cortex系列是經典處理器ARM11以後產品的新的命名系列,只在各種不同的市場提供服務,採用的是ARMv7或者ARMv8體系結構,並分為三個系列,分別是Cortex-A,Cortex-R,Cortex-M。
Cortex-A系列處理器針對日益增長的消費娛樂和無線產品設計,用於具有高計算要求、執行豐富作業系統及提供互動媒體和圖形體驗的應用領域,如智慧手機、平板電腦、汽車娛樂系統、數字電視,智慧本、電子閱讀器、家用網路、家用閘道器和其他各種產品。下面我們將簡單介紹近年來ARM公司釋出的數款A系列處理器。
Cortex-A78
Cortex-A78是2020年釋出的新一代CPU架構,適用於5nm工藝,效能提升20%,功耗則降低了50%。Cortex-A76、A77、A78都採用了相同的Austin微架構,三代核心在設計上存在很多共性。根據ARM官方資料顯示,A78相較於A77,其IPC(架構效能)只提升了7%,功耗降低了4%,核心小了5%,四核簇面積的縮小了15%。不過Cortex-A78搭配的是最新一代的5nm製程工藝,天生就具備更好的能效比,在同樣的每核心1W功耗下,7nm生產的Cortex-A77可以達到2.6GHz,而5nm生產的Cortex-A78頻率可達3.0GHz,同功耗下持續效能提升20%左右。
Cortex-A77
Arm在19年推出的Cortex A77架構,Cortex A77面向移動高效能領域,採用Arm v8.2 64位指令集架構。硬體設計上和A76一脈相承,都採用了7nm工藝,峰值頻率也沒有變化。A77的流水線結構應該和A76是一致的,採用標準的physical register Out-of-Order machine,20%的提升主要在微架構的細節方面,用來提高IPC和並行執行的能力。隨著工藝進展到7nm,其單晶片的功耗密度在很大程度上制約著主頻的提升。Arm主要面向移動市場,並沒有在頻率控制上向INTEL看齊,而更加追求單位功耗下的效能比。因此很多設計上並不以頻率為首要目標,可以看到其L1 cache size達64KB,甚至超過了ZEN2的32K。
Cortex-A76
Cortex-A76被稱為“是一款具有的筆記本級效能的處理器”,採用7nm工藝,執行頻率預計將達到3GHz,相比基於10nm工藝製造、執行在2.8GHz的Cortex A75,能耗將降低40%,效能可提升35%,機器學習能力可提升4倍。在機器學習應用的最佳化上,Cortex-A76指令集最高可提升 400% 。與 2.8GHz 的 10nm A75 晶片相比,3GHz @ 7nm 的 A76 晶片有著 35% 的效能領先優勢。能效方面,在750mW的核心功耗預算下,7nm的Cortex A76相比10nm的Cortex A75可提升40%效能。
Cortex-A75
Cortex-A75 處理器是DynamIQ 技術的首款高效能 CPU,據ARM的資料,Cortex-A75相比Cortex-A73,大約帶來了22%的整數效能提升,33%浮點效能提升、16%的記憶體效能提升、48%的渲染效能提升、34%的GeekBench綜合性能提升等。Cortex-A75 幾乎涵蓋了從端到雲的所有應用場合,不僅僅適用於移動和消費性使用場合,還能夠在網路基礎設施、汽車設計乃至伺服器等方面實現全新的效能水平。
Cortex-A73
Cortex-A73是ARM 2016年釋出的A系列處理器,Cortex-A73支援全尺寸ARMv8-A構架,ARMv8-A是ARM公司的首款支援64位指令集的處理器架構,包括ARM TrustZone技術、NEON、虛擬化和加密技術。所以無論是32位還是64位,Cortex-A73都可以提供適應性最強的移動應用生態開發環境。Cortex-A73包括128位 AMBR 4 ACE介面和ARM的big.LITTLE系統一體化介面,採用10nm技術製造,可以提供比Cortex-A72高出30%的持續處理能力,非常適合應用到高階智慧手機、平板電腦、翻蓋式移動裝置、數字電視等一系列消費電子裝置。
Cortex-A72
Cortex-A72釋出於2015年年初,也是基於ARMv8-A架構,採用臺積電16nm FinFET製造工藝,Cortex-A72可在晶片上單獨實現效能,也可以搭配Cortex-A53處理器與ARMCoreLinkTMCCI快取記憶體一致性互連(CacheCoherentInterconnect)構成ARMbig.LITTLETM配置,進一步提升能效。在相同的移動裝置電池壽命限制下,Cortex-A72能相較基於Cortex-A15的裝置提供3.5倍的效能表現,相比於Cortex-A57也有約1.8倍的效能提升,展現出了優異的整體功耗效率。Cortex-A72其應用市場包括高階智慧手機、大螢幕的移動裝置、企業網路裝置、伺服器、無線基臺、數字電視。
Cortex-A57
Cortex-A57是ARM首次採用64位ARMv8-A架構CPU,而且透過Aarch32執行狀態,保持與ARMv7架構的完全後向相容性。除了ARMv8的架構優勢之外,Cortex-A57還提高了單個時鐘週期性能,比高效能的Cortex-A15 CPU高出了20%至40%。它還改進了二級快取記憶體的的設計以及記憶體系統的其他元件,極大地提高了能效。Cortex-A57將為移動系統提供超高能的效能,而藉助big.LITTLE,SoC能以很低的平均功耗做到這一點。其主要面對的是中高階電腦,平板電腦以及伺服器產品。
Cortex-A55
Cortex-A55與Cortex-A75同期釋出,是Cortex-A75的理想搭檔。Cortex-A55 採用 ARMv8.2 架構,並在其前代產品的基礎上打造而成。Cortex-A55的改進主要在於分支預測、資料讀取和寫入(AGU)以及快取部分,在執行部分改進較少。ARM宣稱Cortex-A55的記憶體效能相比Cortex-A53提高了1倍,因此帶來了整數18%、浮點38%、渲染14%、綜合21%的效能增加。相比之下Cortex-A55的功耗比Cortex-A53提高了3%,考慮其效能增加,整體能耗比反而再度提升了15%。
Cortex-A53
Cortex-A53採取了ARMv8-A架構,能夠支援32位的ARMv7程式碼和64位程式碼的AArch64執行狀態。A53架構特點是功耗降低、能效提高。其目標是28nm HPM製造工藝下、執行SPECint2000測試時,單個核心的功耗不超過0.13W。它提供的效能比Cortex-A7處理器的功率效率更高,並能夠作為一個獨立的主要的應用處理器,或者搭配Cortex-A57處理器構成big.LITTLE配置。Cortex-A53在相同的頻率下,能提供比Cortex-A9更高的效能。其主要面對的是中高階電腦,平板電腦,機頂盒,數字電視等。
Cortex-A35
Cortex-A35是基於ARMv8-A 64位架構設計的一款低功耗CPU,其目的是為了取代此前32位Cortex-A7和Cortex-A5兩顆老核心,採用和A53/A7類似的順序有限雙發射設計,同時融入了A72的一些新特性,並在前端重新設計了指令預取單元,提升了分支預測精度。此外,A35還採用了A53的快取、記憶體架構,可配置8-64KB一級指令和資料快取、128KB-1MB二級快取,加入了NEON/FP單元,改進了儲存效能,支援完整流水線的雙精度乘法,還為CPU核心、NEON流水線都配備了硬體保留狀態(獨立電源域)以提升電源管理效率。在同樣的工藝、頻率下,A35的功耗比A7低大約10%,同時效能提升6-40%。而對比A53,它可以保留80-100%的效能,但是功耗降低32%、面積縮小25%,能效提升25%。A35還可以和A53、A57、A72等大核心搭配,組成big.LITTLE混合架構系統,進一步提升系統能效。其主要定位於低功耗的低端手機、可穿戴、物聯網等領域。
Cortex-A32
這是ARM 新一代構架中,唯一一個 32 位(ARMv7-A )架構的處理器,但 A32 就像是 32 位版的 A35,目標很明顯,就是在效能比本來就逆天的 A35 的基礎上進一步控制功耗。A32 架構主打芯片面積、功耗控制和能耗比,其停留在 32 位(ARMv7-A 指令集),指令預取單元針對效率進行了重新設計,一、二級暫存、浮點和 DSP 操作效能則針對速度進行了改進,並引入了新的電源管理特性。其支援 TrustZone 安全加密、NEON SIMD 指令集、DSP / SIMD 擴充套件、VFPv4 浮點計算、虛擬硬體等。A32 可以在 32 位下提供和 A35 一樣的效能。但更低功耗,讓它的效能比(單位電能產出的效能)比 A35 還要高 10%、比 A5 高 30%、比 A7 高 25%。A35 可以透過提升頻率達到 A53 80-100% 效能,也就是說,A32 也可以在 32 位下達到同樣的效能等級,這時候的芯片面積只有 A53 的 68%,而功耗則只有 A53 的 61%。在 64 位之下,A35 都有代替 A53 架構的實力,而在 32 位中,A32 就已經是完勝所有人的境界了,而且比起 64 位的 A35 架構,32 位的 A32 更適合用在穿戴裝置和物聯網產品上。
Cortex-A17
A17仍然基於32位ARMv7-A指令集,初期會採用28nm工藝,後期進化到20nm。本質架構和A12一樣都是雙寬度、亂序發射,僅僅是改進了外部互聯,引入了新的一致性匯流排AMBA4 ACE,可以更快速地連線記憶體控制器,從而改善效能和能效。得益於這個新的匯流排,A17可以支援多核心SoC的完整記憶體一致性操作,能夠參與big.LITTLE雙架構混合方案,在特定頻率、工藝、記憶體條件下,A17的效能比A12提升大約40%。在某些特定的環境中,A17的效能已經可以和A15處於一個檔次了,但是功耗更低、能效更高。雖然在命名上排在Cortex-A15之上,但其定位中端,而不是高階。
Cortex-A15
Cortex-A15最早在2010年釋出,基於32位ARMv7-A架構。A15和A9同樣具備亂序執行,但是Cortex-A15具備(兩倍)的指令發射埠和執行資源,指令解碼能力也要高出50%,動態分支預測能力更強(採用了多層級分支表快取),指令拾取頻寬更強(128 bit vs 64 bit),這些都能讓A15的流水線執行具備更高的效率。除此以外,A15採用了VFPv4浮點單元設計,能執行FMA指令以及硬體除法指令,相較而言A9的峰值向量浮點效能基本上只有A15的一半。Cortex-A15處理器可以應用在智慧手機、平板電腦、移動計算、高階數字家電、伺服器和無線基礎結構等裝置上。
Cortex-A9
ARM Cortex-A9採用ARMv7-A架構,目前我們能見到的四核處理器大多都是屬於Cortex-A9系列。Cortex-A9 處理器的設計旨在打造最先進的、高效率的、長度動態可變的、多指令執行超標量體系結構,提供採用亂序猜測方式執行的 8 階段管道處理器,憑藉範圍廣泛的消費類、網路、企業和移動應用中的前沿產品所需的功能,它可以兼具高效能和高能效。Cortex-A9 微體系結構既可用於可伸縮的多核處理器(Cortex-A9 MPCore多核處理器),也可用於更傳統的處理器(Cortex-A9單核處理器)。可伸縮的多核處理器和單核處理器支援 16、32 或 64KB 4 路關聯的 L1 快取記憶體配置,對於可選的 L2 快取記憶體控制器,最多支援 8MB 的 L2 快取記憶體配置,它們具有極高的靈活性,均適用於特定應用領域和市場。
Cortex-A8
ARM Cortex-A8處理器,基於ARMv7-A架構,是目前使用的單核手機中最為常見的產品。Cortex-A8處理器是首款基於ARMv7體系結構的產品,能夠將速度從600MHz提高到1GHz以上。Cortex-A8處理器可以滿足需要在300mW以下執行的移動裝置的功率最佳化要求;以及需要2000 Dhrystone MIPS的消費類應用領域的效能最佳化要求。Cortex-A8 高效能處理器目前已經非常成熟,從手機到上網本、DTV、印表機和汽車資訊娛樂,Cortex-A8處理器都提供了可靠的高效能解決方案。
Cortex-A7
Cortex-A7採用ARMv7-A架構,它的特點是在保證效能的基礎上提供了出色的低功耗表現。Cortex-A7處理器的體系結構和功能集與Cortex-A15 處理器完全相同,不同這處在於,Cortex-A7 處理器的微體系結構側重於提供最佳能效,因此這兩種處理器可在big.LITTLE(大小核大小核心伴侶結構)配置中協同工作,從而提供高效能與超低功耗的終極組合。單個Cortex-A7處理器的能源效率是Cortex-A8處理器的5倍,效能提升50%,而尺寸僅為後者的五分之一。
Cortex-A5
Cortex-A5處理器同樣基於ARMv7-A架構,它是能效最高、成本最低的處理器,能夠向最廣泛的裝置提供最基礎的 Internet 訪問。Cortex-A5 處理器在指令以及功能方面與更高效能的 Cortex-A8、Cortex-A9 和 Cortex-A15 處理器完全相容 - 一直到作業系統級別。Cortex-A5 處理器還保持與經典 ARM 處理器(包括 ARM926EJ-S、ARM1176JZ-S 和 ARM7TDMI)的向後應用程式相容性。其定位於入門級智慧手機、低成本手機和智慧移動裝置以及基礎工業裝置。
內容來源於網路整理