來源:本文由半導體行業觀察編譯自nextplatform。
基於 Arm 的伺服器的歷史有些曲折,他們曾多次嘗試挑戰 X86 處理器霸權,但該公司現在似乎看好其在高效能計算 (HPC) 領域的機會,它相信其許可模式、功耗及其架構的效率使其具有優勢。
Arm 的 HPC 業務高階主管 Brent Gorda 在戴爾主辦的 HPC 社群活動上發表演講說,該公司“在 HPC 社群中確實在努力推動”,並強調了其與 Nvidia、Silicon Pearl 和 Fujitsu 等公司的合作伙伴關係開發基於 Arm 的晶片來驅動 HPC 和 AI 應用程式。
事實上,Gorda 指出,Arm 已經在 HPC 行業佔據了一席之地,在日本 RIKEN 實驗室的“Fugaku”超級計算機 以 152,064 個 48 核排名世界第一的富士通A64FX 處理器就是基於Arm架構打造的。
然而,富士通走的是從 Arm 獲得架構許可的道路,這意味著它能夠設計和製造自己的定製 Arm 相容處理器,幾乎可以滿足自己的要求。這意味著增加了 512 位可擴充套件向量引擎單元來支援富士通所考慮的那種計算,以及它自己的 Tofu D 高速互連。
但是很少有 HPC 站點可以從頭開始設計自己的晶片。幸運的是,Arm 的商業模式還允許合作伙伴採用現成的核心設計併為其新增自定義模組,Gorda 解釋說。
“有一種叫做核心許可的東西,你可以透過它許可 Arm Neoverse,這是我們的 IP。這為您提供了核心構建塊,即邏輯本身,您可以圍繞它定製和構建您想要構建的晶片,”他說。
圍繞這一切的是 Arm ServerReady 合規計劃,該計劃證明特定晶片符合 Arm 伺服器生態系統的相容性要求。
“一旦你通過了這個認證,你就可以使用軟體世界了。它保證了軟體的功能,然後您可以為受支援的作業系統版本(如紅帽)付費。”
Gorda 聲稱,這種為特定應用程式或一組應用程式定製晶片的能力是 Arm 的優勢所在,尤其是在 HPC 和 AI 似乎正在發展的領域。客戶可以使用 Arm 核心引擎和片上網路,併為其目標工作負載新增自定義加速器。
“來自 Nvidia 的 Bill Dally 會說,透過在矽晶片上放置自定義門,您可以獲得三個數量級的效能提升。這正是 Arm 的發展方向,”他說。“每個人都有關於加速器的想法。如果你足夠了解你的工作量,你可以最佳化它並獲得瘋狂的良好效能。事實上,這就是 A64FX 如此出色的原因。他們花了十年時間,研究了他們擁有的十到十二個應用程式,並且成功了。處理器問世了,它完全將日本人想要的應用程式安裝在他們的系統上。”
Arm 早在 2018 年就推出了 Neoverse,目標是資料中心基礎設施,而不是移動裝置市場。Neoverse設計於去年進行了擴充套件,現在包括三個處理器設計系列:強調效能的 V 系列;專注於雲基礎設施等橫向擴充套件應用N系列;還有針對邊緣應用的E系列。
Gorda 透露,參與歐洲處理器倡議 (EPI) 專案的公司Silicon Pearl正在使用 Neoverse V1 設計。同時,N1 設計已用於英特爾前高管 Renée James 創立的初創公司 Ampere Computing的“Quicksilver”和“Mystique”Altra 伺服器晶片。為某些 AWS EC2 例項提供支援的 Amazon Graviton2 晶片使用 N1 核心,而Graviton3 使用 V1 核心。Neoverse V 系列核心顯然還包含在 Nvidia 計劃中的旨在超級計算的“Grace”晶片 中,以及正在由韓國電子和電信研究所 (ETRI) 開發的伺服器晶片中。
阻礙 Arm 在伺服器市場的問題之一是軟體支援,許多關鍵軟體包都是為 X86 處理器平臺開發的。當被問及是否所有部件現在都可以在 Arm 上部署 HPC 時,Gorda 說,總的來說,答案是肯定的。
“你會發現一些地方還是有弱點,雖然我相信說所有 ISV 都在開發 Arm 埠是準確的,但並非所有 ISV 都公開支援 Arm in Silicon。因此,如果您依賴 ISV 許可證和軟體,您將不得不輪詢您的 ISV 以瞭解事物的狀態,”他解釋道。
然而,Gorda 引用了 Lustre 並行檔案系統的示例,該系統廣泛用於 HPC 環境。多年來,Arm 一直為 Lustre 客戶端提供支援,但“基於 Arm 的儲存伺服器非常少,”Gorda 說,因此用於 Arm 的 Lustre 伺服器元件目前不受 Whamcloud 的支援,Whamcloud 是 DDN 內監督 Lustre 的部門發展。他補充說,這是 Arm 試圖解決的問題。
Gorda 還指出,大約五年前,Arm 收購了 HPC 軟體工具的領先供應商 Allinea Software,以加強 Arm 的 HPC 軟體生態系統支援。
Gorda 表示,另一個對 Arm 有利的因素是更高的能效。隨著超級計算機擴充套件到 Exascale 領域並且持續的能源成本成為 HPC 運營商更加關注的問題,這可能變得更加重要。Gorda 表示,儘管 Arm 的 Neoverse V 架構強調效能而不是功率效率,但基於它的晶片仍然比競爭對手的 X86 處理器消耗更少的能量。
“X86 的保證是您可以在其上執行 286 二進位制檔案,而作為具有 RISC 底層的 CISC 架構的所有歷史遺產都需要在解碼重新排序、修復指令等方面預先進行大量邏輯這是進入晶片並消耗能量的開銷,”他說。相比之下,在某種程度上,您可以將 Arm 視為一張白紙。
Gorda 還聲稱,終端使用者不再關心他們的軟體執行在什麼晶片上,理由是 AWS 等公司採用了 Arm 驅動的雲伺服器。
“市場有新的大玩家來控制架構。他們關心的事情與歷史上一直關心的事情不同。他們關心成本,他們關心能源消耗,他們關心週轉時間,以及在事物之上執行的軟體堆疊,”他說。
“如果你看看亞馬遜在 Graviton2 上做了什麼,他們說它便宜了 40%。從終端使用者的角度來看,他們並不關心晶片是什麼,他們關心的是它便宜 40%,而且週轉時間與他們習慣的時間相當。”
HPC 分析公司 Hyperion Research的執行長 Earl Joseph表示,他預計未來幾年基於 Arm 處理器的 HPC 伺服器將出現高速增長。
“我們預計五年增長率將超過 31%,而基礎市場的增長率約為 7% 至 8%,”Joseph說。他補充說,這相當於到 2025 年基於 Arm 的系統將佔 HPC 市場的 10% 左右。
然而,Joseph也警告說,收入數字可能會產生誤導,因為大型超級計算機專案可能會扭曲數字,就像 2020 年接近 10 億美元的富嶽系統所做的那樣。
因此,由於如此龐大的個人安裝,市場可能會發生巨大變化,Hyperion Research 表示,預計 2025 年將有兩臺基於 Arm 處理器的歐洲百億億級機器。
他補充說,許多即將推出的 HPC 系統預計將混合使用 Arm 和 X86 以及其他處理器型別的處理器。
點選“閱讀原文”可檢視英文原文。
*免責宣告:本文由作者原創。文章內容系作者個人觀點,半導體行業觀察轉載僅為了傳達一種不同的觀點,不代表半導體行業觀察對該觀點贊同或支援,如果有任何異議,歡迎聯絡半導體行業觀察。
今天是《半導體行業觀察》為您分享的第2943內容,歡迎關注。
晶圓|積體電路|裝置|汽車晶片|儲存|臺積電|AI|封裝