sponsored links

AMD 要在CPU中引入3D堆疊ML加速器?

來源:內容來自【tom'shardware】,謝謝。

AMD 已為一種處理器申請了專利,該處理器具有堆疊在其 I/O 晶片 (IOD) 頂部的機器學習 (ML) 加速器。該專利表明,AMD 可能正計劃構建具有整合FPGA 或基於GPU 的機器學習加速器的專用或資料中心繫統級晶片 (SoC)。

就像AMD現在可以為其CPU新增快取一樣,它可能會在其處理器 I/O 晶片上新增 FPGA 或 GPU。但是,更重要的是,該技術允許該公司在未來的 CPU SoC 中新增其他型別的加速器。與任何專利作品一樣,該專利並不能保證我們會看到採用該技術的設計進入市場。然而,它讓我們瞭解了公司在研發方面的發展方向,我們有機會看到基於這種技術的產品或類似的衍生產品進入市場。

在 I/O 晶片上堆疊AI/ML加速器

這項名為“直接連線機器學習加速器”(Direct-connected machine learning accelerator)的專利公開地描述了AMD如何利用其堆疊技術,在其帶有IOD的CPU上新增ML加速器。顯然,AMD的技術允許它在帶有特殊加速器埠的I/O晶片上新增現場可程式設計處理陣列(FPGA)或用於機器學習工作負載的計算GPU。

AMD 描述了新增加速器的幾種方法:一種涉及具有自己本地記憶體的加速器,另一種暗示這種加速器使用連線到 IOD的記憶體,而在第三種情況下,加速器可能使用系統記憶體,在此在這種情況下,它甚至不必堆疊在 IOD 頂部。

AMD 要在CPU中引入3D堆疊ML加速器?
AMD 要在CPU中引入3D堆疊ML加速器?
AMD 要在CPU中引入3D堆疊ML加速器?


圖源:AMD

機器學習技術將被未來的資料中心廣泛使用。然而,為了更具競爭力,AMD 需要使用其晶片加速 ML 工作負載。在 CPU I/O 晶片上堆疊機器學習加速器可以顯著加快 ML 工作負載,而無需將昂貴的定製 ML最佳化矽片整合到CPU小晶片中。它還具有密度、功率和資料吞吐量優勢。

該專利於2020 年 9 月 25 日提交,比 AMD 和 Xilinx 宣佈他們的管理團隊已達成最終協議 AMD 將收購 Xilinx 早一個多月。該專利於2022年3月31日公佈,AMD 研究員 Maxim V. Kazakov 被列為發明人。AMD 的首款採用 Xilinx IP 的產品預計將於 2023 年推出。

我們不知道 AMD 是否會將其專利用於實際產品,但將ML功能新增到幾乎所有CPU這個想法看起來似乎是合理的。假設AMD的代號為EPYC的“Genoa”和“Bergamo”處理器使用帶有加速器埠的 I/O 晶片,那麼很可能會有帶有ML加速器的Genoa-AI 和 Bergamo-AI CPU。

還值得注意的是,據傳 AMD正在為其第 5 代 EPYC 'Turin' 處理器考慮 600W 可配置熱設計功率 (cTDP),比當前一代 EPYC 7003 系列的 cTDP 高出兩倍以上“Milan”處理器。此外,用於第 4 代和第 5 代 EPYC CPU 的 AMD 的 AMD SP5 平臺可在極短的時間內為處理器提供高達 700W 的功率。

我們不知道 AMD 未來的 96 -128(Genoa和Bergamo)CPU 需要多少功率,但在處理器封裝中新增 ML加速器肯定會增加消耗。為此,確保下一代伺服器平臺能夠透過堆疊加速器支援cpu是很有意義的。

構建終極資料中心SoC

自2006年收購 ATI Technologies 以來,AMD 一直在談論資料中心加速處理單元 (APU)。在過去 15 年中,我們聽說過多個數據中心 APU 專案集成了用於典型工作負載的通用 x86 核心和用於高度並行的 Radeon GPU工作量。

這些專案都沒有實現,原因有很多。在某種程度上,由於 AMD 的 Bulldozer 核心沒有競爭力,因此構建一個需求非常有限的大型且昂貴的晶片沒有多大意義。另一個原因是,傳統的 Radeon GPU 並不支援資料中心/AI/ML/HPC 工作負載所需的所有資料格式和指令,而 AMD 的第一款以計算為中心的基於 CDNA 的 GPU 直到 2020 年才出現。

但是現在 AMD 擁有具有競爭力的 x86 微架構、面向計算的 GPU 架構、 Xilinx的 FPGA 產品組合以及Pensando的一系列可程式設計處理器,將這些不同的 IP 塊放入單個大晶片中可能沒有多大意義。恰恰相反,在TSMC和AMD自己的Infinity Fabric互連技術提供的封裝技術下,用通用x86處理器晶片、I/O晶片以及基於GPU或fpga的加速器來構建多tile(或多Chiplet)模組更有意義。

事實上,構建多晶片資料中心處理器比構建具有內建多樣化 IP 的大型單片 CPU 更有意義。例如,多塊資料中心 APU 可以受益於使用 TSMC 的 N4X 效能最佳化節點製成的 CPU 塊以及使用密度最佳化的 N3E工藝技術生產的 GPU 或 FPGA 加速器塊。

通用加速器埠

該專利的另一個重要部分不是旨在使用 FPGA 或計算 GPU 加速機器學習工作負載的特定實現,而是在任何 CPU 中新增專用加速器的原理。加速器埠將是 AMD 的 I/O 晶片上的通用介面,因此最終,AMD 可以在其處理器中新增其他型別的加速器,以針對客戶端或資料中心應用程式。

“應該理解的是,根據本專利的披露,可能會有很多變化,”專利的描述寫道。例如,合適的處理器包括通用處理器、專用處理器、傳統處理器、圖形處理器、機器學習處理器、[DSP、ASIC、FPGA]和其他型別的積體電路(IC)。這樣的處理器可以透過配置製造過程來製造,該製造過程使用已處理的硬體描述語言(HDL)指令的結果和其他中間資料,包括網表(這種指令能夠儲存在計算機可讀的介質上)。”

儘管即使在今天,FPGA、GPU 和 DSP 仍可用於各種應用,但用於資料中心的資料處理單元 (DPU) 之類的東西只會在未來幾年變得越來越重要。DPU 本質上是 AMD 現在碰巧擁有的新興應用程式。但隨著資料中心轉變為處理更多型別的資料並更快(客戶端 PC 也是如此,例如 Apple 如何將特定應用程式的加速(如 ProRes RAW)整合到其客戶端 SoC 中),加速器變得越來越普遍。這意味著必須有一種方法可以將它們新增到任何或幾乎任何伺服器處理器。事實上,AMD 的加速器埠是一種相對簡單的方法。

*免責宣告:本文由作者原創。文章內容系作者個人觀點,半導體行業觀察轉載僅為了傳達一種不同的觀點,不代表半導體行業觀察對該觀點贊同或支援,如果有任何異議,歡迎聯絡半導體行業觀察。

今天是《半導體行業觀察》為您分享的第3006內容,歡迎關注。

晶圓|積體電路|裝置|汽車晶片|儲存|臺積電|AI|封裝

AMD 要在CPU中引入3D堆疊ML加速器?

分類: 動物
時間: 2022-04-10

相關文章

「英超」瓦爾迪破門難救主,布萊頓主場2-1險勝萊斯特城

「英超」瓦爾迪破門難救主,布萊頓主場2-1險勝萊斯特城
北京時間2021年9月19日21時,英超第5輪,布萊頓在主場迎接萊斯特城的挑戰.比賽第35分鐘,莫派為布萊頓首開記錄.上半場戰罷,布萊頓暫時以1-0領先.經過中場休息,下半場比賽開始,比賽第50分鐘, ...

瓦爾迪若在下一場比賽登場,將成為我狐第一位在英超...

瓦爾迪若在下一場比賽登場,將成為我狐第一位在英超...
瓦爾迪若在下一場比賽登場,將成為我狐第一位在英超聯賽中出場達到250次的球員 瓦帝即將創下新記錄,未來很遠我們繼續攜手前行

羅傑斯上任後瓦爾迪英超已進50球,同期並列最多

羅傑斯上任後瓦爾迪英超已進50球,同期並列最多
直播吧9月19日訊 據天空體育資料統計,自從羅傑斯上任之後,瓦爾迪在英超已打入50球,同期並列英超最多. 在剛剛結束的一場英超聯賽中,萊斯特城客場1-2不敵布萊頓,瓦爾迪打進一球. 據統計,自從201 ...

16/17賽季以來,瓦爾迪是英超單場自擺烏龍並梅開二度的第二人

16/17賽季以來,瓦爾迪是英超單場自擺烏龍並梅開二度的第二人
直播吧9月25日訊 在英超第6輪的比賽中,萊斯特與伯恩利2-2戰平,瓦爾迪在打進烏龍球之後上演梅開二度,完成"另類帽子戲法". 據資料網站Squawka統計,瓦爾迪是自16/17賽 ...

世界禁區:這20個地方不歡迎你進入

世界禁區:這20個地方不歡迎你進入
梅日戈爾耶鎮 梅日戈爾耶是俄羅斯巴什科爾託斯坦共和國的一個封閉村鎮,直到1979年這個小鎮才為世人所發現.傳聞,鎮裡住的都是從事高度機密任務的工作人員.不僅如此,這裡還是俄羅斯領導人的避難所. 松樹谷 ...

iPhone 13 用塑膠瓶做天線,蘋果瘋了嗎?

iPhone 13 用塑膠瓶做天線,蘋果瘋了嗎?
iPhone 13 這幾天正在火熱預售中,雖然消費者還沒摸到真機,但網上已經被吵翻了天,起因就在於包裝盒的一層塑膠膜上. 在秋季釋出會上,蘋果表示將取消 iPhone 13 包裝盒外的塑封膜,因為這些 ...

Auto史記 | 都在GT、GT的,到底GT是個什麼東西?「前方帥車高能」

Auto史記 | 都在GT、GT的,到底GT是個什麼東西?「前方帥車高能」
#全民說車--汽車內容創作季# GT這個詞今天已經被濫用,稍稍造型不同.或者加條不倫不類的尾翼,就可以稱自己是"XX GT"的車型比比皆是. GT一詞是Gran Turismo的縮 ...

因冰層減少,北極熊不得不近親繁殖

因冰層減少,北極熊不得不近親繁殖
根據一項新的研究,氣候變化正在迅速融化北極的海冰,導致北極熊正常生存及行為的"大規模變化".科學家發現,在挪威,熊不得不透過近親繁殖而生存延續下去. 週三公佈的一項研究發現,從19 ...

假期不出城玩什麼?展覽、戲劇、音樂節…彙總來了,收好

假期不出城玩什麼?展覽、戲劇、音樂節…彙總來了,收好
這個十一假期 不出城依舊玩出文藝範兒 懶人攻略來了 展覽.戲劇.音樂節- 你想要的這裡都有 展覽.戲劇 [展覽]遇見敦煌 光影藝術展 北京華熙LIVE·五棵松 中央廣場 2021.7.23-2021. ...

中國為何有挪威部分領土的自由通行權,天上掉餡餅還是挪威的陰謀

中國為何有挪威部分領土的自由通行權,天上掉餡餅還是挪威的陰謀
很多人並不知道在挪威有這樣一塊地方,中國人無需向任何國家申請,可以自由通行,想待多久就待多久. 只要你不從事影響挪威主權的軍事行動,就可以在該地享受工作或者開採的權利. 這個地方就是斯瓦爾巴群島,位於 ...

國際社會看好中國經濟發展前景
來源:人民網-人民日報 去年以來,全球經濟遭遇疫情衝擊,中國在世界主要經濟體中率先實現正增長,2020年經濟總量邁上百萬億元新臺階.今年上半年,中國國內生產總值同比增長12.7%.近期釋出的一系列資料 ...

海中的“金絲雀”,走近神奇的海洋哺乳動物白鯨

海中的“金絲雀”,走近神奇的海洋哺乳動物白鯨
你知道嗎?鯨豚類主要分為兩個分支:鬚鯨(Baleen whales)和齒鯨(Toothed whales).以嘴裡是否長有牙齒來區分二者.其中,鬚鯨家族包括藍鯨.大翅鯨.灰鯨等:齒鯨家族包括抹香鯨.虎 ...

“瓦盧斯,還我軍團”——回顧最大軍事失敗條頓堡森林戰役

“瓦盧斯,還我軍團”——回顧最大軍事失敗條頓堡森林戰役
羅馬帝國(公元前27年-公元1453年),是以地中海為中心,跨越歐.亞.非三大洲的大帝國 .正式名稱為元老院與羅馬人民,中國史書稱為大秦.拂菻.全盛時期控制了大約500萬平方公里的土地,是世界古代史上 ...

展評|葛飾北齋繪本里的萬物,博爾赫斯式的想象力

展評|葛飾北齋繪本里的萬物,博爾赫斯式的想象力
文/Jonathan Jones,編譯/陸林漢 葛飾北齋(1760 - 1849)是19世紀日本最重要的畫家與版畫家之一,他曾為<萬物繪本大全>繪製了103幅畫稿,然而繪本終究沒有出版,這 ...

西甲最新積分戰報 馬競力壓皇馬登頂 畢爾巴進前4 巴薩被擠到第9

西甲最新積分戰報 馬競力壓皇馬登頂 畢爾巴進前4 巴薩被擠到第9
北京時間9月19日凌晨,2021-22賽季西甲聯賽第5輪再賽4場.經過一番鏖戰,馬競主場0:0悶平畢爾巴鄂競技,萊萬特客場1:1戰平埃爾切,巴列卡諾主場3:0大勝赫塔菲,奧薩蘇納客場2:0完勝阿拉維斯 ...

默克爾卸任 誰將領導德國?

默克爾卸任 誰將領導德國?
作者: 李秈霓 德國將在9月26日舉行聯邦議會選舉,儘管執政近16年的總理默克爾決定交出領導棒子,但此次選舉仍處處可見她的影子.三位主要總理人選中呼聲最高的不是默克爾所屬聯盟黨推舉的拉舍特,而是社會民 ...

一箇中吹的“坦尚尼亞導師”尼雷爾

一箇中吹的“坦尚尼亞導師”尼雷爾
2016年4月19日,連線坦尚尼亞第一大城市達累斯薩拉姆市區與海洋資源豐富的基甘博尼半島的大橋建成通車. 尼雷爾大橋 該大橋為雙塔單索麵斜拉橋,全長680米,主跨度200米,橋面寬32米,雙向6車道, ...

巴黎聖日爾曼祝中國球迷中秋快樂!內馬爾梅西拉莫斯出鏡

巴黎聖日爾曼祝中國球迷中秋快樂!內馬爾梅西拉莫斯出鏡
內馬爾 拉莫斯 阿什拉夫 多納魯馬 梅西 梅西 巴黎聖日耳曼足球俱樂部簡稱PSG,是一家位於法國首都巴黎的足球俱樂部,目前比賽於法國足球甲級聯賽,球隊主場為王子公園體育場. 現役球員編輯 號碼 國籍 ...

阿斯加特女武神降臨,白色主題裝機記憶體條有著落了

阿斯加特女武神降臨,白色主題裝機記憶體條有著落了
高頻率記憶體燈條,一直是深受遊戲玩家和商家的喜愛. 對於玩家來說,高頻記憶體是提高電腦效能的必備,而RGB色彩的燈光,更是一種彰顯身份的標記,玩遊戲哪能不用RGB記憶體燈條呢?至於商家,憑藉高頻和RG ...

瓦拉內公開喊話同胞:留在曼聯吧!Goal:拜仁開啟切爾西中衛談判

瓦拉內公開喊話同胞:留在曼聯吧!Goal:拜仁開啟切爾西中衛談判
瓦拉內近日公開呼籲博格巴留在曼聯,後者的合同明年到期,並且一月份時就可以自由與其他俱樂部預籤合同. 報道稱,巴薩.尤文以及皇馬都對28歲的博格巴虎視眈眈,不過為了留住這名中場,曼聯願意給他提供僅次於C ...