來源:內容由半導體行業觀察(ID:icbank)編譯自allaboutcircuits,謝謝。
在最近的一份報告中,中國阿里巴巴表示,其研究中心達摩院已透過突破性的記憶體處理 (PIM) 晶片打破了馮諾依曼瓶頸,該晶片在 3D 中堆疊記憶體和邏輯。
這其實不是大公司第一次轉向垂直結構以縮短記憶體和計算之間的距離。幾年前,IBM 發表了關於3D 堆疊儲存器和位元組可定址電阻非易失性儲存器 (NVM) 如何為 EE 解決 PIM 的新方法的研究。
從這個話題,我們看到了 PIM 的研究在大學和主要半導體供應商之間是如何升溫的。
PIM 如何重新思考馮諾依曼架構
傳統的馮諾依曼計算機體系結構使用一個子系統進行資料儲存,使用另一個子系統進行計算。資料和邏輯是分開的。
要執行操作,必須透過向記憶體控制器傳送記憶體請求,將資料從 DRAM 儲存移動到 CPU,透過窄記憶體通道進行通訊。但是這種從 DRAM 到 CPU 的轉移可能會給系統帶來主要的瓶頸問題——增加能源消耗,同時減慢多個記憶體請求的交換速度。這就是系統一直工作的方式,至少自從數字二進位制模型被廣泛採用以來。
存內處理式儲存器(PIM)模型透過合併運算和資料這就是為什麼PIM也稱為反思馮·諾依曼體系結構 近資料處理。
一些研究小組和公司正在建立 PIM 架構,以使記憶體處理更接近現實。去年,All About Circuits 討論了有多少公司發現 記憶體計算可以在速度、容量和處理方面解決 AI 記憶體平衡問題。
這是因為,與數字晶片不同,PIM AI 晶片在模擬領域執行——Imec 和 Globalfoundries在最近的 AI 晶片中將其稱為“模擬記憶體計算(AiMC)”。
PIM 研究使模擬計算遠離數字計算
現在,聖路易斯華盛頓大學的一個研究小組,由Xuan“Silvia”Zhang領導,使用電阻代替電晶體,構建了繞過馮諾依曼架構限制的PIM電路。儲存器和處理器都在電阻器中。元件的這種放置使得從模擬到數字或二進位制 (1-0) 的轉換變得不必要,並簡化了 AI 計算所需的複雜加法和乘法。
PIM 電路不是使用電晶體來開啟和關閉柵極並控制電流流動或不流動(建立 1 和 0 的序列),而是透過連線兩個電流並透過調整電阻值進行乘法來執行加法。
但是,在某些時候,模擬資料必須轉換為數字資料才能融入當今的數字技術。研究人員最初假設這僅需要將 ADC(模數轉換)在轉換層次結構中進一步向下移動。
然而,該團隊發現,引入神經逼近器可以提高多個方向上單獨轉換的電阻列的處理效率:向下、橫向或任何其他最大效率方向。
Zhang 的團隊做出的最重要的發現是,可以使用單個 ADC 將 RRAM crossbar 列建立的部分和轉換為數字格式,無論它們的數量是 18、64 還是 128,從而減少了外邊緣的轉換次數儘可能。
三星支援記憶體處理
華盛頓大學的研究結果提出了一個有趣的問題:模擬會推動計算的未來嗎?三星最近對記憶體處理應用的投資可能會回答這個問題。
三星正試圖透過將高頻寬記憶體 (HBM) 和記憶體處理與加速器系統整合來彌合記憶體和邏輯之間的差距。結果是 HBM-PIM 架構適用於移動和其他商業 DRAM 模組,包括資料中心和超級計算機。
DIMM (AXDIMM) 緩衝晶片(一種可以處理多個記憶體列的多核處理器)中的加速是透過稱為可程式設計計算單元 (PCU)的內建 AI 引擎實現的。據稱,該裝置可將系統性能提高 2.5 倍,並將能耗降低 60%。
三星已經看到這款 PCU 在影象分類、語音識別和翻譯方面取得了可喜的成果。SAP HANA 還與三星合作改進記憶體資料庫管理系統 (IMDBMS)。
PIM 是否有助於減輕邊緣 AI 處理的負擔?
隨著越來越多的處理需求堆積在嵌入式系統上,尤其是在邊緣,製造商正在尋找方法來減少從記憶體中獲取資料的旅行時間。隨著 PIM 在學術和行業領域獲得越來越多的關注,記憶體計算可能是一種可行的解決方案——尤其是在三星和 IBM 等知名企業大力推廣的情況下。
儘管如此,程式設計師仍面臨著定義與程式設計模型通訊的方式的挑戰性任務。這些工程師和系統架構師還必須找到資料分配問題和 PIM 執行時排程的解決方案。
★ 點選文末【閱讀原文】,可檢視本文原文連結!
*免責宣告:本文由作者原創。文章內容系作者個人觀點,半導體行業觀察轉載僅為了傳達一種不同的觀點,不代表半導體行業觀察對該觀點贊同或支援,如果有任何異議,歡迎聯絡半導體行業觀察。
今天是《半導體行業觀察》為您分享的第2900內容,歡迎關注。
晶圓|積體電路|裝置|汽車晶片|儲存|臺積電|AI|封裝