本文轉載自【半導體行業觀察】公眾號
未來驅動人工智慧的一些最佳電路可能是模擬的,而不是數字的,世界各地的研究團隊正在越來越多地開發新裝置來支援這種模擬人工智慧。
推動當前 AI 爆炸式增長的深度神經網路中最基本的計算是乘法累加 (MAC) 操作。深度神經網路由人工神經元層組成,在 MAC 操作中,這些層中每一層的輸出乘以它們與下一層連線的強度或“權重”的值,然後將這些貢獻相加.
現代計算機具有專門用於 MAC 操作的數字元件,但理論上類比電路可以以少幾個數量級的功耗來執行這些計算。這種策略(稱為模擬人工智慧、記憶體計算或記憶體處理)通常使用非易失性儲存裝置(例如快閃記憶體、磁阻 RAM (MRAM)、電阻 RAM (RRAM)、相位)執行這些乘法累加運算- 更改記憶體 (PCM)和更深奧的技術。
然而,韓國的一個團隊正在探索基於鐠鈣錳氧化物電化學 RAM (ECRAM)裝置的神經網路,該裝置的作用類似於微型電池,以電導變化的形式儲存資料。韓國浦項科技大學的研究主要作者 Chuljun Lee 指出,神經網路硬體在訓練和應用期間通常有不同的需求。例如,low energy barriers有助於神經網路快速學習,但high energy barriers 有助於它們保留學到的知識以供在應用中使用。
“在訓練期間將他們的裝置加熱到接近 100 攝氏度的溫度會產生有利於訓練的特性,”電氣工程師John Paul Strachan說,他是德國 Jülich 研究中心的Peter Grünberg 神經形態計算節點研究所的負責人。不參與本研究。“當它冷卻時,他們獲得了更長的保留時間和更低的執行電流的優勢。只需調整一個旋鈕,熱量,他們就可以看到計算的多個維度的改進。”
研究人員在12 月 14 在舊金山舉行的年度 IEEE國際電子裝置會議(IEDM) 上面詳細介紹了他們的發現。
Strachan 指出,這項工作面臨的一個關鍵問題是,在經過多次加熱和冷卻迴圈後,ECRAM 可能會面臨什麼樣的惡化。儘管如此,“這是一個非常有創意的想法,他們的工作證明了這種方法可能具有一些潛力。”
另一組研究了鐵電場效應電晶體 (FEFET)。研究的主要作者、聖母大學的 Khandker Akif Aabrar 解釋說,FEFET 在每個電晶體內以電極化的形式儲存資料。
FEFET 面臨的一個挑戰是,當它們縮小時,它們是否仍然可以顯示對 AI 應用程式有價值的模擬行為,或者它們是否會突然切換到只儲存一位資訊的二進位制模式,極化狀態為一種狀態或另一種狀態.
“這個團隊工作的優勢在於他們對所涉及材料的洞察力,”沒有參與這項研究的 Strachan 說。“鐵電材料可以被認為是由許多小域組成地塊,就像鐵磁體可以被認為是上下域一樣。對於他們想要的模擬行為,他們希望所有這些域慢慢地向上或向下對齊響應施加的電場,而不是出現它們同時上升或下降的失控過程。因此,他們用多個介電層物理分解了鐵電超晶格結構,以減少這種失控過程。”
該系統實現了 94.1% 的線上學習準確率,與其他 FEFET 和 RRAM 技術相比非常好,科學家們在 12 月 14 日在 IEDM 會議上詳細介紹了這一發現。Strachan 指出,未來的研究可以尋求最佳化屬性,例如當前水平。
日本和臺灣科學家使用c軸排列的結晶銦鎵鋅氧化物製成 的新型微晶片. 研究合著者日本半導體能源實驗室公司的 Satoru Ohshita 指出,他們的氧化物半導體場效應電晶體 (OSFET) 顯示出每單元低於 1 奈米的超低電流操作和每瓦每秒 143.9 萬億次操作的操作效率12 月 14 日在 IEDM 會議上詳細介紹的研究結果,是迄今為止模擬 AI 晶片中報告的最好成績。
“這些是極低電流的裝置,”Strachan 說。“由於所需的電流如此之低,您可以將電路塊做得更大——它們獲得 512 x 512 儲存單元的陣列,而 RRAM 的典型數字更像是 100 x 100。這是一個巨大的勝利,因為更大的塊得到了二次方它們儲存的權重具有優勢。“當 OSFET 與電容器結合時,他們可以在 30 小時內以超過 90% 的準確率保留資訊。“這可能足以將這些資訊轉移到一些波動較小的技術上——幾十個小時的保留並不是一個交易破壞者,”斯特拉坎說。
總而言之,“研究人員正在探索的這些新技術都是概念案例的證明,這些案例提出了關於他們未來可能面臨的挑戰的新問題,”斯特拉坎說。“他們還展示了通往代工廠的道路,他們需要大批次、低成本的商業產品。”