sponsored links

向模擬AI晶片進發

來源:內容轉載自公眾號IEEE電氣電子工程師,作者:GEOFFREYW.BURR等 ,謝謝。

向模擬AI晶片進發


機器學習和人工智慧(AI)已經深入到我們的生活和工作中,以至於你可能已經忘記了與機器的互動曾經是什麼樣子。我們過去只要求對數字鍵盤、電子表格或程式語言表達的問題給出精確的定量答案,例如:“10的平方根是多少?”“按照這個利率,我在未來五年的收益是多少?”

但在過去的10年裡,我們已經習慣了機器,也常常向它提出一些模糊的問題:“我會喜歡這部電影嗎?”“今天的交通情況如何?”“那筆交易是欺詐性的嗎?”

深度神經網路(DNN)是一種學習如何在對非常相似的查詢進行正確答案的訓練後對新查詢做出響應的系統,它啟用了這些新功能。據國際資料公司(International Data Corporation)稱,DNN是快速增長的全球人工智慧硬體、軟體和服務市場的主要驅動力,今年價值3275億美元,預計2024年將超過5000億美元。

卷積神經網路首先透過提供超人的影象識別能力推動了這場革命。在過去的十年中,用於自然語言處理、語音識別、強化學習和推薦系統的新DNN模型已經實現了許多其他商業應用。

但不僅僅是應用程式的數量在增長。網路的規模和所需的資料也在增長。DNN具有固有的可擴充套件性,當它們變得更大時,當您使用更多資料對它們進行培訓時,它們提供了更可靠的答案。但這樣做是有代價的。2010年至2018年間,培訓最佳DNN模型所需的計算運算元量增長了10億倍,這意味著能耗大幅增加,而在新資料(稱為inference,推理)上使用已培訓過的DNN模型所需的計算量大大低於培訓本身,因此能耗也大大降低,這種推理計算的數量是巨大的,而且還在增加。如果要繼續改變人們的生活,人工智慧就必須提高效率。

從數字計算到模擬計算的轉變可能是我們所需要的。透過使用非易失性儲存裝置和電氣工程的兩個基本物理定律,簡單電路可以實現深度學習最基本的計算,只需要千分之一萬億焦耳(毫焦耳)。在這項技術能夠應用於複雜的人工智慧之前,有大量的工程要做,但我們已經取得了巨大的進步,並制定了前進的道路。

向模擬AI晶片進發


在大多數計算機中,當大量資料必須在外部儲存和計算資源(如CPU和GPU)之間移動時,時間和能源成本最高。這就是“馮·諾依曼瓶頸(von Neumann bottleneck)”,以分離記憶體和邏輯的經典計算機體系結構命名。一種大大降低深度學習所需能量的方法是避免將資料移動到儲存資料的地方進行計算。

DNN由多層人工神經元組成。每一層神經元根據一對值——神經元的“啟用”和與下一層神經元連線的突觸“重量”——驅動下一層神經元的輸出。

大多數DNN計算由所謂的向量矩陣乘法(vector-matrix-multiply,VMM)操作組成,其中向量(a one-dimensional array of numbers,一維數字陣列)與二維陣列相乘。在電路級,這些操作由許多乘法累加(MAC)操作組成。對於每個下游神經元,所有上游啟用必須乘以相應的權重,然後將這些貢獻相加。最有用的神經網路太大,無法儲存在處理器的記憶體中,因此在計算網路的每一層時,必須從外部記憶體引入權重,每次計算都會受到可怕的馮·諾依曼瓶頸的影響。這使得數字計算硬體更傾向於DNN,它從記憶體中移動更少的權重。

早在2014年,IBM Research就向我們提出了一種全新的節能DNN硬體方法。與其他研究人員一起,我們一直在研究非易失性儲存器(NVM)裝置的交叉陣列。縱橫制陣列是一種結構,其中裝置(例如儲存單元)構建在兩組垂直水平導體(即所謂的位線和字線)之間的垂直空間中。我們意識到,只要稍作修改,我們的記憶體系統將非常適合DNN計算,尤其是那些現有權重重用技巧效果不佳的計算。我們將這一機會稱為“模擬人工智慧”,儘管其他從事類似工作的研究人員也使用“在記憶體中處理(processing-in-memory)”或“在記憶體中計算(compute-in-memory)”等術語。

NVM有幾種不同的型別,每種型別都以不同的方式儲存資料。但是資料是透過測量裝置的電阻(或者,等效地,它的反向電導)從所有這些裝置中獲取的。磁阻RAM(MRAM)使用電子自旋,而快閃記憶體使用捕獲電荷。電阻RAM(RRAM)器件透過在微小的金屬-絕緣體-金屬器件內產生並隨後破壞導電細絲缺陷來儲存資料。相變儲存器(PCM)利用熱量在高導電性晶相和低導電性非晶相之間誘導快速可逆轉變。

快閃記憶體、RRAM和PCM提供常規數字資料儲存所需的低電阻和高電阻狀態,以及模擬AI所需的中間電阻。但在高效能邏輯中,只有RRAM和PCM可以容易地放置在矽電晶體上方佈線中的交叉陣列中,以最小化記憶體和邏輯之間的距離。

我們將這些NVM記憶體單元組織在二維陣列中,或“平鋪”磁貼(tile)上包括控制NVM裝置讀寫的電晶體或其他裝置。對於記憶體應用,定址到一行(字線)的讀取電壓會產生與NVM電阻成比例的電流,可在陣列邊緣的列(位線)上檢測到該電流,從而檢索儲存的資料。

為了使這樣一個塊成為DNN的一部分,每一行用一個電壓驅動,持續時間編碼一個上游神經元的啟用值。沿行的每個NVM裝置用其電導編碼一個突觸重量。透過歐姆定律(在這種情況下表示為“電流等於電壓乘以電導”),產生的讀取電流有效地執行激勵和重量的乘法。然後,根據基爾霍夫電流定律(Kirchhoff's Current Law),每個位線上的單個電流相加。這些電流產生的電荷隨時間積分在電容器上,產生MAC操作的結果。

這些相同的模擬記憶體求和技術也可以使用快閃記憶體甚至SRAM單元來執行,SRAM單元可以儲存多個位,但不能儲存模擬電導。但是我們不能把歐姆定律用於乘法步驟。相反,我們使用的技術可以適應這些記憶體裝置的一位或兩位動態範圍。然而,這種技術對噪聲非常敏感,所以IBM一直堅持使用基於PCM和RRAM的模擬AI。

與電導不同,DNN權重和啟用可以是正的,也可以是負的。為了實現有符號權重,我們使用一對電流路徑,一個向電容器新增電荷,另一個減去。為了實現有符號激勵,我們允許每行裝置根據需要交換它連線的路徑。

向模擬AI晶片進發
向模擬AI晶片進發
向模擬AI晶片進發
向模擬AI晶片進發


當每列執行一個MAC操作時,磁貼並行執行整個向量矩陣乘法。對於權重為1024×1024的磁貼,這是一次100萬個MAC。在我們設計的系統中,我們預計所有這些計算只需32納秒。由於每個MAC執行的計算相當於兩次數字運算(一次乘法後一次加法),因此每32納秒執行100萬次模擬MAC代表每秒65萬億次運算。由此,每次操作僅使用36毫焦耳的能量,相當於每焦耳28萬億次操作。研究人員最新設計將這一數字降低到10 fJ以下,使其效率比商用硬體高100倍,比最新定製數字加速器的系統級能效高10倍,即使是那些為了能效而犧牲精度的加速器。

對我們來說,提高per-tile的能效非常重要,因為一個完整的系統在其他任務上也會消耗能量,比如移動啟用值和支援數位電路。

要使這種模擬人工智慧方法真正起飛,還有許多重大挑戰需要克服。首先,根據定義,深層神經網路具有多層結構,需要要級聯多個層。最近,我們推出了一種基於PCM的高效能磁貼,使用了一種新型ADC,幫助磁貼達到每瓦10萬億次以上的操作。

第二個挑戰與NVM裝置的行為有關,也更麻煩。數字DNN已被證明是準確的,即使它們的重量是用相當低精度的數字描述的。CPU經常使用的32位浮點數對於DNN來說是多餘的,當使用8位浮點值甚至4位整數時,DNN通常工作得很好,能量也比較少。這為模擬計算提供了希望,只要我們能夠保持類似的精度。

鑑於電導精度的重要性,將電導值寫入NVM裝置以表示模擬神經網路中的權重需要緩慢而仔細地完成。與傳統儲存器(如SRAM和DRAM)相比,PCM和RRAM的程式設計速度較慢,並且在程式設計週期較少後會磨損。幸運的是,對於推理,權重不需要經常重新程式設計。因此,模擬AI可以使用耗時的寫驗證技術來提高對RRAM和PCM裝置程式設計的精度,而不必擔心裝置磨損。

這種提升是非常必要的,因為非易失性儲存器具有固有的程式設計噪聲水平。有一些方法可以解決這個問題。透過使用兩個電導對,可以顯著改善重量程式設計。這裡,一對儲存大部分訊號,而另一對用於糾正主對上的程式設計錯誤。噪聲被降低,因為它在更多的裝置上得到平均值。

我們最近在基於多片PCM的晶片上測試了這種方法,每個重量使用一對和兩對電導對。有了它,我們在幾個DNN上證明了卓越的準確性,甚至在遞迴神經網路上也是如此,這種神經網路通常對權重程式設計錯誤非常敏感。

向模擬AI晶片進發
向模擬AI晶片進發


到目前為止,我們只討論已經訓練好的神經網路作用於新資料的推理。但模擬人工智慧也有機會幫助培訓DNN。

DNN使用反向傳播演算法進行訓練。這將通常的正向推理操作與另外兩個重要步驟錯誤反向傳播和權重更新相結合。錯誤反向傳播就像反向執行推理,從網路的最後一層返回到第一層;權重更新然後將來自原始正向推理執行的資訊與這些反向傳播的錯誤相結合,以使模型更準確的方式調整網路權重。

模擬人工智慧的成功將取決於同時實現高密度、高吞吐量、低延遲和高能效的程度。密度取決於NVM整合到晶片電晶體上方佈線的緊密程度。磁貼級別的能源效率將受到用於模數轉換的電路的限制。

前進的道路必然不同於數字人工智慧加速器。但是,模擬AI必須首先提高內部模擬模組的信噪比(SNR),直到它足夠高,足以證明與數字系統的精度相當。任何後續的信噪比改進都可以用於提高密度和能源效率。

這些都是令人興奮的問題,需要材料科學家、裝置專家、電路設計師、系統架構師和DNN專家的共同努力才能解決。人們強烈且持續地需要更高的能效AI加速,並且缺乏其他有吸引力的替代品來滿足這一需求。考慮到各種各樣的潛在儲存裝置和實現途徑,某種程度的模擬計算很可能會進入未來的人工智慧加速器。

這篇文章刊登在2021年12月的印刷版上,題為“歐姆定律+基爾霍夫現行定律=更好的AI”。

*免責宣告:本文由作者原創。文章內容系作者個人觀點,半導體行業觀察轉載僅為了傳達一種不同的觀點,不代表半導體行業觀察對該觀點贊同或支援,如果有任何異議,歡迎聯絡半導體行業觀察。

今天是《半導體行業觀察》為您分享的第2894內容,歡迎關注。

晶圓|積體電路|裝置|汽車晶片|儲存|臺積電|AI|封裝

向模擬AI晶片進發

分類: 娛樂
時間: 2021-12-19

相關文章

85歲巴基斯坦“核彈之父”去世 此前曾感染新冠

85歲巴基斯坦“核彈之父”去世 此前曾感染新冠
來源:海外網 報道截圖 海外網10月10日電綜合巴基斯坦國家廣播電臺.<黎明報>10日報道,巴基斯坦"核彈之父"阿卜杜勒·卡迪爾·汗於當地時間10日上午在伊斯蘭堡去世, ...

新中國首位女省長顧秀蓮:出身農民做到副國級,如今85歲依舊工作

新中國首位女省長顧秀蓮:出身農民做到副國級,如今85歲依舊工作
中國女性在過去幾千年的封建社會中始終都是受壓迫受迫害的物件,從小就接受三從四德的教育,完全沒有自主意識,完全是依附於男性的附屬品. 新中國成立以後,女性的社會地位有了極大提升,同時也證明了女性的各項能 ...

42年後,《吉鴻昌》主演現狀迥異,有人86歲健壯如牛,有人已去世

42年後,《吉鴻昌》主演現狀迥異,有人86歲健壯如牛,有人已去世
1980年,停辦了17年之久的"大眾電影百花獎",終於又重新啟動了.這大大激發了廣大觀眾的參與熱情.大家紛紛投票,積極踴躍地評選自己心中的最佳電影和最佳演員. 但1979年上映的好 ...

這些明星年輕時很帥,顏值超高,最大者已85歲,不知道你記得幾個

這些明星年輕時很帥,顏值超高,最大者已85歲,不知道你記得幾個
前段時間,娛樂圈突颳了起"鮮肉娘炮風",好多男星都燙著奇怪的髮型,戴著耳環,一個個整得跟"小姐姐相似",不過好在有關部門下達了整改政策,如今這些怪象已成過去.其 ...

活了85歲,到死攢下9000塊錢。農村人,終其一生的卑微
我的爺爺,生於1934年,於2019年辭世.享年85歲! 祖輩兒三代貧農,可老爺子到去世那天,一輩子也不會做農活兒.因為少時讀過幾年書,生產隊解體後,被安排到了村委會做了一輩子的會計. 家裡一畝薄田, ...

6歲前若不給孩子立規矩,再好的教育都是無用的

6歲前若不給孩子立規矩,再好的教育都是無用的
從小立好的家規,對孩子來說,這些規矩會成為習慣,而不是束縛. 作者 | 夏天 無意中刷到一段小影片,看後很是憂心. 一個6歲的小女孩在飯桌上七扭八歪地坐著,媽媽催促她趕緊吃飯,她開啟雙臂,齜牙咧嘴地對 ...

“金利來”創始人曾憲梓:85歲在家鄉病逝,25億財產全部捐給國家

“金利來”創始人曾憲梓:85歲在家鄉病逝,25億財產全部捐給國家
對於大多數人來說,平庸一生彷彿成為了一種常態,但還有一小部分人的人生以平凡作為開端,以璀璨落幕,其中有一位典型的代表人物則是香港富豪.著名的"領帶大王"--曾憲梓. 曾憲梓出生於廣 ...

我患2型糖尿病47年,85歲,無明顯糖尿病併發症,10個控糖經驗分享給大家

我患2型糖尿病47年,85歲,無明顯糖尿病併發症,10個控糖經驗分享給大家
我今年85歲,患糖尿病47年,目前健康狀況:血糖.血壓.血脂.尿酸.體重控制在達標範圍內,沒有明顯併發症,正奔跑在患糖尿病超過50年的闖關路上,我有信心挑戰成功. 本文作者:王文英,患2型糖尿病47年 ...

《第二個春天》演員今昔照 如今於洋91歲張瑜63歲 7位老藝術家去世

《第二個春天》演員今昔照 如今於洋91歲張瑜63歲 7位老藝術家去世
1975年,我們看到了許多新電影,其中包括<海霞>.<春苗>.<紅雨>.<金光大道>.<創業>以及重拍版的<平原游擊隊>.< ...

85歲焦晃昨晚獲中國戲劇最高榮譽獎,他如何度過舞臺60年?

85歲焦晃昨晚獲中國戲劇最高榮譽獎,他如何度過舞臺60年?
10月9日,第17屆中國戲劇節在武漢開幕,85歲的表演藝術家焦晃獲"中國文聯終身成就戲劇家"稱號.焦晃表示:"我不會把這份獎勵看作僅是我個人的榮譽,我更願意把它看作是對我 ...

孩子6歲前,這5個規矩必須給他立起來

孩子6歲前,這5個規矩必須給他立起來
現在很多家長都懂得要給孩子立規矩,然而想起來容易,做起來太難了! 說好的只能看一集動畫片,開了電視機,看起來就停不下來. 講了多少次不要再買玩具,進了超市的門,就直奔玩具區,不給買就撒潑耍賴. 為什麼 ...

10歲前,有這12個跡象,說明你把孩子養得很好

10歲前,有這12個跡象,說明你把孩子養得很好
作者 | 關山月 漫畫 | 紫菜飯糰 教育難嗎? 難. 沒有父母的准入門檻, 更沒有可以模仿的滿分答卷. 它需要我們每個人, 一以貫之的努力, 不得懈怠的人生, 每天的微小積累, 增加一點點機率, 就 ...

李盈瑩的故事:20歲前遭遇兩次重大打擊,並不想做朱婷的接班人

李盈瑩的故事:20歲前遭遇兩次重大打擊,並不想做朱婷的接班人
一.9歲時,一個人背井離鄉來到天津. 2000年2月19日,李盈瑩出生在黑龍江齊齊哈爾的一個普通家庭,父母都是工薪階層.由於從小身高就很出眾,李盈瑩自6歲開始接觸排球,8.9歲時便已經玩出了點名氣. ...

“我要在有生之年為玉米育種鞠躬盡瘁”——85歲育種專家與中國科協主席“鴻雁傳書”
"我今年已經85歲了,仍然在育種基地做玉米育種實驗.因為我知道,種子是農業的'晶片',每一粒種子,都關係著中國人的飯碗安全."近日,中國科協主席萬鋼.黨組書記張玉卓收到一封特殊來信 ...

72歲妹妹看85歲姐姐,姐做1桌菜招待,曬朋友圈火了,網友:摳門

72歲妹妹看85歲姐姐,姐做1桌菜招待,曬朋友圈火了,網友:摳門
導語:72歲妹妹看85歲姐姐,姐做1桌菜招待,曬朋友圈火了,網友:摳門!中秋節是我們老祖宗留下來的傳統節日,是中國的四大傳統節日之一.每逢節日之前,親朋好友,兄弟姐妹們都會相互拜訪,大部分都是小輩拜訪 ...

3歲女孩兩歲前能走路,現在只會爬!媽媽:天都塌了

3歲女孩兩歲前能走路,現在只會爬!媽媽:天都塌了
家住福建福州的妞妞(化名)剛滿三歲. 兩歲前, 她和其他正常孩子一樣走路, 開心時還會隨著音樂跳上一段舞蹈. 可兩歲後, 妞妞的父母發現她的運動功能出現了倒退. 這到底是怎麼回事? 兩歲前正常走路 三 ...

2歲前該怎麼挑選奶製品?純牛奶、配方奶、酸奶,喝對了有益無害

2歲前該怎麼挑選奶製品?純牛奶、配方奶、酸奶,喝對了有益無害
奶製品五花八門,讓家長眼花繚亂,各種問題緊隨而來,"怎麼挑選奶製品","各年齡段怎樣選擇奶製品",奶製品為寶寶提供蛋白質,也為家長們提供著煩惱. 目前選擇最多的 ...

10歲前“屈光儲備”對預防近視很有益

10歲前“屈光儲備”對預防近視很有益
圖@視覺中國 廣州日報訊 (全媒體記者翁淑賢 通訊員方寧.劉慶鈞)很多家長對孩子的視覺發育缺乏瞭解.眼科專家指出,其實兒童的視力不能一律以1.0(5.0)為正常視力.因為視覺發育與身體發育相伴,不同年 ...

她是三無研究員,85歲卻獲得專業領域最高獎,屠呦呦憑的是什麼?

她是三無研究員,85歲卻獲得專業領域最高獎,屠呦呦憑的是什麼?
在中國科學領域,最高的榮譽是院士. 可有這麼一個人,她在專業領域作出突出貢獻,活人千千萬,獲得諾貝爾醫學獎,可依舊沒有當選院士. 屠呦呦被稱為三無科學家,沒有博士學位.留學背景,院士頭銜,但這些依舊無 ...

醫生:寶寶2歲前有3個部位,無論多髒也要忍著,不可隨意清洗

醫生:寶寶2歲前有3個部位,無論多髒也要忍著,不可隨意清洗
把寶寶收拾得乾乾淨淨,這是每個媽媽的心願.可是,2歲以下的小寶貝,很多地方都不能隨意亂碰,更不能隨便亂洗,不然很容易適得其反,威脅到寶寶的健康. 1歲半的女寶尿尿疼,檢查後發現,原來是媽媽做了這事 李 ...