sponsored links

自動駕駛晶片效能評價指標:DMIPS,TOPS

如果你經常和DMIPS,TOPS,GFLOPS等評價晶片效能的單位打交道,又不知道這些單位意味著什麼,那看這篇文章就對了

TOPS

TOPS是Tera Operation Per Second的縮寫,表示每秒鐘可以進行的運算元量,用於衡量自動駕駛的算力,有時還會拿TOPS/W來說明功耗,即單位功耗下的運算能力。

自動駕駛晶片效能評價指標:DMIPS,TOPS

自動駕駛晶片效能評價指標:DMIPS,TOPS

眾所周知,CV演算法會消耗很大一部分自動駕駛晶片的算力,在車上堆攝像頭的同時也需要堆TOPS,那麼視覺處理能力為什麼用TOPS評估呢?通常計算機視覺演算法是基於卷積神經網路的,而卷積神經網路的本質是累積累加演算法(Multiply Accumulate)。

自動駕駛晶片效能評價指標:DMIPS,TOPS

上圖是一個非常生動的卷積過程

MAC

乘積累加運算MAC(Multiply Accumulate)是在數字訊號處理器或一些微處理器中的特殊運算。實現此運算操作的硬體電路單元,被稱為“乘數累加器”。這種運算的操作,是將乘法的乘積結果和累加器 A 的值相加,再存入累加器:

自動駕駛晶片效能評價指標:DMIPS,TOPS

若沒有使用 MAC 指令,上述的程式可能需要二個指令,但 MAC 指令可以使用一個指令完成。而許多運算(例如卷積運算、點積運算、矩陣運算、數字濾波器運算、乃至多項式的求值運算)都可以分解為數個 MAC 指令,因此可以提高上述運算的效率。

MAC矩陣是AI晶片的核心,但這是很成熟的架構,在機器學習大背景下煥發了新春。

自動駕駛晶片效能評價指標:DMIPS,TOPS

上圖為特斯拉自動駕駛晶片架構,佔很大一部分面積的是處理神經網路的NPU。

總體設計相對簡單。每個週期,從SRAM讀取256byte位元組的啟用資料和另外128byte的權重資料到MAC陣列中。每個NPU擁有96x96 MAC,另外在精度方面,乘法為8x8bit,加法為32bit,兩種資料型別的選擇很大程度上取決於他們降功耗的努力(例如32bitFP加法器的功耗大約是32bit整數加法器的9倍)。在2GHz的工作頻率下,每個NPU的算力為36.86TOPS,FSD晶片峰值算力為73.7TOPS。在點積運算之後,資料轉移到啟用硬體,最後寫入快取,以彙總結果。FSD支援許多啟用功能,包括ReLU、SiLU和TanH。每個週期,將128byte的資料寫回SRAM。所有操作同時且連續地進行,重複直到完成整個計算。

自動駕駛晶片效能評價指標:DMIPS,TOPS

在每個週期中,將在整個MAC陣列中廣播輸入資料的底行和權重的最右列。每個單元獨立執行適當的乘法累加運算。在下一個迴圈中,將輸入資料向下推一行,而將權重網格向右推一行。在整個陣列中廣播輸入資料的最底行和權重的最右列,重複此過程。單元繼續獨立執行其操作。全點積卷積結束時,MAC陣列一次向下移動一行96個元素,這也是SIMD單元的吞吐量。

自動駕駛晶片效能評價指標:DMIPS,TOPS

TOPS計算

回到正題,TOPS是MAC在1秒內操作的數,計算公式為:

TOPS = MAC矩陣行 * MAC矩陣列 * 2 * 主頻

每個NPU的為96 * 96 * 2 * 2G = 36.864TOPS

DMIPS

DMIPS是Dhrystone Million Instructions Per Second的縮寫,每秒處理的百萬級的機器語言指令數。

CPU執行指令

程式編譯和執行過程中,程式碼會經過編譯器轉化成機器可以理解的指令。CPU每個指令週期分為取指令、指令譯碼、指令執行三個過程,只有在指令執行時才真正有效,在取指令和指令譯碼時,CPU時間是白白浪費的,而同樣的運算在不同架構不同指令集需要的指令數也不一樣。

自動駕駛晶片效能評價指標:DMIPS,TOPS

除了 Instruction Cycle 這個指令週期,在 CPU 裡面我們還會提到另外兩個常見的 Cycle。一個叫 Machine Cycle,機器週期或者 CPU 週期。CPU 內部的操作速度很快,但是訪問記憶體的速度卻要慢很多。每一條指令都需要從記憶體裡面載入而來,所以我們一般把從記憶體裡面讀取一條指令的最短時間,稱為 CPU 週期。

還有一個是Clock Cycle,也就是時鐘週期以及我們機器的主頻。一個 CPU 週期,通常會由幾個時鐘週期累積起來。一個 CPU 週期的時間,就是這幾個 Clock Cycle 的總和。

對於一個指令週期來說,我們取出一條指令,然後執行它,至少需要兩個 CPU 週期。取出指令至少需要一個 CPU 週期,執行至少也需要一個 CPU 週期,複雜的指令則需要更多的 CPU 週期。

自動駕駛晶片效能評價指標:DMIPS,TOPS

從上圖可以看出,時鐘週期是固定的,但是每個指令執行用時不同,所以需要提高CPU執行效率。

自動駕駛晶片效能評價指標:DMIPS,TOPS

自動駕駛晶片效能評價指標:DMIPS,TOPS

當前提升CPU效能的方法有:流水線技術、流水線冒險/預測、超標量Superscalar、超長指令字設計VLIW、單指令多資料流SIMD等技術(將來慢慢介紹)。尤其是SIMD 技術,是一種“指令級並行”的加速方案,或者說是一種“資料並行”的加速方案。在處理向量計算的情況下,同一個向量的不同維度之間的計算是相互獨立的。而CPU 裡的暫存器,又能放得下多條資料。於是,我們可以一次性取出多條資料,交給 CPU 平行計算。

DMIPS

如前文所言,不同的CPU指令集不同、硬體加速器不同、CPU架構不同,導致不能簡單的用核心數和CPU主頻來評估效能,所以出了一個跑分演算法叫Dhrystone:程式用來測試CPU整數計算效能,其輸出結果為每秒鐘執行Dhrystone的次數,即每秒鐘迭代主迴圈的次數。

Dhrystone所代表的處理器分數比MIPS(million instructions per second 每秒鐘執行的指令數)更有意義,因為在不同的指令系統中,比如RISC(Reduced Instruction Set Computer精簡指令集計算機)系統和CISC(Complex Instruction Set Computer複雜指令集計算機)系統,Dhrystone的得分更能表現其真正效能。

由於在一個高階任務中,RISC可能需要更多的指令,但是其執行的時間可能會比在CISC中的一條指令還要快。由於Dhrystone僅將每秒鐘程式執行次數作為指標,所以可以讓不同的機器用其自身的方式去完成任務。

另一項基於Dhrystone的分數為DMIPS(DhrystoneMIPS),其含義為每秒鐘執行Dhrystone的次數除以1757(這一數值來自於VAX 11/780機器,此機器在名義上為1MIPS機器,它每秒執行Dhrystone次數為1757次)。

分類: 健康
時間: 2022-01-11

相關文章

乙肝相關HCC在研新藥LioCyx-M004,在美獲批IND申請,1b/2期研究

乙肝相關HCC在研新藥LioCyx-M004,在美獲批IND申請,1b/2期研究
LioCyx-M004,是一款由來恩生物醫藥有限公司(Lion TCR)自主研發的在研HCC新藥,在其臨床前研究表明,這些經過修飾的T細胞能夠在靶標識別後裂解HBV感染的HCC細胞.與此同時,Lion ...

乙肝在研新藥EDP-514,即將公佈1b期,800毫克劑量組資料

乙肝在研新藥EDP-514,即將公佈1b期,800毫克劑量組資料
今年最後一個全球性肝病研究年會,即將於下月中旬在美國加利福尼亞州阿納海姆進行,即美國肝病年會(AASLD2021).Enanta Pharmaceuticals公司將帶來兩項與在研乙肝新藥EDP-51 ...

乙肝在研新藥ZM-H1505R,1a期公佈資料,正進行1b期研究中
乙肝病毒(HBV)衣殼抑制劑ZM-H1505R,是我國上海摯盟醫藥科技有限公司自主研發的一款在研乙肝新藥,其 1a期研究結果已經公佈,結果表明,單次口服25至450毫克的ZM-H1505R通常是安全的 ...

NASH在研新藥CRV431,藥物相互作用研究,所有終點均已達到

NASH在研新藥CRV431,藥物相互作用研究,所有終點均已達到
我們對臨床生物醫藥公司(Hepion Pharmaceuticals)正在開發的在研新藥CRV431記憶猶新,雖然,該候選藥物對治療慢性乙肝的臨床試驗一直停滯於1期,卻在治療非酒精性脂肪性肝炎(NAS ...

Nature子刊收錄君聖泰在研新藥臨床資料
來源:健康時報網 (健康時報記者 毛圓圓)著名國際學術期刊<Nature Communications>近期收錄了創新型藥企君聖泰在研口服小分子新藥HTD1801於非酒精性脂肪性肝炎(NA ...

恆瑞醫藥:創新藥吡咯替尼HER2陽性乳腺癌新適應症上市申請獲受理
據"恆瑞醫藥"微信公眾號訊息,近日,恆瑞醫藥自主研發的創新藥馬來酸吡咯替尼片上市許可申請獲國家藥品監督管理局受理,擬定適應症為:吡咯替尼聯合曲妥珠單抗及多西他賽,適用於治療表皮生長 ...

全球乙肝新藥進展(更新至2021年9月)

全球乙肝新藥進展(更新至2021年9月)
編者按:為幫助大家更準確地獲取全球乙肝新藥最前沿資訊,肝霖君結合Hepatitis B Foundation網站9月的乙肝新藥更新以及查詢各大藥企官網更新的產品管線資訊和相關網路資料做了系統地整理,並 ...

我國自主研發的乙肝新藥效果如何?長期服用會產生耐藥性嗎?

我國自主研發的乙肝新藥效果如何?長期服用會產生耐藥性嗎?
我國大概有七千萬乙肝感染者,雖然想盡快撤下這壓在肩上沉重的大山,但是從目前的情況來看,並沒有那麼容易,在這七千萬人中,有28%-42%的人屬於慢性乙肝患者,以後還有可能發展到肝硬化或肝癌,對生命造成非 ...

天境生物(IMAB.US)宣佈旗下在研治療多發性骨髓瘤新藥,已完成3期臨床試驗全部患者入組
智通財經APP獲悉,天境生物(IMAB.US)今天宣佈,其在研新藥CD38抗體菲澤妥單抗聯合來那度胺作為二線療法治療多發性骨髓瘤的3期註冊臨床試驗已完成全部患者入組. 據瞭解,該3期臨床研究資料將支援 ...

乙肝兩家研究藥企,本月中下旬,將更新VTP-300和ENOB-HB-01進展

乙肝兩家研究藥企,本月中下旬,將更新VTP-300和ENOB-HB-01進展
又有兩家國外藥企介紹,即將公佈旗下乙肝在研新藥臨床開發研發進展!它們分別是英國牛津大學衍生公司Vaccitech和在研乙肝新藥VTP-300(一款在研治療性疫苗)和美國臨床前生物製藥公司(Enochi ...

乙肝美肝會前夕,先認識部分新靶點,以及主要作用機理

乙肝美肝會前夕,先認識部分新靶點,以及主要作用機理
距離2021年美肝病年會(AASLD2021)開始還有整整一個月,最近,我們已經可以看到許多新機制在研新藥更新臨床開發進展,總體上,這些研究進展和試驗資料還是比較令人欣慰和鼓舞的. 乙肝美肝會前夕,先 ...

行研|核酸藥物-——行業背景(一)

行研|核酸藥物-——行業背景(一)
近年來,核酸藥物獲批上市的速度呈加速趨勢,多款有潛力成為重磅的核酸藥物公佈了臨床資料,覆蓋了心臟與代謝性疾病.肝臟疾病以及多種罕見病等領域.核酸藥物引發了較多的關注,有望成為繼小分子化藥和抗體藥物後的 ...

中國電信自研大資料和AI應用亮相世界網際網路大會

中國電信自研大資料和AI應用亮相世界網際網路大會
2021年9月25日,世界網際網路大會"網際網路之光"博覽會在浙江烏鎮正式開幕.中國電信自主研發的政法公安大資料中腦.天翼應急智慧監控平臺.智慧文旅景區監控平臺.景區影片智慧分析與 ...

乙肝CRISPR/Cas9,提供多個基因敲除,解決異質靶點及逃避突變體

乙肝CRISPR/Cas9,提供多個基因敲除,解決異質靶點及逃避突變體
乙肝病毒慢性感染全球超過2.4億人,可導致慢性肝炎.LC和HCC.最近一年來,CRISPR/Cas9技術被科學家提及,有望成為直接破壞HBV基因組的一種新療法.由於HBV基因組序列的高度多樣化,異質患 ...

賽諾菲糖尿病創新藥上市申請獲受理
原標題:賽諾菲糖尿病創新藥上市申請獲受理 日前,賽諾菲中國在上海宣佈,國家藥品監督管理局已正式受理該公司基礎胰島素與胰高糖素樣肽-1受體激動劑(GLP-1RA)的固定比例複方製劑SOLIQUA(iGl ...

醫藥行業深度研究:ADC藥物,偶聯時代,創新致遠

醫藥行業深度研究:ADC藥物,偶聯時代,創新致遠
(報告出品方/作者:中信建投證券,賀菊穎.袁清慧.陽明春) 1 ADC藥物:精準制導 + 強效彈頭,佔領靶向藥研發制高點 特異性單抗 + 強效細胞毒藥物,優勢互補協同治療 抗體偶聯藥物(Antibod ...

深扒三代EGFR-TKI二線治療NSCLC那些事兒

深扒三代EGFR-TKI二線治療NSCLC那些事兒
前言 表皮生長因子受體 (EGFR) 酪氨酸激酶抑制劑 (TKI)主要應用於攜帶EGFR敏感突變的非小細胞肺癌(NSCLC)的綜合治療,目前已有一代.二代.三代EGFR-TKI,針對耐藥突變.罕見突變 ...

2021CSCO|打破歐美國家壟斷,讓更多的國產抗腫瘤藥造福中國腫瘤患者
融媒體記者 王麗娜 眾所周知,藥物創新是腫瘤治療進步的"靈魂",提到藥物創新有一個藥物是繞不開的,就是被稱作"中國抗腫瘤藥物兩彈一星"的凱美納(埃克替尼),這是 ...

免疫檢查點藥物和小分子抗血管藥物的發展為小細胞肺癌治療帶來新格局

免疫檢查點藥物和小分子抗血管藥物的發展為小細胞肺癌治療帶來新格局
作者:吉林省腫瘤醫院 程穎教授 小細胞肺癌是一種難治的頑固性腫瘤,過去40年來EP.EC方案一直是廣泛期小細胞肺癌的標準治療選擇,然而中位的生存只有8-10個月,近年來免疫治療的發展讓廣泛期小細胞肺癌 ...

京東“攪局”餐飲圈:網際網路思維如何殺入供應鏈?

京東“攪局”餐飲圈:網際網路思維如何殺入供應鏈?
連鎖化大浪潮之下,第三方供應鏈正在重構餐飲市場. 總第 2833 期 餐企老闆內參 羅欣 | 文 京東跨界餐飲 聯姻隱形餐飲大佬"美心" 餐飲市場,成了網際網路大佬們的必爭之地.其 ...