sponsored links

關於衡量AI算力的“FLOPS”

【什麼是FLOPS】

FLOPS,是“每秒所執行的浮點運算次數”(floating-point operations per second) 的縮寫。它常被用來估算電腦的執行效能,尤其是在使用到大量浮點運算的科學計算領域中。

在這裡所謂的“浮點運算”,實際上含括了所有涉及小數的運算。這類運算在某類應用軟體中常常出現,而它們也較整數運算花時間。現今大部分的處理器中,都有一個專門用來處理浮點運算的“浮點單元”(FPU)。也因此 FLOPS 所量測的,實際上就是 FPU 的執行速度。對於處理器處理浮點運算來說,而最常用來測量 FLOPS 的基準程式 (benchmark) 之一,就是 Linpack。

例如:算能公司的“基於SOPHON第三代智算晶片 BM1684”晶片。該款晶片FP32 精度算力也達到 2.2 TFlops,INT8算力可高達17.6Tops,在Winograd卷積加速下,INT8算力更提升至35.2Tops,是一顆低功耗、高效能的SoC晶片。
BM1684還內建了張量計算模組TPU,該TPU模組包含64個NPU運算單元,每個NPU包括16個EU單元,總共有1024個EU運算單元。

關於衡量AI算力的“FLOPS”

1TFlops=1024GFlowps,即1T=1024G。

各種FLOPS的含義:

1) 一個MFLOPS(megaFLOPS)等於每秒1百萬(=10^6)次的浮點運算;

2) 一個GFLOPS(gigaFLOPS)等於每秒10億(=10^9)次的浮點運算;

3) 一個TFLOPS(teraFLOPS)等於每秒1萬億(=10^12)次的浮點運算;

4) 一個PFLOPS(petaFLOPS)等於每秒1千億(=10^15)次的浮點運算。

【關於 Linpack】

Linpack是國際上使用最廣泛的測試高效能計算機系統浮點效能的基準測試。透過對高效能計算機採用高斯消元法求解一元 N次稠密線性代數方程組的測試,評價高效能計算機的浮點計算效能。Linpack的結果按每秒浮點運算次數(flops)表示。

很多人把用 Linpack基準測試出的最高效能指標作為衡量機器效能的標準之一。這個數字可以作為對系統峰值效能的一個修正。透過測試求解不同問題規模的實際得分,我們可以得到達到最佳效能的問題規模,而這些數字與理論峰值效能一起列在 TOP500列表中。

Linpack 測試包括三類,Linpack100、Linpack1000和HPL。Linpack100求解規模為100階的稠密線性代數方程組,它只允許採用編譯 最佳化選項進行最佳化,不得更改程式碼,甚至程式碼中的註釋也不得修改。Linpack1000要求求解1000階的線性代數方程組,達到指定的精度要求,可以在 不改變計算量的前提下做演算法和程式碼上做最佳化。HPL即High Performance Linpack,也叫高度平行計算基準測試,它對陣列大小N沒有限制,求解問題的規模可以改變,除基本演算法(計算量)不可改變外,可以採用其它任何最佳化方 法。前兩種測試執行規模較小,已不是很適合現代計算機的發展。

HPL是針對現代平行計算機提出的測試方式。使用者在不修改任意測試程式的基礎上,可 以調節問題規模大小(矩陣大小)、使用CPU數目、使用各種最佳化方法等等來執行該測試程式,以獲取最佳的效能。HPL採用高斯消元法求解線性方程組。求解 問題規模為N時,浮點運算次數為(2/3 * N^3-2*N^2)。因此,只要給出問題規模N,測得系統計算時間T,峰值=計算量(2/3 * N^3-2*N^2)/計算時間T,測試結果以浮點運算每秒(Flops)給出。HPL測試結果是TOP500排名的重要依據。

計算機計算峰值簡介:衡量計算機效能的一個重要指標就是計算峰值或者浮點計算峰值,它是指計算機每秒鐘能完成的浮點計算最大次數。包括理論浮點峰值和實測浮點峰值。理論浮點峰值是該計算機理論上能達到的每秒鐘能完成浮點 計算最大次數,它主要是由 CPU的主頻決定的。計算公式如下: 、理論浮點峰值=CPU主頻×CPU每個時鐘週期執行浮點運算次數×CPU數量。

【AI算力評估為什麼不用LINPACK】

傳統的高效能計算機評測方法和體系與當前人工智慧需求的效能並不完全一致。例如,LINPACK是一個目前被廣泛採用的高效能計算機雙精度浮點運算效能基準評測程式,國際超算Top 500榜單依據LINPACK值來進行排名,而典型的人工智慧 應用並不需要雙精度浮點數運算。大部分人工智慧訓練任務以單精度浮點數或半精度浮點數為主,推理以Int8為主。

對大規模人工智慧算力來說,制定一個簡單有效的指標和測試方法並不是一件容易的事情。首先,大部分單個人工智慧訓練任務(例如訓練一個推薦系統或者影象分類的神經網路模型)達不到全機上百張加速器卡規模的計算需求。很多人工智慧應用,即使使用全機規模,其訓練時間和準確率也可能沒有改進。其次,如果要測試規模變化的人工智慧叢集計算機,測試程式必須能夠規模可變。首先必須明確,什麼樣的主流人工智慧應用是規模可以任意調整的。最後,準確率的判定和計算是大規模人工智慧算力評測與傳統高效能計算基準評測之間的一個顯著區別。是否需要使殘差小於給定標準,是否要將準確度計入分數統計,同樣是需要明確的問題。

目前,各大企業、高校和相關組織在人工智慧效能基準測試領域已經有了很多探索,相繼開發了各類基準評測程式,比如谷歌等公司主導的MLPerf,小米公司的MobileAI bench,百度公司的DeepBench,中國人工智慧產業發展聯盟的AIIA DNN Benchmark,以及在雙精度的LINPACK基礎上改成混合精度的HPL-AI等。但是這些基準測試方案都不能很好地解決上述問題。根據MLPerf公開發表的資料,MLPerf程式在百張TPU加速卡以上規模測試下擴充套件性就會出現下滑,在千張TPU加速卡級別到達評測體系的擴充套件性瓶頸,該評測程式很難評價不同系統在該規模下人工智慧算力的差異。

關於衡量AI算力的“FLOPS”

MLPerf是一套衡量機器學習系統性能的權威標準,於2018年由谷歌、哈佛、斯坦福、百度等機構聯合發起成立,每年定期公佈榜單成績,它將在標準目標下訓練或推理機器學習模型的時間,作為一套系統性能的測量標準。MLPerf訓練任務包括影象分類(ResNet50)、目標物體檢測(SSD)、目標物體檢測(Mask R-CNN)、智慧推薦(DLRM)、自然語言處理(BERT)以及強化機器學習(Minigo)等。最新的1.0版本增加了兩項新的測試專案:語音識別(RNN-T)和醫學影像分割(U-Net3D)。

在Resnet50訓練中,硬體及裝置平臺的選取至關重要。其中磁碟讀取效能、CPU運算效能、記憶體到視訊記憶體的傳輸效能以及GPU運算效能對訓練速度的影響都比較大:磁碟讀取效能直接決定訓練資料供給的速度;CPU的效能、CPU到GPU的傳輸頻寬以及GPU的效能共同決定了資料前處理的速度;而訓練中的前向推理和反向傳播由GPU的效能及GPU之間的資料傳輸頻寬決定。如同工廠流水線上的幾名工人,任何一名工人的處理速度跟不上就會導致堆積,成為效能瓶頸,影響最終結果。因此這幾個重要部分不能有明顯的短板。

此時就會用Resnet50模型進行圖片分揀,得出每秒處理圖片數量作為一個性能指標。

關於衡量AI算力的“FLOPS”

【經典晶片的算力】

以下列出幾個有代表性硬體的每秒浮點運算次數

GFLOPS

  • Intel Xeon 3.6 GHz: <1.8 GFLOPS
  • Intel Pentium 4 HT 3.6Ghz: 7 GFLOPS
  • Intel Core 2 Duo E4300 14 GFLOPS
  • Intel Core 2 Duo E8400 24 GFLOPS
  • AMD Phenom 9950: 29.05 GFLOPS
  • Intel Core 2 Quad Q8200: 37 GFLOPS
  • Intel Core 2 QX9770: 39.63 GFLOPS
  • AMD Phenom II x4 955: 42.13 GFlopS
  • Intel Core i7-965: 69.23 GFLOPS
  • Intel Core i7-980 XE : 107.6 GFLOPS
  • Intel Core i5-2500K @4.5GHz: 123.35 GFLOPS (w/AVX instruction set)
  • IBM POWER7: 264.96GFLOPS[2]
  • nVIDIA Geforce 8800 Ultra(G80-450 GPU):393.6 GFLOPS
  • nVIDIA Geforce GTX 280(G200-300 GPU):720 GFLOPS
  • AMD Radeon HD 3870(RV670 GPU):497 GFLOPS
  • AMD Radeon HD 4870(RV770 GPU):1008 GFlops

TFLOPS

  • nVIDIA Geforce GTX 580(GF110-375 GPU):2.37 TFLOPS
  • AMD Radeon HD 6990(R900 GPU):4.98 TFLOPS
  • nVIDA Geforce GTX 1070: 6.5 TFLOPS
  • nVIDA Geforce GTX 1080: 9 TFLOPS
  • nVIDA Geforce GTX 1080Ti: 10.8 TFLOPS
  • nIVIDIA Titan Xp : 12.1 TFLOPS
  • ASCI White:12.3TFLOPS
  • AMD Vega Frontier Edition : 13.1 TFLOPS
  • Earth Simulator: 35.61 TFLOPS
  • Blue Gene/L: 135.5 TFLOPS
  • 中國曙光Dawning 5000A: 230 TFLOPS

PFLOPS

  • IBM Roadrunner:1.026 PFLOPS
  • Jaguar:1.75 PFLOPS
  • 天河一號:2.566 PFLOPS
  • Folding@home運算平臺:4.769 PFLOPS
  • BOINC運算平臺:6.282 PFLOPS (持續增加中)
  • IBM Mira: 8.16 PFLOPS
  • 京:10.51 PFLOPS
  • IBM Sequoia:16.32 PFLOPS
  • Cray Titan:17.59 PFLOPS
  • 天河二號:33.86PFLOPS
  • 神威·太湖之光:125PFLOPS
分類: 娛樂
時間: 2021-12-28

相關文章

太瘦土氣大方臉,年輕時很一般,老了卻變帥的8位男星,不服不行

太瘦土氣大方臉,年輕時很一般,老了卻變帥的8位男星,不服不行
近年來,很多年輕時長得不錯的男明星到了中年後,都被說油膩. 大部分人,到了中年,容易發福,氣質也會變得平庸. 中年演員也不例外. 這讓很多觀眾痛心疾首,覺得心中的白月光變了味. 但其實娛樂圈裡不乏越老 ...

女明星年輕時的顏值,孫儷不輸蔣勤勤,劉雪華像真人洋娃娃

女明星年輕時的顏值,孫儷不輸蔣勤勤,劉雪華像真人洋娃娃
在那個沒有PS年代,長得好看是真的了不起,不像現在的有些女明星,一天一個樣.無意間翻到幾位知名女明星年輕時的照片,個個美得靚麗,孫儷不輸蔣勤勤,劉雪華驚到我了. 第一位 蔣勤勤 1975年出生的蔣勤勤 ...

被叫大媽的她們,年輕時個個是絕色

被叫大媽的她們,年輕時個個是絕色
曲阿英你們還記得嗎? 就是電視劇<喬家兒女>中,為了房產證陪著喬家老爹喬祖望走過人生最後一段時光的保姆. 最近,羊刷到曲阿英扮演者王瀾年輕時候的照片. 天哪,這是財閥千金照進現實了吧?簡直 ...

年輕時一般,年紀大了卻越來越帥,這5位男星,贏在了人生下半場

年輕時一般,年紀大了卻越來越帥,這5位男星,贏在了人生下半場
都說,男人越老越帥,到了四十還是一枝花,但事實卻是-中年發福.油膩.身材變形. 當然,也有一部分人屬於越老越帥,他們年輕時看起來一般,年紀大了卻越來越有魅力,氣質沉澱下來之後,反而比年輕時更吸引人. ...

這12位香港老牌女星,年輕時個個是女神,50歲後“面目全非”

這12位香港老牌女星,年輕時個個是女神,50歲後“面目全非”
八九十年代的港圈最不缺的就是大美人,除了名聲在外的李嘉欣林青霞關之琳,李麗珍李綺紅袁潔瑩的顏值放到現在也能"稱霸"娛樂圈. 不過隨著年紀的增長,不是每一個女神都能延續自己的美貌.比 ...

14位香港老牌男神,年輕時個個是大帥哥,40歲後顏值大跌

14位香港老牌男神,年輕時個個是大帥哥,40歲後顏值大跌
前段時間不少人被謝霆鋒,劉德華,苗僑偉,黃宗澤和吳卓羲等人的狀態驚訝到,這群年過40歲,甚至接近60歲的香港男星比女明星還要"凍齡". 但其實不是所有香港男星都保養得這麼好,比如這 ...

原來“容嬤嬤”年輕時是校花,看到照片比趙薇都美

原來“容嬤嬤”年輕時是校花,看到照片比趙薇都美
娛樂圈美女眾多,畢竟這個行業很多情況下都會因相貌影響戲路,所以娛樂圈充斥了不少俊男靚女. 在大部分人眼中,偶像藝人大多光鮮亮麗,而實力派老藝人卻並不注重顏值,大多憑藉出眾演技贏得認可,但很多觀眾不知道 ...

70歲的陳奶奶:年輕時拋夫棄子;三婚後過得生不如死,卻無人同情
1 陳奶奶是我老公他們一個村的.論輩分,我們還管她叫二媽,住的不遠.如今陳奶奶70歲了,對於大多數這個年紀的老人來說本是安享晚年的時候:就是再不濟的老人,也頂多是自給自足:不用受氣,也生活自由自在.而 ...

王菲年輕時可真美,怎麼時髦怎麼來,膚白腿長真吸睛

王菲年輕時可真美,怎麼時髦怎麼來,膚白腿長真吸睛
大家好,歡迎來到我的快樂搭配頻道 導語 每一個女人都時刻提醒自己,不要活成自己最討厭的那種人,但是卻不知道應該成為什麼樣的人.我想一個女人的理想狀態應該是歌詞中說的那樣"原諒我這一生放縱不羈 ...

英女王年輕時沒有妹妹漂亮,50年後容貌卻翻轉,相由心生自律為王

英女王年輕時沒有妹妹漂亮,50年後容貌卻翻轉,相由心生自律為王
伊麗莎白二世,素來以優雅.沉穩.包容著稱.這是她一生被戴上的標籤,也是她一生追求的人生境界. 有人說相由心生,從老女王的臉上,我們似乎真的看出了這種越活越包容的心態. 年輕的時候,她的容貌不是特別出眾 ...

歐洲王室公主們穿媽媽年輕時的衣服,媽媽的衣櫥裡有太多寶藏單品

歐洲王室公主們穿媽媽年輕時的衣服,媽媽的衣櫥裡有太多寶藏單品
很多人小時候都有從媽媽衣櫥中偷穿衣服的經歷.小時候的我們渴望長大,像媽媽一樣,穿高跟鞋和化妝. 時尚在不停輪迴,時下的潮流無一例外,與過去有著驚人的相似.很多二十幾年前流行過的單品到現在可能又重新流行 ...

韓國女人瘦到皮包骨頭,生活無法自理,年輕時卻是大美人

韓國女人瘦到皮包骨頭,生活無法自理,年輕時卻是大美人
這個56歲的韓國女人身高近1米7,體重卻只有31公斤.渾身瘦到肋骨清晰可見,腿只有正常人胳膊般粗. 因為過瘦導致生活不能自理,連說話都是有氣無力,只能終日躺在床上,平日裡都是由自己8歲的小孫女照顧. ...

九位一線明星年輕時顏值有多高?個個可以靠臉吃飯

九位一線明星年輕時顏值有多高?個個可以靠臉吃飯
第九位 劉亦菲 這麼多年來,雖然新人層出不窮,但劉亦菲一直都是不可替代的頂流,她年輕時的顏值更是沉魚落雁閉月羞花. 劉亦菲的身世背景挺複雜的.她祖籍中國河北饒陽,1987年出生於湖北武漢.她的父親安少 ...

鬥羅:比比東年輕時長得“賊”像小舞,為何千仞雪卻體現不出來呢

鬥羅:比比東年輕時長得“賊”像小舞,為何千仞雪卻體現不出來呢
在<斗羅大陸>動漫裡面比比東是漫迷們很欣賞的角色之一,既然是那麼多人喜歡她的話,那很顯然紳士們都是崇拜她的天賦,而普通人卻只是喜歡她的高顏值.只不過在最新的劇情裡面我們看到了比比東年輕時候 ...

年輕時沒流的汗 最終會變成眼淚流出來 | 小林漫畫

年輕時沒流的汗 最終會變成眼淚流出來 | 小林漫畫
#專題·小林漫畫精品選賞# 來源:小林漫畫 作者:林帝浣 年輕時沒流的汗 最終會變成眼淚流出來 年假為何總過得飛快 因為每天都沒有上午 #美友藝術# #美友風情#

&quot;容嬤嬤&quot;年輕時是校花?以為開玩笑,照片曝光捲髮和大眼睛像混血

&quot;容嬤嬤&quot;年輕時是校花?以為開玩笑,照片曝光捲髮和大眼睛像混血
現在的影視劇發展都是一些粗製濫造,要麼是抗戰劇,要麼是中年女演員演少女,讓人越來越懷念自己以前沒有看過的電視劇.以前的拍攝資訊科技企業雖然經濟不發達,但是我們非常重要經典.比如<西遊記> ...

《關於我媽的一切》熱映中,飾青年季佩珍的演員梁寶羚神似年輕時的徐帆

《關於我媽的一切》熱映中,飾青年季佩珍的演員梁寶羚神似年輕時的徐帆
<關於我媽的一切>熱映中,飾青年季佩珍的演員梁寶羚神似年輕時的徐帆 由趙天宇執導,徐帆.張婧儀.許亞軍等主演,梁寶羚參演的電影<關於我媽的一切>已於9月19日正式上映,該片講述 ...

英國新研究:年輕時戒菸酒的人,血管更好
來源:生命時報 隨著年齡增長,我們的動脈會變得硬化,大大增加罹患心臟病和中風的風險.與此同時,某些行為還會加速動脈硬化.研究表明,吸菸飲酒與青少年動脈硬化之間有密切聯絡. 英國倫敦大學醫學院研究小組納 ...

這3位老戲骨,帥了一輩子,年輕時俊秀而不娘,老了氣質出眾

這3位老戲骨,帥了一輩子,年輕時俊秀而不娘,老了氣質出眾
娛樂圈從不缺帥哥美女,但"花期"長短不一,有的演員年輕時驚為天人,短短几年就發福顏垮走上了實力派路線.比如曾經的軍藝校草洪劍濤,最初出現在觀眾視線中是個唇紅齒白的清秀小哥哥,30多 ...

這些明星年輕時很帥,顏值超高,最大者已85歲,不知道你記得幾個

這些明星年輕時很帥,顏值超高,最大者已85歲,不知道你記得幾個
前段時間,娛樂圈突颳了起"鮮肉娘炮風",好多男星都燙著奇怪的髮型,戴著耳環,一個個整得跟"小姐姐相似",不過好在有關部門下達了整改政策,如今這些怪象已成過去.其 ...