sponsored links

AI 訓練的效率正在超越摩爾定律

AI 訓練的效率正在超越摩爾定律

僅僅在幾年前,訓練一個 AI 模型所需的時間還可能長達數週之久。

這也是過去幾年間,計算行業間湧現了眾多價值數十億美元的創新初創公司的重要原因所在——這些公司包括了 Cerebras Systems、Graphcore、Habana Labs 和 SambaNova Systems 等等。此外,谷歌、英特爾、英偉達和其他老牌公司也在企業內部投入了規模相當的鉅額資金(有時還會發起收購計劃)來探索這一領域。最新版本的 MLPerf 訓練基準結果表明,這筆錢是物有所值的。

MLPerf 母公司 MLCommons 的執行董事 David Kanter 表示,自 MLPerf 基準測試開始上線以來,人工智慧訓練效能的提升速度“成功地大大超過了摩爾定律”

在早期版本的 MLPerf 基準測試最佳結果與 2021 年 6 月之後的基準測試最佳結果之間,電晶體密度的增長可以解釋其中一倍多的差異。但是軟體以及處理器和計算機架構的改進則貢獻了 6.8-11 倍的成績增長。在最新的 1.1 版測試中,最佳結果是 6 月份最佳成績的 2.3 倍。

根據英偉達的說法,使用 A100 GPU 的系統的效能相比 18 個月前的系統提高了 5 倍以上,相比三年前 MLPerf 基準測試成績首次釋出時的結果提高了 20 倍。

微軟首次將其 Azure 雲 AI 產品引入了 MLPerf,使用各種資源在所有八個測試網路中取得了極佳的成績。它們的規模從 2 個 AMD Epyc CPU 和 8 個英偉達 A100 GPU,直到 512 個 CPU 和 2048 個 GPU 不等。規模顯然很重要。頂級規格的系統在不到一分鐘的時間內就訓練完了 AI 模型,而二八組合通常需要 20 分鐘或更長時間。

AI 訓練的效率正在超越摩爾定律

“摩爾定律只能做到這麼多。軟體和其他進步在 AI 訓練的進化道路上發揮了重要作用。”

——MLCommons

英偉達在基準測試中與微軟密切合作。並且就像之前的 MLPerf 列表中人們看到的一樣,英偉達 GPU 是大多數參賽作品背後的 AI 加速器。包括戴爾、浪潮和 Supermicro 的作品都採用了他們的 GPU。

英偉達憑藉其 Selene AI 超級計算機無與倫比的規模,在商用系統的所有結果中名列前茅。Selene 由商用的模組化 DGX SuperPod 系統組成。在最大規模的測試中,Selene 使用 1080 個 AMD Epyc CPU 和 4320 個 A100GPU 在不到 16 秒的時間內就訓練完了自然語言處理器 BERT,大多數小型系統完成同樣的壯舉需要花費大約 20 分鐘。

根據英偉達的說法,使用 A100 GPU 的系統的效能相比 18 個月前的行業水平提高了 5 倍以上,相比三年前首次 MLPerf 基準測試結果釋出時提高了 20 倍。該公司表示,這要歸功於軟體創新和網路的改進成果。(有關更多資訊,請參閱英偉達的部落格)

鑑於英偉達在這些 AI 基準測試中的統治力和成績表現,新生的競爭對手很自然地會將自身與它進行比較。這就是總部位於英國的 Graphcore 正在做的事情,它指出他們研發的基本計算單元 Pod16(1 個 CPU 和 16 個 IPU 加速器)比英偉達的基本單元 DGX A100(2 個 CPU 和 8 個 GPU)快了近一分鐘。

AI 訓練的效率正在超越摩爾定律

Graphcore 推出了更大的系統

對於這一版本的 MLPerf,Graphcore 使用其基本單元 Pod64、Pod128 和(你肯定猜得到吧?)Pod256 的組合參加了影象分類和自然語言處理基準測試。Pod256 由 32 個 CPU 和 256 個 IPU 組成,是僅次於英偉達的 Selene 和英特爾的 Habana Gaudi 的第四快系統,以 3:48 完成了 ResNet 影象分類訓練。在自然語言處理方面,Pod256 和 Pod128 在榜單上排名第三和第四,再次落後於 Selene,分別以 6:54 和 10:36 結束。(有關更多資訊,請參閱 Graphcore 的部落格)

你可能已經注意到了,基於英偉達的產品(大約 1 比 4)和 Graphcore 的系統(低至 1 比 32)對比,它們的 CPU 與加速器晶片的比率有很大不同。Graphcore 工程師說,這是設計理念使然。IPU 旨在讓神經網路減少對 CPU 控制的依賴。

你會在 Habana Labs 系統上看到相反的情況,英特爾在 2019 年以大約 20 億美元的價格收購了它。例如,它在影象分類方面取得了很高的排名,為此英特爾使用 64 個 Xeon CPU 和 128 個 Habana Gaudi 加速器在不到 5 分半的時間內訓練完了 ResNet。它還使用 32 個 CPU 和 64 個加速器,用時 11 分 52 秒訓練完了 BERT 自然語言神經網路。(更多資訊請參閱 Habana 的部落格 )

谷歌對這批基準分數的貢獻有點不一樣。谷歌工程師沒有使用該公司的 TPU v4 處理器技術搭載在商業或雲系統上完成測試,而是提交了兩個超大自然語言處理神經網路的結果。

該公司使用其公開可用的 TPU v4 雲運行了一個版本的 Lingvo,這是一種 NLP,其引數高達 4800 億,而 BERT 的引數為 1.1 億。雲平臺使用 1024 個 AMD Epyc CPU 和 2048 個 TPU,在不到 20 小時的時間內完成了訓練任務。使用由 512 個 AMD Rome CPU 和 1024 個 TPU 組成的研究系統,谷歌在 13.5 小時內訓練了一個 2000 億引數版本的 Lingvo。(谷歌報告稱,從頭到尾完成整個過程需要 55 小時和 44 小時,包括開始訓練所需的步驟。)

在結構上,Lingvo 與 BERT 非常相似,可以歸入該類別,但它也類似於眾多計算巨頭一直在研究的其他真正巨型的對話 AI,例如 LaMDA 和 GPT-3。谷歌認為,巨大模型訓練最終應該成為未來 MLPerf 商業基準測試的一部分。(有關更多資訊,請參閱谷歌的部落格。)

然而,MLCommons 的 Kanter 指出,訓練此類系統的費用高到了足以將許多參與者排除在外。

原文連結:https://spectrum.ieee.org/ai-training-mlperf

分類: 娛樂
時間: 2022-02-18

相關文章

黑色系暴漲、鋼廠漲300、現貨漲210、月底鋼材價格還要漲?

黑色系暴漲、鋼廠漲300、現貨漲210、月底鋼材價格還要漲?
中秋節後首日,大宗商品期貨價格漲勢如虹,黑色系全面暴漲,焦炭焦煤期貨大幅拉漲,焦煤漲近9%,焦炭漲超6%,帶動鋼廠期貨向上突破,鐵礦石漲幅近4%,快速反彈後暫時在700元下方休整,螺紋鋼及熱卷期貨則雙 ...

外媒精選iPhone 12系列40+黑色系桌布

外媒精選iPhone 12系列40+黑色系桌布
AMOLED(英語:Active-matrix organic light-emitting diode,中譯:有源矩陣有機發光二極體或主動矩陣有機發光二極體)是一種顯示屏技術.其中OLED(有機發光 ...

膚色不夠白的女人,穿衣儘量避開這些顏色,顯黑不說還拉低檔次

膚色不夠白的女人,穿衣儘量避開這些顏色,顯黑不說還拉低檔次
俗話說得好啊:"一白遮三醜,一黑毀所有." 不管是男生還是女生,如果面板比較白的話,那麼確實看起來會比較的乾淨.只要長相不是那麼看不懂,那麼一般來說顏值都是差不多的. 白一些的女生 ...

這種烏漆嘛黑又很酷的風格你敢裝修嗎?

這種烏漆嘛黑又很酷的風格你敢裝修嗎?
如果色彩有段位 黑色 必將是那一個讓你臉紅心跳的存在. 很多年輕人在裝修的時候都想要嘗試一下暗黑系的設計,也就是室內大面積的運用深色的設計,放棄以往清新亮麗的顏色,不過在實際裝修的時候都因為擔心採光不 ...

紅、黃、藍、黑,4種彩色多肉,你喜歡哪一款?

紅、黃、藍、黑,4種彩色多肉,你喜歡哪一款?
肉肉的品種有很多,五顏六色放在一起才好看,今天妖妖就按照色系來介紹品種,組盆黨趕緊看過來: 紅色系 火祭:光照好的話就是999色號啊,特別豔麗的紅色,如果光照不好···那就只能是綠色了. 紅寶石:紅寶 ...

85花黑色系穿搭造型,趙麗穎可愛俏皮,楊穎時尚知性,楊冪超另類

85花黑色系穿搭造型,趙麗穎可愛俏皮,楊穎時尚知性,楊冪超另類
85花黑色系穿搭造型,趙麗穎可愛俏皮,楊穎時尚知性,楊冪超另類! 對於85花四大花旦相信大家都不陌生,趙麗穎,楊冪,Angelababy和倪妮四人目前在娛樂圈中發展的都很不錯,是大眾們公認的女神,關注 ...

經典黑白灰,裝修中的極簡法則,一眼入心,永不過時

經典黑白灰,裝修中的極簡法則,一眼入心,永不過時
經典黑白灰,裝修中的極簡法則,一眼入心,永不過時. 如果你要問什麼顏色搭配永遠不會過時,那肯定是黑白灰. 如果你想知道什麼顏色最經典,那一定是黑白灰. 無論時間過多久,它都是永恆的設計美學,也是裝修設 ...

劉愷威穿黑西裝亮相!臉胖一圈沒了霸總範,世紀同框魏大勳不尷尬

劉愷威穿黑西裝亮相!臉胖一圈沒了霸總範,世紀同框魏大勳不尷尬
9月21號是一年一度的中秋佳節,今年各大衛視也是紛紛使出全力,從舞臺到邀請的嘉賓都非常讓人驚喜. 尤其是由中央六頻道主辦的首屆大灣區晚會,更是群星璀璨,匯聚了香港大陸多位流量跟實力派歌手,並且還創造了 ...

這婚算是離對了!佟麗婭機場造型好酷,墨鏡吊帶黑指甲冷豔感絕了

這婚算是離對了!佟麗婭機場造型好酷,墨鏡吊帶黑指甲冷豔感絕了
不得不說,有些女明星離婚以後,彷彿打開了任督二脈,不僅精神氣質提上來了,就連衣品也是蹭蹭直漲,果然女人只有取悅自己才能活出精彩感.說到這,不禁被佟麗婭這次的造型美到了,這還是那個靦腆內斂的文靜乖乖女嘛 ...

什麼是黑羊脂,不是所有黑都能稱之為黑羊脂

什麼是黑羊脂,不是所有黑都能稱之為黑羊脂
前面給各位寶寶大概講了一下白玉.碧玉.青玉等等玉種,這些玉種相比黑羊脂來說還算是比較好區分的,單純的從顏色上來區分就很簡單,是什麼顏色的玉就是什麼玉種了,但黑羊脂的特指咱們新疆庫爾塔什干的黑青玉,眾所 ...

51歲的李嘉欣胖不少,穿黑裙配西裝外套包裹嚴實,掩不住貴婦氣質

51歲的李嘉欣胖不少,穿黑裙配西裝外套包裹嚴實,掩不住貴婦氣質
大美人李嘉欣,嫁入豪門以後,生活上也變得更加順風順水起來.即便是到了51歲的年紀,依然是優雅大氣的貴婦模樣.活動上的她,穿著優雅得體,氣質高貴絕塵,肌膚緊緻細膩,怎麼看都不像是年過半百的人.細膩的肌膚 ...

45歲的陳坤顏值不減當年,穿黑西裝還像"公子哥",一點都不見老

45歲的陳坤顏值不減當年,穿黑西裝還像"公子哥",一點都不見老
#時尚在身邊##今天穿什麼# 在服裝的色彩中,黑色一直被公認為"最百搭的色彩",似乎不管是男生還是女生,不管是年紀大還是年紀小,都能將它駕馭的很好,穿搭上帶著優雅與高階感,還顯得很 ...

真正見過世面的女人,穿襯衫很少配西裝褲,看陳數就知道了

真正見過世面的女人,穿襯衫很少配西裝褲,看陳數就知道了
襯衫大概是一年四季都很常見且場合適應性很厲害的單品了,所以對於不少有氣質的女性而言,襯衫就是自己搭配時的第一選擇,在絕大部分女性的穿搭認知裡,襯衫的最佳搭配是西裝褲,這樣的組合不僅百搭而且十分適合很多 ...

趙麗穎又“嫩”回來了,穿露臍t搭綠色開衫超甜,少女感十足

趙麗穎又“嫩”回來了,穿露臍t搭綠色開衫超甜,少女感十足
趙麗穎自從生完孩子以及離婚之後,不再像當初一般古靈精怪了,反而整個人的氣質變得溫婉和煦了許多,這次參加的綜藝活動中,身穿露臍T恤搭配綠色開衫,竟然看起來少女感十足,反而像是又"嫩" ...

39歲車曉氣質不俗,穿深灰色抹胸裙配利落盤發,一點不顯老氣

39歲車曉氣質不俗,穿深灰色抹胸裙配利落盤發,一點不顯老氣
氣質與談吐,展現的是一個人的內在修養.越是飽讀詩書的人,氣質越是內斂高貴.那種不爭不搶的氣質,不露與表的雅緻,會給人一種心曠神怡的美好,相處起來也覺得特別的舒服,不會給人一種距離感. 與自身的氣質的修 ...

並不是所有人都適合黑色!你是什麼氣質,就穿什麼顏色,別亂穿

並不是所有人都適合黑色!你是什麼氣質,就穿什麼顏色,別亂穿
hello姐妹們,我是丸紙,每天與你分享一些可以快速變美的小技巧~ 你平時都如何選擇自己衣服的顏色? 個人喜好?是否顯瘦?流行趨勢?還是,是否顯白? 在現實生活中,我們大多數人在面對不同顏色的衣服時, ...

被楊紫媽媽驚豔到了,穿印花長裙顯貴婦範,美貌度絲毫不輸親女兒

被楊紫媽媽驚豔到了,穿印花長裙顯貴婦範,美貌度絲毫不輸親女兒
印花長裙風格頗多,不少時尚lady在日常出門的時候都喜歡透過它來打造溫柔優雅的風格,但印花裙的款式千千萬,如果你拿捏的不好,就容易穿出老氣的感覺,對這方面不夠敏感的話,何不看看楊紫媽媽的搭配?她在這方 ...

Ella陳嘉樺越來越有女神範,穿泡泡袖連衣裙溫婉雅緻,哪像假小子

Ella陳嘉樺越來越有女神範,穿泡泡袖連衣裙溫婉雅緻,哪像假小子
每個人的青春時代,都有著獨特的印記.就像大多數80後90後的姑娘,在她們的青春裡,充斥著SHE的音樂,那三個各有風格的姑娘,總能在其中一個人的身上找到你的影子.當年那個短髮的姑娘Ella陳嘉樺,如今早 ...

時髦的女人已經不穿粗跟鞋了,來看看今秋最火的平底鞋你有幾雙?

時髦的女人已經不穿粗跟鞋了,來看看今秋最火的平底鞋你有幾雙?
曾經有一段時間,女性是非常痴迷於高跟鞋的.甚至有部劇的臺詞都說,"站在高跟鞋上,我可以看到全世界.愛情會逝去,但鞋子永遠都在."但如果你關注最近的潮流趨勢的話,會發現高跟鞋已經過時 ...

吳昕終於不是“乖乖女”了!改變風格的她真的好美,很時髦

吳昕終於不是“乖乖女”了!改變風格的她真的好美,很時髦
Hi,這裡是搭搭, 一個專注穿衣打扮,專屬你美麗的時尚達人! 提到娛樂圈裡的知名主持人,那麼就不得不提到吳昕了.背靠<快樂大本營>,使得吳昕在一代主持新秀中遙遙領先. 流量話題熱度都不缺少 ...