sponsored links

除了GPU,雲端訓練還有什麼選擇

前不久,亞馬遜科技宣佈全面推出Amazon Elastic Compute Cloud(Amazon EC2)DL1例項,該例項由英特爾於2019年收購的Habana Labs的Gaudi加速器提供支援。

Habana與亞馬遜之間的這項合作其實從去年開始就已經展開了,在去年的Invent大會上,Gaudi就已經打入了亞馬遜的EC2。到了今年10月,採用了Gaudi的AWS EC2例項正式被投入應用,並被命名為DL1例項。這也標誌這亞馬遜首個不基於GPU的AI訓練例項正式被投入使用。

除了GPU,雲端訓練還有什麼選擇

除了GPU,雲端訓練還有什麼選擇

Habana Labs為Amazon EC2 DL1例項搭載Gaudi AI加速器並提供強勁動力,新的例項專為深度訓練模型而設計。(來源:英特爾)

不基於GPU的AI訓練

目前,AI雲端訓練大多是由GPU所支援的,GPU能夠支援更大規模的資料模型,讓AI開發者能夠在更短時間內實現更多AI突破。

而由海量資料構成的AI時代所促生的大量新興應用場景,他們往往更需要針對特定場景所設計的晶片,因此,AI訓練晶片也成為了除GPU以外的選擇。需要注意的是,AI訓練是基於大量資料來構建的,而為了提高模型的預測準確性,資料科學家和機器學習工程師正在構建越來越大、越來越複雜的模型。為了保持模型的預測準確性和高質量,這些工程師需要經常調整和重新訓練他們的模型。而這需要大量的高效能計算資源,也導致了基礎設施成本增加。

從實際情況中看,據Habana介紹,市場上對雲端和本地部署資料中心的AI訓練有大量需求。根據AI/機器學習基礎設施的使用者的反饋中顯示,56%的AI/機器學習客戶表示成本是最大的問題。而Gaudi正是為了解決這個問題而設計的。

“Gaudi是為最佳化AI訓練而定製的處理器,而GPU是以AI工作量為導向的圖形處理器”,Habana Labs中國區總經理於明揚介紹:“Gaudi專為高效和低成本的人工智慧效能而設計,也為人工智慧和可程式設計的Tensor Core Processors(張量核心處理器)而定製。”

亞馬遜方面也同樣公佈了一些關於張量核心處理器的描述,其首席佈道師Jeff Barr表示:“這些是專為ML訓練而設計的VLIW SIMD(超長指令字/單指令多資料)處理單元,TPC是C可程式設計的,儘管大多數使用者會使用更高級別的工具和框架。”

根據英特爾官方資料顯示,定製化的AI訓練晶片與通用GPU相比,新的DL1例項使用專門構建的Gaudi加速器,透過以更低的成本提供更高的計算效率來加速機器學習模型訓練。DL1例項配備多達8個Gaudi加速器、256 GB高頻寬記憶體、768 GB系統記憶體、第二代亞馬遜自定義英特爾至強可擴充套件(Cascade Lake)處理器、400 Gbps網路吞吐量和多達4TB的本地NVMe貯存。

採用了這種設計的晶片,使得Gaudi在效能表現上不輸GPU。所以,當Habana將這些功能進行疊加後,這些創新轉化為比用於訓練常見機器學習模型的最新GPU驅動的Amazon EC2例項高40%的價效比。從而,解決了雲端和資料中心市場在佈局AI訓練時對成本的顧慮。

Gaudi如何實現高性價比

Gaudi的架構採用了全新的設計以提高效率,實現了更高的資源利用率並且包含更少的系統元件,降低了AI訓練成本。

首先從成績上看,Habana在其新聞稿中稱,Habana認識到MLPerf效能基準測試的重要性,使用者可以查詢在6月份釋出的針對8個基於Gaudi的系統進行基準測試的1.0提交結果,與DL1.24xlarge非常類似。

這裡所提到的MLPerf HPC 1.0是用於衡量高效能計算中 AI 效能的行業基準測試,該測試作為業內最權威的AI基準測試,吸引了很多國際廠商、研究機構參與其中,在資料中心推理、邊緣推理、叢集訓練和單機訓練各類AI場景下,不斷突破AI系統性能。

但在此次MLPerf提交結果中,Habana並沒有應用資料封裝或層融合等額外的軟體最佳化功能來提高效能。對此,於明揚表示:“Habana這樣做的原因是公司將重心放在了客戶需求以及 AWS的合作上面。新聞稿中的表格體現了價效比指標,客戶可以瞭解即使沒有這些最佳化,客戶也可以進行更多培訓並減少支出。對客戶而言,重要的是:客戶可以做多少AI訓練,以及花費是多少。”

在這次評估中,我們考慮了兩種流行的模型:ResNet-50 和 BERT-Large。

除了GPU,雲端訓練還有什麼選擇

除了GPU,雲端訓練還有什麼選擇

於明揚補充道:“我們必須積極提升我們的軟體能力。我們現在支援24種流行的AI模型,並且能夠透過我們的Gaudi解決方案集有效地為業界最大的CSP AWS提供服務。”

Gaudi的價值主張立足於價效比和易用性。Habana提供的架構選項旨在提升效率,不會讓終端使用者遷移到Gaudi的工作產生困難。根據Habana官方介紹,客戶可以使用隨附的 Habana SynapseAI SDK 快速輕鬆地開始使用 DL1 例項,該 SDK 與領先的機器學習框架(例如 TensorFlow 和 PyTorch)整合,幫助客戶將他們當前在基於 GPU 或基於 CPU 的例項上執行的現有機器學習模型無縫遷移到 DL1 例項,只需更改最少的程式碼。

除此之外,Habana還建立了開發者社群和開源來支援使用者在“易用性”方面的需求。在這些方面的提高,使得采用Gaudi的AI訓練可以實現較高的價效比。

Gaudi還能做什麼

Gaudi所具有的價效比優勢,也讓很多廠商願意去嘗試採用AI晶片來完成AI訓練。從應用場景上看,Gaudi新例項支援自然語言處理和計算機視覺應用程式,包括物件檢測和影象分類。

Gaudi正在處理的一些應用程式和類別,應用案例具體還包括:

1.物件檢測和分割:缺陷檢測(工業領域)、錯誤檢測和工業管理(零售領域)、醫學掃描和影像(醫療領域)

2.影象分類:自動駕駛汽車細分(交通領域)、照片和影片識別(網站和客戶端領域)

3.自然語言處理:主題查詢、問答處理、情感分析

據瞭解,Gaudi參考模型儲存庫包含 20 個高需求模型。而從Habana所規劃的路線圖來看,Habana還將繼續對其進行擴充套件,包括其軟體功能。

除了GPU,雲端訓練還有什麼選擇

(Habana Gaudi最佳化路線圖)

另外,據Habana團隊透露,他們正在開發下一代Gaudi2 AI處理器,新處理器會將Gaudi架構從16nm提升到7nm。同時,公司方面也表示:“為了我們的最終客戶的利益,進一步提高性價比,同時保持相同的架構和完全利用我們與Gaudi構建的相同SynapseAI軟體和生態系統。”

Gaudi2 AI處理器將於2022年推出,它可以提供7奈米處理器的效率,同時,使用Gaudi最佳化軟體的使用者還將能夠在Gaudi2上使用相同的軟體,最大化使用者已付出的投資。

從Habana與亞馬遜聯手合作,到現在他們之間的合作專案開始逐漸落地,並得以應用,便可以預見雲端AI訓練的一股新勢力正在崛起。

分類: 科技
時間: 2021-12-06

相關文章

2021鄉村客運提速,“村村通”或將全覆蓋!你家何時通公交?

2021鄉村客運提速,“村村通”或將全覆蓋!你家何時通公交?
[村長曉佳一]圖文記錄鄉村生活,書寫"三農"問題,解讀社會焦點!敬請點選關注! 相比於城鎮四通八達的交通網路,以及多元化的交通方式,農村交通就稍顯遜色.不管是鄉村公路的基礎建設,還 ...

倫敦地鐵乘客擔憂感染新冠拒握扶手 摔落扶梯意外頻發

倫敦地鐵乘客擔憂感染新冠拒握扶手 摔落扶梯意外頻發
中新網9月18日電 據"中央社"18日報道,英國倫敦地鐵車站發生乘客摔落電扶梯的意外有增加傾向,其中一個原因可能跟乘客擔憂感染新冠.都避免手握扶手有關. 資料圖:英國倫敦地鐵. 倫 ...

煤電中長協全覆蓋帶來的穩價預期

煤電中長協全覆蓋帶來的穩價預期
近日,國家發改委發通知要求,發電供熱企業和煤炭企業在今年已簽訂中長期合同的基礎上,再簽訂一批中長期合同,將發電供熱企業中長期合同佔年度用煤量的比重提高到100%. 當前我國處於傳統的煤炭消費淡季,煤價 ...

「每週經濟觀察」以中長期合同全覆蓋化解煤電博弈
煤炭價格屢創新高,讓煤炭企業迎來了"煤飛色舞"的日子.據國家統計局資料,今年上半年,我國規模以上煤炭企業利潤總額2068.8億元,同比增長高達113.8%. 煤企樂開了花,火電企業 ...

僅售799元“白菜價”的4G全網通平板:酷比魔方KPad評測

僅售799元“白菜價”的4G全網通平板:酷比魔方KPad評測
現在的錢越來越不經花了--那麼其原因通貨膨脹,我們都瞭解麼?筆者還依稀記得N年前,約上幾個好友在外頭吃個飯,喝幾杯也才三五百塊就能搞定了,現在呢?各位看官有沒有發現,隨隨便便搓一餐就得花個千兒八百,這 ...

怎麼做到全屋滿格WIFI訊號?WiFi全覆蓋AC+AP方案分享‼️純乾貨

怎麼做到全屋滿格WIFI訊號?WiFi全覆蓋AC+AP方案分享‼️純乾貨
不少人裝修結束以後,才會發現家裡的Wi-Fi訊號不給力吧?要怎麼做才能實現全屋滿格WiFi訊號呢? 裝修的wifi佈置很重要,單個無線路由顯然靠不住.路由器就只有一個,同時連線了很多裝置,WiFi君表 ...

印度空軍幻影2000H升級計劃推遲
英國<簡氏防務週刊>網站10月11日發表題為<印度空軍的"幻影2000H"升級計劃推遲>的文章,全文摘編如下: <簡氏防務週刊>獲悉,印度空軍5 ...

北京環球影城最全攻略|線路交通美食酒店省錢全覆蓋

北京環球影城最全攻略|線路交通美食酒店省錢全覆蓋
霍格沃茲北京通州分校 AKA 北京環球影城 馬上就要開學了 各位巫師同學都收(qiang)到 入學通知書(menpiao)了嗎? 怎麼才能到學校 自駕的話,飛天汽車停在哪 學校都設定了什麼" ...

十月至少釋出7款新機,從千元中端到萬元高階全覆蓋

十月至少釋出7款新機,從千元中端到萬元高階全覆蓋
9月份的手機圈熱鬧非凡,幾乎是各大手機品牌都有新機,除了引人注目的iPhone13系列,還有小米Civi.vivo X70 系列.OPPO K9 Pro.華為nova9系列等多達9新機,本以為10月份 ...

新一代復讀機居然小學學科全覆蓋,牛聽聽超記牛體驗

新一代復讀機居然小學學科全覆蓋,牛聽聽超記牛體驗
孩子的學習是每個家庭中的頭等大事,如何輔導孩子成為家長頭疼的事情,想要正確指導孩子學習也成為了家長必修課. 為了更好的輔導孩子的學習,作為老父親為他入手了市面上新出的一款智慧AI復讀機-牛聽聽超記牛, ...

明查|“13歲中國駭客”攻陷臉書?

明查|“13歲中國駭客”攻陷臉書?
澎湃新聞記者 南博一 實習生 王兆隆 當地時間10月4日,美國社交網路巨頭"臉書"(Facebook)及其旗下的Instagram.WhatsApp等應用出現大規模宕機,服務中斷長 ...

安徽合肥新添1所學校,投資10億,佔地150畝,幼兒園到高中全覆蓋

安徽合肥新添1所學校,投資10億,佔地150畝,幼兒園到高中全覆蓋
安徽省近些年的經濟發展實力越來越靠前了,合肥作為安徽省的省會,各方面的條件自然是很優越的.教育事業是社會發展的根本,只有充足的人才儲備才可以促進經濟可持續發展,所以這些年我國加大了教育的投資成本,也確 ...

沙洲村:從“半條被子”到“雲端日子”

沙洲村:從“半條被子”到“雲端日子”
盛夏時節,在郴州市汝城縣文明鄉沙洲村,一年一度的沙洲村水果節正在舉行.一大批遊客紛至沓來,金黃色的奈李擺滿攤位,村民紛紛化身主播.導遊.農家樂老闆.民宿經營者,為八方遊客提供便捷的旅遊服務. 沙洲村瑤 ...

華裔學者胡安明被判無罪引發美國社會反思和聲討——“中國行動計劃”:一場具有表演性質的政治迫害
"你們應該向胡安明道歉,停止對亞裔的歧視,調查司法部涉嫌'種族定性'的行徑.如果胡安明不姓'胡'而姓'史密斯',你們就不會起訴他了."美國聯邦法院9月9日宣佈撤銷對胡安明的所有指控 ...

如何制定半馬、全馬跑步計劃

如何制定半馬、全馬跑步計劃
對於已經有一些跑步經驗的人來說,在合適的時候去參加一場馬拉松,是一件極有意義,並順利成章的事情. 你可以現在開始為給自己計劃參加一場比賽,有一個目標和規劃會讓你更有動力堅持鍛鍊,也更容易得到意外收穫. ...

北京地鐵能防原子彈?你不知道的人防工程,關鍵時刻救你命

北京地鐵能防原子彈?你不知道的人防工程,關鍵時刻救你命
如果防空警報響了,你知道往哪躲嗎 2018年1月13日早上8點,剛睡醒的夏威夷居民突然從手機上收到一條即將遭受導彈打擊的警報! ▲緊急警報,夏威夷即將受到彈道導彈攻擊! 當地居民瞬間睡意全無 緊急警報 ...

8點1氪 | 天貓超市就礦泉水出現老鼠事件道歉;位元組計劃下半年推出音樂App“飛樂”;華為Mate 50 Pro或10月釋出

8點1氪 | 天貓超市就礦泉水出現老鼠事件道歉;位元組計劃下半年推出音樂App“飛樂”;華為Mate 50 Pro或10月釋出
上市進行時 Rivian 據知情人士稱,亞馬遜支援的電動汽車初創公司Rivian正準備在第四季度上市,並希望透過此次IPO融資至多80億美元.Rivian上月秘密提交了IPO申請.如果其融資規模達到8 ...

港科大團隊開發全腦基因編輯技術,已驗證可改善小鼠AD症狀

港科大團隊開發全腦基因編輯技術,已驗證可改善小鼠AD症狀
根據世界衛生組織的資料,隨著世界人口老齡化,每年有近 1000 萬阿爾茨海默症新增病例. 傳統的阿爾茨海默症治療藥物只能緩解症狀而不能改變疾病,因此科學家們開始尋找替代策略.在使用 CRISPR-Ca ...

逆天奇案:查了4年都不知道兇手是誰,最後憑一張小紙條發現真相

逆天奇案:查了4年都不知道兇手是誰,最後憑一張小紙條發現真相
大家好,我是馬港真,一個懸疑小說愛好者. 今天說一個小說裡的逆天奇案. 這事發生在十六年前的香港,屯門,一個在港片中叱吒風雲的地方. 有天晚上,一個叫做馬榮明的男人開車回家,他住在村屋. 下車時從副駕 ...

廣西所有孕婦,產前篩查有補助

廣西所有孕婦,產前篩查有補助
9月23日,南國早報客戶端記者從自治區衛生健康委瞭解到,作為全區"我為群眾辦實事"實踐活動重點專案之一,廣西衛生健康部門統籌資金開展優生優育產前篩查關愛行動,擴大產前篩查補助範圍, ...