什麼是GPGPU?
GPGPU似乎是最近幾年才流行起來的,外行人聽著感覺是比GPU還要厲害的東西。事實上,GPGPU是英文General-Purpose computing on Graphics Processing Units的縮寫,中文譯為通用圖形處理器,可以理解為是GPU的一個分支。
從歷史的角度來看,GPU的產生是為了解決遊戲中圖形渲染效率的問題,但是隨著圖形晶片技術的不斷迭代,GPU的處理功能和計算能力不斷提升。2001年,得益於shader的出現,GPU在圖形流水線中引入了可程式設計性,從此GPU能做的事情不再侷限於圖形資料的處理,而將觸角延伸至其他計算密集的領域,開啟了GPGPU時代。
跳過GPU,本土廠商為何選擇自研GPGPU?
有人說,沒了圖形渲染的GPGPU不過是一款專用的ASIC,真的是這樣嗎?在2021年中國積體電路設計創新大會上,筆者也對該問題進行了提問。沐曦整合的CEO陳維良是這樣回覆的,“ASIC的設計是偏離通用GPU架構的,其軟體適配靈活性將面臨很大的挑戰,產品的應用生命週期也比GPGPU短。”這意味著GPGPU和ASIC從底層架構上就能區別是兩種技術,各自服務於相應的應用場景,並不能混為一談。
至於“跳過GPU,直接選擇GPGPU新戰場”的原因,陳維良表示,“全球GPU市場已經形成半壟斷局面,再加上圖形渲染是一個存量市場,正面交鋒實屬不易,選擇增量市場的計算型GPU,也就是我們說的GPGPU,也許是明智之舉。”
事實上,跳過GPU的說法本身就不是很準確。從GPU體系架構的角度來看,我們可以把GPGPU分為三大家族。
第一個家族的長輩是傳統GPU,主導者包括英偉達和AMD/ATI,這類架構有一個顯著的特性,那就是包含大量結構簡單的處理核心構成的陣列。它會以高度並行化的方式批次處理資料,這些帶有向量特徵的處理陣列是由傳統GPU中的多條並行的渲染管線發展而來。此外,這類GPGPU中仍或多或少地存在一些專用於影象處理的部件,如紋理Cache、幀緩衝等。但是,隨著通用計算的需求日益顯著,GPGPU正越來越專注於通用計算能力,而漸漸弱化其作為顯示卡的功能。
第二個家族的長輩是傳統的多核CPU,典型代表是以CPU著稱的Intel,它的架構理念是對傳統CPU核心進行裁剪,從而得到相對輕量級的處理核心,構成其計算部件。這樣做的優點是可以相容部分傳統CPU的指令集,它的缺點是相對於上述GPGPU中的細粒度處理單元,這類處理核心仍然比較複雜,因此核心的整合度遠不及第一家族的GPGPU。
第三個家族是GPU和CPU的聯姻產物,融合了GPU和CPU的架構特色,典型的代表是AMD的APU產品系列。這類架構的做法是將GPGPU中的處理陣列直接作為CPU的加速部件整合到同一顆晶片內。這樣做帶來了兩大好處,好處一:CPU核心的融入增強了GPGPU的標量處理能力,更適合通用計算的要求;好處二:融合的結構可緩解GPGPU和CPU之間的通訊頻寬受限問題。
此外,英偉達作為一家美籍華人創立的公司,其實並沒有把太多的研發工作投在中國,所以從人才組成的角度,我國做GPGPU的創業者大部分來自AMD、Imagination和Intel,其中AMD佔主導。事實上,這些本土公司在做GPGPU時,他們的研發人員之前都經歷過GPU相關技術的研發,因此從技術的角度來說,並沒有跳過GPU,而站在市場的角度,面對資料爆發時代的到來,自研GPGPU是順應市場自然選擇的結果。
頭部站隊初步形成,國產GPGPU正醞釀一場“大落地”
根據不完全統計,中國大陸大約有7家相對主流的GPGPU公司,它們分別是天數智芯、登臨科技、壁仞科技、摩爾執行緒、珠海芯動力、沐曦整合和紅山微電子。
為什麼說頭部戰隊已經基本形成呢?因為GPGPU的技術開發難度是很高的。“通常業內一款高階晶片的前端和後端設計要耗時1~3年,設計完成後的流片環節,需要3~6個月,還會有流片失敗一切重來的風險。即使成功流片,仍然還需要經過3~12個月的產品測試調優,才能最終開啟量產。” 天數智芯董事長兼CEO刁石京如是說。
舉個例子,強如intel,從1997年開始佈局,透過收購C&T,入股Real3D後,在1998年推出了第一款獨立GPU i740後就少有成果,直到2007年眼紅英偉達的GPGPU市場,開始重啟GPU計劃,推出產品Larrabee,可惜效能價格都沒有競爭力,再到2020年又推出了全新的獨立GPU架構Xe,可惜截至目前,Intel仍未推出自己消費級的獨立GPU產品。
由此可知,GPGPU市場準入門檻是很高的,而目前從大廠出來有這方面技術積累,又能拉到投資的人基本流動得差不多了。此外,我們知道GPGPU的工藝要用上12nm、7nm甚至5nm技術,除了高階技術人員的薪資支出以外,流片的成本也非常之高,高投入意味著必須要高產出才能盈利,因此產品落地量產勢在必行。而這些本土的GPGPU廠家大多面向資料中心和雲端市場,頭部可以配合“拉練”的客戶梯隊也都已經形成,後面再擠入困難有些大。
結合上述論點,我們來看一下本土GPGPU廠商的進展情況。從產品落地的角度來看,目前只有天數智芯宣佈其首款雲端7nm GPGPU產品卡——“天垓100”已正式進入量產環節(今年10月29日的訊息),單芯算力每秒147T@FP16。緊隨其後的是登臨科技、珠海芯動力和壁仞科技。登臨科技在7月14日宣佈其首款GPU+產品已成功回片透過測試,開始客戶送樣;珠海芯動力的聯合創始人李原在今年7月份透露,其第一款應用於邊緣伺服器的晶片R8已經流片,採用三星14nm工藝,算力達到32 TOPS,功耗小於14W;壁仞科技在今年的10月8日宣佈其首款7nm GPGPU——BR100已正式交付臺積電流片,預計將於明年面向市場釋出。接下來是摩爾執行緒,摩爾執行緒在11月25日的釋出中只表明其首顆國產全功能GPU研製成功,換句話說流片、測試、聯調等等都還是後頭的事兒。至於另外兩家,沐曦整合和紅山微電子,成立的日期相對較晚,目前應該還在初代產品研發階段。值得一提的是,沐曦整合的研發隊伍還是很強大的,其創始人陳維良曾任AMD圖形研發高階總監,CTO楊建為前AMD Fellow,所以未來躋身前三的機會也很大。
當然,前面只是根據各家企業產品落地的情況進行了梳理,至於他們所用的產品架構、工藝製程、算力、能效比、面向的細分市場以及公司戰略等都不在考慮的範圍內,要是都考慮進來,可能這個進度又得推翻重來。不過從這些廠商的產品釋出進度來看,目前大家都想當“第一”,可以說是正在醞釀一場“趕集式”的大落地。
GPGPU的下游市場在哪裡?
廠商的紛紛投入,離不開投資界的推動,更離不開下游市場的需求。
據公開資料顯示,目前中國GPGPU 90%的市場都被以英偉達為代表的外企瓜分,僅2019年,英偉達和AMD兩大美企就在國內GPGPU市場賺走了約80億元。半壟斷市場帶來的是高售價,當前一塊高階的GPGPU板卡,市場售價高達十幾萬元,相當於一輛普通小轎車的價格。與此同時,有專家預測,到2025年,我國GPGPU晶片板卡的市場規模將達458億元,年複合增長率高達32%。由此可見,GPGPU產品國產化勢在必行。
那麼有人要問了,國內GPGPU的市場需求到底分佈在哪些行業呢?根據業內人士提供的中國GPGPU出貨量行業結構資訊顯示,2019年接近一半的GPGPU用於網際網路市場,三分之一左右的GPGPU用於安防和政府市場,十分之一左右的GPGPU用於其他行業的AI應用,接近十分之一的GPGPU用於HPC市場。當然這是2019年的資料,現在的情況可能會有所調整,比如HPC的比重有所增加等等。
寫在最後
英偉達3000億美元市值、AMD1000億美元市值,中國的GPGPU市場規模和賽道都足夠大,也許三五年後,本土也能做出個“小英偉達”、“小AMD”來。所以說,國產GPGPU的下一步考驗的是如何做大?而除了持續融資提供經濟動力外,這些公司所有的競爭力都將聚焦於一點,那就是產品高效能下的價效比,價效比決定出貨量,出貨量代表市場的認可,市場帶來資金活水,從而形成良性迴圈。