距離2016年左右的AI晶片創業熱潮已經過去五年多,從團隊組建,到晶片設計、再到產品落地,AI晶片公司們到了交出一份答卷的時間。
Graphcore大中華區總裁兼全球首席營收官盧濤對雷峰網表示,“2022年AI晶片公司的競爭會更加激烈,因為不同的公司選擇了不同的策略和路徑,今年開始能看得更加清晰。”
實際上,從2020年開始,大部分AI晶片公司都開啟了晶片的落地,然而由於AI晶片與傳統晶片有明顯的差別,晶片提供者與使用者之間的認知差異,加上疫情的影響,和全球蔓延的缺芯潮,AI晶片的落地和大規模使用面臨重重挑戰。
2021年,業界更加關注AI的部署,包括對機器學習框架的關注,支援的模型,以及叢集的管理和排程管理。
想要成為AI晶片的佼佼者,有哪三個秘訣?
AI晶片公司面前的七個臺階
AI熱潮催生了大量的晶片初創公司,初創公司要成功落地全新型別的AI晶片,挑戰當前巨頭,可以以攀登珠穆朗瑪峰來比喻。
盧濤認為,如果今天的巨頭在珠穆朗瑪峰上,想要達到巨頭的高度,需要攀登七個臺階。
第一個臺階是組建團隊,第二個臺階是宣講理念,第三個臺階是設計出晶片,第四個臺階是有晶片且能給客戶送樣品做測試,第五個臺階是有產品有落地,第六個臺階是有產品,有很多落地的,第七個臺階是有很大的市場份額。盧濤認為Graphcore處於第五到第六個臺階間。
處於這個階段的公司,表明其已經解決了許多技術挑戰。AI計算與傳統的CPU有顯著的差別,過去5-10年間,CPU的應用都十分明確,比如Web服務、資料庫服務、儲存服務等。但AI整體面向的應用有許多創新和研究,整體呈高度動態化。
在這樣的情況下,AI晶片的落地更顯艱難,步驟大致可以分為三個,首先,要用AI晶片的效能優勢吸引客戶,接下來客戶會考慮軟體移植的難度以及時間,在歷經驗證之後,才能實現大規模部署。
這個過程可以說是漫長而又挑戰重重。其中一個非常大的挑戰就是AI晶片提供者和使用者之間認知的差異。“從我們的角度而言,雖然這種認知的差異有所改善,但挑戰仍然持續存在。”盧濤說,“比如,不少使用者可能覺得我們的IPU效能表現好,並想能在不修改程式碼的情況下遷移到IPU,這就需要我們在軟體和生態方面做大量的工作。”
AI軟體和生態的建設,要求對某個具體的應用領域有比較完整的認知,實現整個業務端到端的配合,不僅僅是AI,還包括AI晶片與其它裝置、系統的配合,運維管理等。
盧濤指出,“作為計算平臺的提供者,要讓終端使用者把我們的平臺用好,生態非常重要,生態建設能夠降低使用者的使用門檻。同時,垂直案例也非常重要,透過‘打樣板’,能夠顯著加速在某一行業的應用。當然,加強與AI平臺廠商的合作同樣關鍵。AI領域有兩種使用者,一種是AI開發者,有了案例就可以做相應的開發,還有一種是AI平臺型企業,他們可以把AI技術封裝以提供給其他人員使用。”
對於有計算機背景的開發者或研究員,他們可以基於TensorFlow、PyTorch和百度飛槳等進行程式設計,如果不具備這個能力,就需要藉助更高階的框架,比如Hugging Face來降低開發門檻,簡化開發。這兩者的開發難度有顯著差別,如果用PyTorch實現一個業務,可能需要兩百行程式碼,但採用Hugging Face,可能用50行程式碼就可以完成。
成為AI晶片領先者的三個關鍵
不難發現,想要實現AI晶片的大規模落地,減小AI晶片提供者和使用者之間的認知差是關鍵,這其中的關鍵又是軟體和生態的建設。
但要成為AI晶片領域的領導者,盧濤認為有三個關鍵:預判+冒一點風險+一點運氣。
“Graphcore在2016年成立時,只能追趕。對於新的領域,如果能提前預判,就可能在領域裡具備領先性。”盧濤具體解釋。
2016年,傳統的機器視覺模型ResNet已經存在,這時候Graphcore需要追趕,作為追趕者需要做一些預判發現機會。2020年,Graphcore關注到了Transformer技術,這種技術本來是用於自然語言處理的底層技術,但業界出現了用Transformer做計算視覺的趨勢,Graphcore率先開始支援。
到2021年下半年,一些基於Transformer的視覺模型,比如ViT成為了熱門。由於有提前的預判,Graphcore對於新的基於Transformer的視覺模型以及GNN都有很好的支援,很多創新和前沿的模型比GPU支援得更好。
正是憑藉著創新的IPU硬體和不斷完善的Poplar軟體生態,Graphcore在2021年有不少應用案例。在2021年下半年,安捷數科利用IPU進行氣象預測、精準灌溉、防災減災。深勢科技完成分子動力學模擬軟體DeePMD-kit向IPU硬體的遷移,探索基於分子動力學模擬的科學計算、藥物設計、材料設計和新型能源等場景。
在金融保險領域,牛津-英仕曼用IPU進行股價預測;Tractable與Graphcore達成合作,加速事故和災害恢復。電信方面,Graphcore與韓國電信合作釋出了IPU雲。在城市環境可持續發展領域,升哲科技基於IPU進行城市相關可持續發展方面的應用。在醫療、生命科學領域,Graphcore與斯坦福大學醫學院合作,使用IPU以“醫療+隱私計算”為核心方向進行了一些研究和探索。
但這些應用案例多為前沿技術和應用的探索,不是大規模的商業應用。對此盧濤表示,“商業領域內,我們有一些大規模應用的客戶,他們更關注於自身業務給客戶帶來的價值,很少和技術廠商一同釋出新聞。前沿的研究更加開放,研究者也希望結果能讓更多人看到,自然會有更多可以分享的案例。”
他也同時透露,2022年,Graphcore會有一些和國內公有云廠商的IPU產品釋出,也會有新的硬體產品的釋出。Graphcore也會在一些相關的AI應用領域中會進一步加深合作,比如AI輔助科研、自動駕駛等是他們2022年在AI應用或垂直領域中比較重要的方向。
值得一提的是,Graphcore的IPU與CPU的硬體解耦,有助於IPU更好的拓展市場。比如在BERT訓練中,Graphcore採用一臺2顆CPU的伺服器和64顆IPU,比例為1:32,在計算機視覺模型中的比例則基本為1:8。但如果是英偉達或者英特爾的系統,無論何種場景和模型,都會有一個固定的CPU和GPU比例,比如1:4或1:2。
AI晶片的競爭最終依舊會演變為生態、商業的競爭。在AI晶片的早期階段,雖然參與者眾多,但各自都在團隊組建和產品開發的階段,AI晶片公司間並沒有真正的競爭關係。隨著AI晶片的釋出,以及落地的推進,AI晶片公司之間的競爭才真正開始。
當越來越多的領域和客戶開始關注AI的規模應用和落地時,自然會加劇AI晶片公司之間的競爭,這時候,已經不再單純比拼硬體效能,軟體和生態才更能打動終端使用者。
2022年,我們將看到AI晶片公司間的競爭日趨激烈,我們也將慢慢看到AI晶片公司們真正的實力。雷峰網