智慧汽車的AI晶片,還有突圍機會嗎?一家名為Kneron的人工智慧低功耗處理器公司給出了自己的答案。
這家公司剛剛從富士康和記憶體晶片製造商華邦電子獲得新一輪戰略投資,此前,包括李嘉誠旗下的維港投資、阿里巴巴創業基金、紅杉資本、高通等知名行業巨頭及機構參與了投資。目前,公司累計融資額約1億美元。
Kneron創始人兼執行長Albert Liu之前曾在高通和三星負責晶片及相關軟體研發,公司成立於2015年,目前格力空調、德國自動駕駛軟體供應商Teraki都是合作客戶。
作為戰略協議的一部分,Kneron將與富士康新推出的電動汽車開放平臺進行合作,而與華邦電子的合作將專注於基於MCU的人工智慧和記憶體計算晶片。
Kneron瞄準的方向,是低功耗人工智慧晶片,原因是大型GPU或CPU,功耗一直是一個大問題。而除了晶片設計,這家公司還提供AI軟體演算法支援,主打邊緣側AI處理。
一、
從去年開始全球晶片的短缺潮,使得傳統晶片巨頭忙於解決產能問題,而更多的投資者和初創公司看到了新的時間視窗期。尤其是汽車智慧化對AI晶片的需求正在快速增加。
Kneron看中的,也是目前大多數晶片初創公司選擇的開源RISC-V架構,這意味著不用受到ARM、x86等架構的授權限制,更可以實現一種差異化創新佈局。
而目前,全球率先上車的RISC-V架構晶片,就是零跑汽車搭載的自研凌芯01晶片,單片算力達4.2Tops,域控制器由雙片組成,總算力達8.4Tops,可實現L3級自動駕駛。
其中,CPU是阿里平頭哥玄鐵C860,採用的就是RISC-V架構,而非目前汽車晶片主流的ARM架構,功耗只有4W,製造採用了28nm製程工藝。
如今,Kneron最新發布的最新一代AI晶片KL530,就是採用RISC-V架構,同時配合谷歌在2017年提出的Vision Transformer演算法,可以滿足L1和L2級別的算力需求。
選擇RISC-V,是因為這是一個開源的精簡指令集架構,同時具備可擴充套件、模組化等特點,適合小型、快速和低功耗的應用設計,這對於智慧電動汽車來說,至關重要。
而拋棄傳統的卷積神經網路(CNN)並轉向Vision Transformer,在Kneron公司看來是因為後者對於連續影象識別的準確度要比CNN高出30%。目前,包括特斯拉、毫末智行等公司都在採用Transformer視覺識別技術,提升抗干擾能力和識別精度。
在Kneron公司看來,要想超越傳統的輔助駕駛能力,Transformer模型是必要的,因為它們可以進行整體推理,而不是像使用cnn那樣只基於區分資訊的關鍵特徵進行推理。這意味著,系統可以實現高度精確的危險檢測,顯著提高安全性。
從KL530的IP核配置來看,除了NPU、ISP,還包括一個ARM Cortex-M4@400MHz CPU用於系統控制,在8位模式下提供0.5 TOPS峰值吞吐量,最大功耗低於500毫瓦。目前這款晶片已經拿到車規級認證。
對於KL530來說,另一個特點就是ISP處理器,可以處理1080P的高動態範圍(HDR)影像,再透過機器學習和3D識別檢測物體及更加準確的距離識別。
為此,Kneron公司在今年4月還專門收購了一家名為Vatic的影象訊號處理(ISP)技術供應商,後者的產品之前已經在安防監控、汽車和消費市場有不少客戶應用。這意味著,Kneron公司具備了自主研發NPU+ISP的視覺AI處理能力。
這一點,和國內的黑芝麻智慧是同樣的路線。
作為黑芝麻智慧的兩大核心自研IP之一,ISP的IP顯得尤為重要。因為影象資料在給到神經網路之前如果沒有調到最佳的狀態,是很難靠後端的檢測處理達到要求。而該公司的NeuralIQ ISP,對於每個MIPI的Block都會對應一個Pipeline,並且透過演算法最佳化和調優。
以黑芝麻智慧的A1000為例,內部的ISP可以處理12路攝像頭,頻寬30Gbps。對於夜間低光照的環境情況,內部ISP可以對影象做提亮,去噪,HDR,提升影象品質。
相比於其他晶片廠商採用第三方的ISP模組,自研能力的保障可以繼續提升效能,而不是受制於外部供應商的通用效能限制。從這一點也可以看出未來汽車AI晶片的競爭,IP核的自研能力是一個典型的差異化競爭力。
二、
不過,對於類似Kneron這樣不斷湧現出來的AI晶片初創公司,市場驗證還需要時間。
在業內人士看來,就像所有的創業公司一樣,很多時候表面上的效能指標“聽起來”不錯,但真正的“魔鬼”在於細節,而且包括英偉達在內的傳統晶片巨頭也在不斷提升效能,並且也在快速擁抱新的技術架構。
在這一點上,不少業內人士認為,現在談論RISC-V對Arm架構帶來的競爭壓力有多大,還為時過早。比如,開源IP核目前最緊要的一件事就是如何滿足汽車功能安全規範。尤其是從驗證的角度來看,還有不少問題需要解決。
利好訊息是,目前,一些RISC-V晶片嵌入式軟體開發工具正在陸續拿到ISO26262功能安全認證。比如,IAR Systems的RISC-V開發工具鏈在今年初拿到了IEC 61508和ISO26262汽車功能安全認證,包括高度最佳化的IAR C/C++ Compiler和功能豐富的C-SPY偵錯程式。
同時,在晶片成本上,RISC-V的確優勢非常明顯。以去年阿里平頭哥釋出的玄鐵910為例,晶片效能提高一倍以上,同時晶片成本降低一半以上。
但,RISC-V似乎並非看上去那麼“簡單”。作為晶片架構設計行業的教父級人物,吉姆·凱勒認為,早期的X86和Arm,同樣是因為簡單、乾淨的特點而被大規模使用,但在不斷的演進過程中,開始變得越來越複雜。“相對來說,RISC-V還處於複雜性生命週期的早期。”
不過,一些傳統汽車晶片巨頭也已經在RISC-V上進行戰略佈局。
今年4月,日本汽車晶片龍頭瑞薩電子宣佈與RISC-V晶片方案提供商SiFive, Inc建立戰略合作伙伴關係,共同開發下一代半導體解決方案,來滿足客戶的特定需求。
SiFive智慧平臺基於SiFive RISC-V向量處理器和AI ISA擴充套件,具有差異化的軟體工具鏈,能夠為AI和ML應用開發可擴充套件的解決方案。而瑞薩的目標是在現有Arm核的基礎上,透過採用下一代高效能RISC-V核,擴充套件高階SoC和MCU開發能力。
而在SiFive和Kneron兩家公司的背後,都有高通的身影。與此同時,三星、英特爾也是SiFive的投資者,這家公司也被視為Arm的最大潛在競爭對手之一,目前全球十大晶片製造商中有六家是SiFive的客戶。
這意味著,一旦RISC-V架構在汽車前裝市場成為主流選項之一,初創公司與傳統巨頭幾乎都在同一起跑線上,市場競爭同樣會異常激烈。
此外,由於RISC-V架構是開源的,任何人都可以在其上新增自定義指令——這是Arm所禁止的。這為客戶和行業應用提供了一條生產特定設計的個性化道路,除了更低的功耗和更高的效能,意味著,目前相對同質化的SoC市場,有機會出現差異化競爭。
同時,目前軟銀集團仍在尋求出售Arm(此前英偉達宣佈收購Arm,遭到了監管機構的阻力),許多業內人士認為,這是對RISC-V行業的巨大利好推動。
三、
此外,對於不管是純視覺感知,還是多感測器融合感知,視覺(影象處理)能力除了受限於攝像頭畫素、晶片算力,還有很大部分因素涉及到ISP影象處理。
自動駕駛晶片的核心邏輯是先看清楚、才能看得懂,當前智慧汽車所用的攝像頭數量不斷增加,畫素也越來越高,資料量巨大,需要高能效比神經網路加速器把周圍真正的目標識別出來。但如何清楚地感知周圍的環境,還需要比較好的影象處理。
從特斯拉的工程師招聘清單,我們可以看到,影象質量調優工程師是經常可以見到的崗位,負責鏡頭、攝像頭模組選型及開發、質量監控、攝像頭校準、影象質量評估和最佳化調整。
其中,這些工程師要負責調整影象訊號處理器(ISP)和攝像頭引數,在各種光照條件下獲得最佳質量的影象。此外,特斯拉的FSD晶片也集成了一個影象訊號處理器(24位管道),用於處理8個攝像頭採集的資料,每秒處理高達10億畫素以及相應的降噪功能。
而在手機行業,ISP處理器的重要性也不言而喻。比如,蘋果手機的內建獨立ISP和影象演算法都是採取的自研策略。此後,包括華為、小米在內的公司也都跟進佈局。
不過,應用於汽車行業的ISP,門檻更高。目前,大部分量產搭載的通用ISP並不是專門為自動駕駛應用開發,所以演算法的相容性會存在瓶頸。但由於800萬畫素攝像頭正在成為高階智慧汽車的首選,這對傳統ISP的頻寬處理能力提成了更高的要求。
以黑芝麻智慧自主開發的ISP為例,頻寬為1.5Gpps,可以在幾毫秒內同時處理6個800萬畫素攝像頭輸入通道。此外,透過採用LED閃爍抑制(LFM)技術,可以有效消除交通燈和汽車LED照明的高頻LED閃爍問題,提升不同照明條件下的交通訊號和車燈識別演算法準確度。
此外, ISP演算法的重要性也是關鍵,尤其是解決夜間弱光環境下的駕駛輔助系統性能與白天的差異。同時,攝像頭模組的適配和調優也至關重要。這一點,特斯拉就是典型成功案例。
更為關鍵的是,傳統攝像頭模組內建ISP的模式,正在逐步被高算力(中央域控)SoC內建高效能ISP所取代。這其中,還要考慮到高畫素攝像頭產生的高熱量。
比如,安波福在去年提出了一套新的解決方案:基於此前的衛星電子架構原理,攝像頭也可以僅保留光學部分和CMOS晶片,將影象處理晶片轉移至域控制器,透過LVDS匯流排以及乙太網來進行資料的傳輸。
同時,高效能ISP被整合到視覺處理器(SoC)中,意味著可以同時處理多個攝像頭資料,實現系統級成本下降。以英偉達Orin為例,硬體部分擁有超高頻寬影象介面,ISP每秒可處理64億畫素。
而TI的第7代ISP,支援更高的位深度,FPD-Link III解決方案可以滿足“衛星”感測器到中央融合處理單元的低成本、可擴充套件要求,一個ISP為多個攝像頭實現更好的光度校準,並確保顏色增益和噪聲過濾器執行在同一時間,使多個攝像頭的檢視拼接更自然。
從中也可以看出,在現有的硬體架構下,視覺處理能力還有很大的提升空間。但前提是,對於從攝像頭資料採集開始,到後端的影象最佳化、資料處理提出了更高的要求。