“智慧電動車是AI時代最核心的入口,也是我們進入這個時代的入口。希望我們每個人都大膽去嘗試、去理解、去擁抱最新的科技,擁抱最先進的生產力。誰率先到最先進的技術上來,誰就具備了先發優勢。這個世界上沒有小白鼠,只有優先選擇者!”
(以下內容為《理想汽車的品牌與組織》課程實錄。)
創辦理想汽車,最初的源頭是2013年,也就是我創辦的上一家企業汽車之家IPO以後,我想接下來可以做一件別的事情,可能在汽車之家做,也可能汽車之家承載不了,那就會自己出來做。至於做什麼,還是基於對科技方向的判斷。2013年,我們有一個隱約的感覺,就是整個科技可能會往第三個階段邁進。
我們用馬克思《資本論》的基本概念:生產力、生產關係和生產要素,來解釋科技到底在發生何種變化。這是我們初中政治課本上的知識,我覺得到今天仍然非常適用,尤其在技術、社會發生重大變化的時候,可以幫我們洞察本質。
第一個時代:工業時代
第一個時代的科技是什麼?是工業。農業時代算不上科技時代。在工業之前,全球的人均GDP的波動主要來自於兩種現象,一種叫戰爭,一種叫自然災害,其餘的全球生產力曲線就是平的,沒有太大變化。自從有了工業開始,全球人均GDP迅速上漲,所以工業是人類科技時代的開始。今天我們生活裡80%以上還是工業時代帶來的成果。
工業的生產力的特點是控制,控制是工業的核心,所以工業有了流程,有了流水線。
工業時代所應用的晶片都是按照控制邏輯研發的,系統叫做嵌入式系統,核心的目的都是控制。今天我們70%以上的生活、經濟設計都遵循著工業時代的邏輯,而且會長期存在下去。
工業的生產關係,是少數人把事情想明白,多數人去執行,並配以控制。
控制做得好的公司就發展得非常好。工業時代的企業有一些特點,比如這些企業在設計組織使命或願景的時候往往特別擅長用兩個字,完美,比如The best or nothing,因為在一個線性的生產力上構建完美是很容易的。在工業時代裡出現的各種各樣的領先的管理系統、管理體系,比如六西格瑪,其核心理念就是零缺陷。
工業時代的生產要素是什麼?是資產。
如何去研究分析工業時代的企業?去看資產。比如巴菲特的投資,其實就圍繞著工業時代展開的,他最核心的方式就是先把一家公司的資產做評估,在安全邊界裡投資就是安全的,就有收益。
第二個時代:網路時代
第二個時代的科技是網際網路,而不是計算機。網路時代生產力的特點,是平臺。
像一些科技公司蘋果、微軟,講作業系統,講生態,無論平臺還是生態都是一個網狀的面,《世界是平的》這本書講的就是網路連線的平面,一個二維的,講究應用、軟體、資料連線的效率。處理器一定是可程式設計的,而且複雜程式設計的背後還會有整個開發工具鏈,也是為了讓所有東西連線在一起。計算機只是網際網路的組成部分,在工業時代已經出現計算機了。
在衡量網際網路時代的工作質量的時候,有一個正向的指標:效率。
網際網路想提升效率很容易,比如像谷歌和百度相對於傳統的報紙、廣告的替代效率提升了幾十倍上百倍,只要能夠線上化、數字化的都會帶來幾十倍上百倍效率的提升,而但凡能夠被數字化改造的,網際網路企業對傳統企業基本上是碾壓的,就像阿里去打各種超市那樣,不需要任何競爭,因為是兩種不同維度的生產力之間的較量。
另外一個反向的指標:bug。bug就是某個程式設計會出現一個完全未知的錯誤結果。我們發現,網際網路企業在提使命的時候,有一種變化,叫Better,就是如何變得更好,至於完美根本不可能,哪怕像蘋果這樣的企業,如果我們作為開發者用到iOS beta版的時候基本上就是上千個Bug,上線時它不會把bug都清掉,釋出後有bug,再迭代就好了。網際網路企業在這個時代都是類似的。
網際網路的生產關係也在發生著變化,變成少數人把方向想明白,然後多數人去驗證、去迭代。
網際網路的生產要素是什麼?一個是資料,一個是使用者。衡量一個網際網路企業或科技企業的價值,就是看它的使用者規模有多大,還有它的資料量有多大。所以最頂尖的企業都得自己做雲,因為資料量太大了。
蘋果能持續挖掘使用者的收入,是因為它掌握龐大的使用者量,而往往傳統工業時代的企業不掌握使用者,它跟使用者沒有關係,使用者被掌握在經銷商手裡,這是差別所在。
第三個時代:智慧時代
從2013年開始,第三代科技開始呈現出來了。第三代科技是真正的智慧化,而不僅僅是之前講的智慧化。智慧化意味著三維科技。
大家注意一個現象:2015年進入智慧時代,但是到了2021年,很多事情都是停滯不前的。
舉個例子。我在房間裡有一臺MacBook,一個iPad,一個iPhone,還有一個HomePod,當我喊"Hey siri"的時候,這四個裝置同時啟動了,難受得要死。很多智慧家居產品也是一樣,所有裝置聯在一起,但是你會發現網一斷,路由器重啟一下,所有裝置全都不能用了,全部癱瘓。
問題在哪呢?就出在我們仍在使用二維的方式解決三維的問題、
過去在二維世界裡,我們用裝置是平面的終端行為,我給它發指令,它接收指令。但今天我們要解決空間的問題,空間是個三維問題,和二維的終端的解決方式一定不一樣。
所以,我們當時就想,一個三維的世界到底是什麼樣子,後來想來想去發現,最簡單的方式迴歸到人,人就是三維的生物。
我們把整個智慧時代的進展劃為三個步驟:演算法智慧、感知智慧和認知智慧。
演算法智慧
整個智慧時代是從演算法智慧開始的。
演算法智慧有兩個特點,第一,它用於訓練的資料來自於程式,或者伺服器端的日誌,資料還是二維世界的,但是它會運用機器學習建模的方式進行訓練,從而形成推薦引擎,這方面在中國做得比較好的是位元組跳動。比如抖音,它不停向你學習,把推薦做得越來越準。
演算法智慧相對於過去傳統規則式的程式設計有什麼變化?就是它可以不斷成長,並且向使用者學習,所以它給你推得越來越準。如果靠程式設計的方式去猜你,怎麼猜都猜不準。所以我說這是已經有了初步的智慧,我們稱之為叫演算法智慧。位元組跳動用這個方式打贏了相關企業。
演算法智慧在整個智慧時代只能算2.5維的,它對二維是降維打擊,但它並非是三維的智慧。
感知智慧
有了演算法智慧,有一些產品開始出現了,比如說今天的L2級別的自動駕駛。這時候,就進入了感知智慧。
感知是什麼概念?感知其實就是人的工作方式。我們用眼睛、耳朵連線大腦來獲取這個三維世界的所有資訊,而不是作為一個程式去看日誌資訊。
為什麼人是地球上所有生物裡最智慧的?因為人類的感知器官和大腦結合產生的結果非常強。
比如說,人類的兩隻眼睛配合大腦呈現出來是一個三億畫素的世界,而且是有各個層級的景深。但同樣有眼睛和大腦,蒼蠅大概只能呈現出一個十萬畫素的世界,一些簡單的塊和方位的成像,而且距離很短,大家可以上網查蒼蠅看到的世界是什麼樣的。青蛙看到的世界也和人類不一樣,青蛙只能看動態的,只有動起來青蛙才能看到,靜止的就看不到,而且距離很短。不同生物除了“感測器”不同以外,大腦的水平高低也不一樣。
那麼,這種感知智慧的工作方式,在技術上是否具備?
大量的感測器出現,比如攝像頭、3D建模、鐳射雷達,都是為了獲得三維世界的資訊,從而能夠開始把物理世界數字化,這是一個很大的變化。
我拿今天的L2自動駕駛來舉一個例子,看它是怎麼工作的。
自動駕駛是三維感知,它跑在物理的三維世界裡,所以當感知出現問題的時候,前方兩百米有車沒看到,到十米再看到的時候就晚了,這是感知出了問題。
有了這些感知,接下來要進行決策和判斷,用程式設計的方式行嗎?不行。我們人類已經知道的東西,能夠在程式設計裡覆蓋掉,但不知道的場景就覆蓋不了。每天在路上開車這種瞬息萬變的場景,程式設計的方式可能只能覆蓋10%,比較重要的90%的場景都是覆蓋不了的,所以這時候要抱著方向盤看著前面,這只是輔助駕駛。
三維世界的感知不但是程式設計做不了的,而且也是機器學習做不了的,必須使用深度學習的方式,因為機器學習處理不了三維感知的資料。
感知以後會進行判斷和決策,比如是剎車還是躲開。判斷和決策今天還沒有真正給車下指令,因為現在不僅沒用到深度學習,甚至連機器學習也沒用到,只是用的程式設計。我們要避免AI形成的黑盒子,那樣不安全。
在感知智慧這個階段,控制環節就出現了一個挑戰:人類並不能替代車去做感知,做判斷的時候人不能離開車,還是要握著方向盤。這就是說,我們還在用二維的方式進行邏輯判斷。
決策給出來以後,車的神經系統就像我們自己的神經,配合我們的手和腳,是否轉向、剎車要給出來清晰的指令。執行層面就做得更落後了,程式設計都做不到,因為供應商給我們做了黑盒子,但凡路況不太好的時候,輔助駕駛就不好用,開起來特別不平順,像個新手司機。
感知智慧時代,L2級自動駕駛的三個操作步驟:感知、決策和執行,大概情況是:感知層面在用三維的方式,決策控制層面在用二維的方式,執行層面在用一維的方式。
但感知智慧時代就已經能把很多問題更好地解決了,比如人機結合。為什麼人類喜歡用人機結合?是因為人類在感知的時候要消耗大量的體力和精力。其實我們最多的體力是被感知的過程消耗掉了,而不是被中間決策和執行消耗掉。感知智慧可以讓車輛變得更安全,它提供了一個非常好的人機結合的方式。
感知智慧是一個必要的條件,有了感知智慧才有下一步:認知智慧。
認知智慧
什麼是認知智慧?就是完全變成人的工作方式。
舉個例子,我們學羽毛球,基本上三個步驟。
- 我要經常看別人怎麼打;
- 最好找一個好教練,他會告訴我們在不同的場景以什麼樣的邏輯去處理,什麼樣的球要怎麼去接;
- 必須去訓練,不停、不停地訓練。看是看不會的,跟做題一樣。
大家看,以上三個步驟的本質是什麼。
- 我要經常看別人怎麼打——用我的感官和大腦來進行感知;
- 最好找一個好教練,他會告訴我們在不同的場景以什麼樣的邏輯去處理,什麼樣的球要怎麼去接——用我們的大腦和神經系統來配合做決策;
- 必須得去訓練,不停、不停地訓練——透過我的神經系統和肢體來訓練和反饋,持續最佳化。
人類的決策方式是透過學習進行的,不是透過程式設計的方式。人類的執行方式也是透過學習的方式,而不是透過程式設計、更不是透過一個線性的方式去工作的,所以當蘇炳添遇到一個好的教練,併科學訓練以後,成績就提升了一秒,亞洲人也能跑到十秒以內了。
我們的結論是:只有達到認知智慧才能實現L4級別自動駕駛。
為什麼自動駕駛暫時不能在控制和執行層做到深度學習?很重要的原因是計算能力遠遠不夠。基本測算,可能計算能力要到2000Tops以上,才能勉強接近人類大部分的能力,要做到上億Tops才能跟人類思維方式接近,跟三維的思維方式接近。
當算力足夠強的時候,感知、決策判斷、包括預判、執行層面都會用是深度學習的方式。如果執行跟各種各樣的場景,跟它的決策,跟它的神經系統配合在一起,這就是認知智慧了。
認知智慧會產生一個非常可怕的現象——演算法智慧、感知智慧還是人機結合,而到了認知智慧階段,就是機器直接完成工作,根本不需要人。
如果在一個空間裡,他慢慢跟你互動多了以後,開始給你推各種服務,你有任何問題能給你回答,那就是“鋼鐵俠”的賈維斯。自動駕駛就是真正的機器人,只是它長不出來人形。
接下來,時代會發生很大的變化。
接下來,哪個企業能率先跑通認知智慧,這個企業就會改變全世界——因為管理一臺汽車和管理其他商品沒有區別,管理車內的空間和管理家裡的空間、店面的空間也沒有區別,原理都是透過感知、決策和執行的深度學習來進行的,這是我們看到的整個世界技術發生的變化——智慧電動車會是整個人工智慧的母生態。
我們一位同事問我,在車裡裝了一個攝像頭,使用者試駕的時候,攝像頭能夠很清楚地知道使用者坐在什麼位置、用什麼功能,那麼這算什麼智慧?我回答他:只能算感知智慧,因為這個攝像頭還替代不了車裡的人,你只是跟他做人機結合,把感知能力交給攝像頭,它的感知能力更強、更標準化。
什麼時候能進入下一個階段——認知智慧?無人店。你進去一個無人店,只要看到哪裡,理想同學就知道你關心什麼,就來給你講解,可以對話也可以交流。你一走到門口,理想同學就來服務你試駕,可以開啟車機導航和其他所有功能,最後車輛成交的時候,整個系統自助完成交易,完全不需要人,我覺得這就是進入認知智慧了。
生產力:算力與網路架構+實時作業系統
智慧時代,有哪些東西形成了必要條件,是這個時代才有的?
第一是感知,就是感測器的出現。
無論是攝像頭、鐳射雷達、毫米波雷達、ToF或3D結構光、麥克風,都是為了滿足這個時代而產生的。
第二是AI技術。
AI可以用在工業上改變流程,去做一些機器人的基礎工作,也可以在網際網路上變成推薦引擎,就像抖音。還有一些商品引擎裡推薦也可以用,而且也非常高效。
但AI最大的價值產生於三維結構資料,因為今天任何三維結構資料都是無法靠程式設計處理的,只能透過深度神經網路和機器學習才能實現,透過程式設計實現的一定是二維的東西。
第三是流轉的能源,能源和計算是密不可分的。
計算和資料是密不可分的,這是這個時代的網路架構。車輛座艙是一個應用,自動駕駛是一個大的應用,工廠、店面都是這裡的應用,任何物理世界涉及空間的、能夠被感知到的都可以被改造,而且只要能夠獲得資料,進步速度會超過所有人的預期。
大家思考四個層面:
第一、感知。請問這個世界上有什麼裝置能夠比一輛汽車裝更多的感測器?沒有。車外可以裝感測器,車內也可以裝感測器,同時這樣裝了感測器的一個超級裝置,還可以每年行駛兩萬公里以上,這是對物理世界最全面的感知。車是所有裝置能夠裝感測器和感知能力最強的。
第二、決策。如果放在車上各種域控制器,自動駕駛、智慧座艙、底盤的控制器,意味著車可以裝充足的計算能力,同時這個計算能力又能夠跟所有的網路聯結在一起。它流轉的不止是計算,還流轉著資料,流轉著能源——資料、計算、能量同時在流轉著的裝置裡。沒有任何裝置能跟車進行比,家裡那套網路遠遠沒有辦法跟車比。
第三、執行。車的電子執行機構可以變得越來越好,可以採取自研的方式,掌握資料和控制的細節。同時,車是為數不多的可以大規模向人類學習的裝置。人類天天在使用汽車,他的所有服務需求在跟車進行對話,所以車就是有著最多學習物件的裝置。
最後,無論是感知、決策還是執行都需要能源,車是所有裝置裡能源最充足的,跑起來能夠計算,停下來還能夠計算。手機可不可以?得天天充電,什麼計算都做不了。整個認知智慧的生態一定是來自於智慧電動車,而且一定是電動車,燃油車這事做不了,因為燃油車12伏的電源,算著算著就沒電了。所以我始終在講一個點,如果不是電動就沒有智慧,很多人一直不明白這件事。
以上是第一個,也就是技術層面的問題,就是生產力。
生產關係:共創、共識和共建
生產關係發生了變化,組織變得必須依賴於共創、共識和共建的方式去探索世界。
對於企業而言:
首先,人才儲備會變得更加多樣化,工業人才也有,我們拿智慧化去改變工業;網際網路人才也有,AI人才也有。
同時,長期來看,企業的管理方式會越來越像社群,而且企業的社會化價值會越來越高,商業價值會不斷下降。今天投資人對於造車新勢力,包括特斯拉也沒有很高的利潤要求,而是看我們怎麼發展,能改變什麼,能創造出什麼,不再簡單拿資產來衡量一個公司的價值,這些東西都在發生著變化。
生產要素:3D結構化資料+分散式的計算能力+能源
生產要素是三個:
第一,3D結構化資料。3D結構化資料用於學習和訓練,學習變成最關鍵的,我們透過感知、思考、執行來訓練自己。車和人是一樣的,自動駕駛要獲得感知的資料,要有決策的資料,要有執行的資料,才能去訓練,這三個資料缺一不可。
第二,分散式算力。分散式計算能力越高,價值越高,這時候人在物理世界和數字世界合二為一了,都開始數字化了。
第三,能源。車本身就承載巨大的電能,一臺車上80度到100度電,夠一個家庭用半個月。而且,車停在那或跑在路上都有電,還是非常好的分散式的儲能單元。
車是整個AI時代最核心的入口,也是我們進入這個時代的入口。如果率先到最先進的技術上來,其實就具備了先發優勢。
技術決定一切
第一、我們一定要擁抱最先進的科技,因為不同維度的科技之間沒有可比性。但凡能擁抱最先進的生產力,根本不需要競爭,就會快速碾壓過去,所以永遠擁抱最先進的生產力,這是不容置疑的;
第二、大膽去嘗試、去理解、去擁抱技術,千萬別錯過。你不一定要成為技術專家,不一定要會寫程式碼,但是一定要大膽擁抱這些技術,很多東西一定要去嘗試。舉個例子,大家今天對三維世界有更深度的瞭解,買個VR裝置,你的認知可能提升三年,你對三維世界的感知就完全不一樣了,只需要兩千塊錢。很多人說早期開特斯拉的都是小白鼠,根本不是小白鼠,那叫技術和機會的優先選擇者。
這是我們為什麼創辦理想汽車,以及技術的無與倫比的重要性。