將自動駕駛技術分為感知、決策、執行三個環節。
- 感知:駕駛員的眼耳鼻等各個感測器,在接收著外界的資訊,承擔著感知的功能;
- 決策:駕駛員的大腦根據感知的資訊,決定進行加減速、轉向等操作,承擔著決策的功能;
- 執行:駕駛員的神經、四肢,以油門剎車與方向盤作為人車互動的兩大媒介,與整個汽車系統一起承擔著執行的功能。
可以看到,有人認為“感知”最核心,有人認為“決策”最核心,究竟哪方更有道理呢?
看下來之後,兩方的主要分歧在於對“感知”這個概念的定義不同。
- 狹義的感知:鐳射雷達、毫米波雷達、攝像頭、超聲波雷達、定位系統測量到的“0”、“1”資料傳輸給大腦。
- 廣義的感知:不僅測量,而且將測量到的“0”“1”翻譯成對決策有意義的語言,比如“前方有行人”、“前方有模糊一片的東西,有30%的可能是障礙物”。
當我們看到桌子上“有一個蘋果”,這不僅是眼睛的功勞,我們的大腦也在一瞬間完成了大量的運算工作。只不過,我們一般還是把“感知到有一個蘋果”歸功於眼睛,因此我們還是採用廣義的感知概念。
這樣的話,我的觀點如下:
- 最核心的是感知。
- 提升決策能力,有助於降低感知需求。
一、核心是感知
其實這和咱們開車的道理是一樣的,在頭腦清醒、不疲勞駕駛、開車穩當的情況下,大部分交通事故都來源於駕駛員的感知出了問題。例如進出隧道的光線變化、夜晚雨天的能見度下降、團霧帶來的能見度突變等。
對自動駕駛來說,它在決策與執行時從來都是“頭腦清醒、不疲勞駕駛、開車穩當”的。所以,只要感知不出問題,自動駕駛不一定能幫你把車開得多快、多好,但起碼不會出問題。
或者說,如果感知的資訊是全面的、確信的,那再去做決策與執行策略,就太簡單了。我發現有朋友在討論夾塞情況下的博弈問題:有人就敢賭你怕刮蹭去維修,而AI不敢,因而AI肯定是必輸的。
這是一個很好的觀點,但並不全面。的確,AI在博弈的時候底牌要弱於強勢的人類駕駛員,但自動駕駛的反射弧時間要遠強於人類駕駛員。
所以,將來AI實裝了博弈策略之後,我們人類駕駛員不應太自信 ——AI的博弈策略可能會非常地“兇殘且狡猾”,而且省去了反射弧的時間,人類駕駛員恐怕沒有勝算。人類駕駛員的唯一勝算可能只是“底牌大”—— 人類駕駛員可以爭一口氣而讓事故發生,AI不敢、沒權利這麼做。
二、提升決策能力有助於降低對感知的需求
前一段,試駕小鵬P5的城市NGP。眾所周知,它在側前方的感知非常靈敏,因為有2顆鐳射雷達:
所以,當它重點感知側前方的物體來做決策時,就會顯得非常果斷。例如下面的躲避腳踏車並果斷加速透過的動圖:
試乘的十幾公里的6次接管中,大部分情況都是“主動夾塞”失敗! 也就是說,當側前方的車輛向前移動時,P5可以實現靈敏地跟車並夾塞變道;但是,如果這時候側後方車輛跟進博弈,搶佔有利位置時,P5就會束手束腳。
我能明顯感覺到:P5側後方的“視力”遠不如側前方的“視力”——所以在夾塞變道時就不敢非常激進,從而導致失敗。
第一種思路就是像威馬M7一樣,側後方也加強感知能力:
第二種思路就是實裝“近身肉搏策略”與“預測規劃策略",這都屬於決策。
所謂近身肉搏策略,就是上面提到的博弈策略:例如,讓車子突然挪個2釐米,觀察側後方車子的反應,根據反應再決定下一步動作。像AI沒有反射弧,如果動靜非常快,抖個幾抖,可能就把側後方的新手駕駛員給嚇住了 ——這是什麼人啊,反應這麼快!
所謂預測規劃策略,就是儘量避免這種情況的發生:仔細回憶一下,其實人類駕駛員遇到這種“主動加塞”的場景,也是非常尷尬的,有時候還要鬥氣;真正的老司機會怎麼做,他會看得很遠,儘量避免這種情況發生、或者在這種情況無法避免時,提前很遠就進入一個有利的博弈位置。
兩種思路都可以實現比較好的“主動夾塞”效果。這也就是為什麼說:提升決策能力有助於降低對感知的需求。