工作時,讓windows裡的cortana幫我查詢一個檔案;午休時,讓SIRI用肖邦和巴赫伴我小憩十五分鐘;回到家門口,天貓精靈或小愛同學早就幫我把空調調到了舒適的溫度,亮起燈光迎接你回家……路上?雖然車上也有智慧語音助手,但它除了讓我更焦慮生氣外沒有別的作用,還是算了吧。
實際上,駕駛場景可以說是最適合人工智慧語音助手發揮作用的地方,但太多太多的“人工智慧”變成“人工智障”,讓許多消費者對車載語音助手失去了耐心和信心,讓這項在買車時成為一大賣點,剛提車時興奮不已的功能,沒多久就吃了灰。
車載語音助手並不是“偽需求”
若做一下調查,可能如今的車載語音助手“吃灰”的機率還不小。那麼,車載語音助手是略顯雞肋的“偽需求”嗎?
如果說在其他場景下,語音助手提供的是更多的便利和附加價值,轉到駕駛場景下,語音助手的存在意義理應更大。在道路上開車時,駕駛者的眼和手都是處於忙碌狀態的,交通法規也不允許在駕駛途中分心操作其他電子裝置,語音互動和控制,幾乎是駕駛員唯一可以合法、安全地使用裝置輔助功能的手段。
在車聯網的熱潮之下,如今許多新車都配備了語音助手的功能,但它們除了乍看之下的炫酷功能之外,真的好用嗎?喚醒困難或者無端喚醒、無法識別指令、反應太慢、控制不協調,甚至還有一些廠家自以為是加進去的陪聊、抖機靈的功能……說實在的,半夜獨自開車時突然車裡響起人聲來跟你聊天講冷笑話,其實還是蠻嚇人的。
如何從駕駛場景的實際需求出發,讓車載語音助手能真正變得“好用”,讓消費者“願意用”,恐怕這才是車載語音助手成長的正道。從使用場景和使用者需求的層面來看,車載語音助手絕不是什麼雞肋,也不是什麼偽需求,而是真正能幫助駕駛者解決一些迫切問題的技術。但目前來看,之所以還有許多人不願意用,不是因為這個技術沒有價值,而是因為其還不夠好用。這一點,其實與觸控屏技術剛剛出現時有點像。
在觸控屏手機剛剛問世之時,有許多使用者仍然不願意放棄傳統的實體按鍵手機,甚至還掀起過一波“全鍵盤手機”的熱潮。“觸控屏永遠代替不了實體按鍵”的說法一度被廣泛認可,“缺乏手感”“沒有反饋”“容易誤觸”……這些幾乎都成為了觸控屏的原罪。
但現在呢?除了“老人機”,你幾乎已經找不到不用觸控屏的手機了。因為這些年來,壓力感應、精確觸控和力反饋技術已經非常成熟,再也沒有人抱怨以前的那些問題了。我們同樣可以期待,當車載語音助手的技術變得更加成熟,人機交流變得更加無縫,甚至當它學會自己成長,總有一天我們會離不開它的。
從一款新車,
看看現在的車載語音助手的成長
事實上,在語音助手最重要的“識別”問題上,是存在“語音識別”和“語義識別”兩個技術層次的。語音技術相當於人的嘴巴和耳朵,負責表達和獲取,而語義技術相當於人的大腦,負責思考和資訊處理。車載語音助手的人車互動過程的實現,車輛獲取人的語音又透過語音播報路況這都屬於語音識別的範疇,而對於所獲取到的語音如何理解,路徑如何規劃則是另一套系統。可以說,互動的精準性對語義理解的能力要求很高,擁有優秀的語義識別技術,是成熟的語音助手的重要標誌。
目前上市的新車中,有沒有比較“成熟”的語音助手呢?在最近的一款新車上,我們還真找到了一個極具標誌性意義的例子。
那就是MG ONE上所搭載的斑馬洛神智慧座艙系統。據瞭解,斑馬洛神智慧座艙系統由上汽和阿里攜手,基於AliOS打造,可支援微核心和宏核心及基於SOA的雲端融合框架。斑馬洛神智慧座艙系統內嵌於MG ONE車內30英寸連屏中,具有由達摩引擎驅動的AI語義功能,可實現深度智慧語音互動,還可實現自由跨屏互動、智慧人機互動、深度語義識別、智慧人機共駕等。而MG ONE正是搭載斑馬AliOS智慧座艙作業系統的首個旗艦級車型。
這套系統中的語音助手是由斑馬智行語音團隊打造的最新版本“小跟斑”,它是由斑馬+達摩院+天貓精靈聯合打造,集合了阿里系AI語音領域的最強CP組合。在測試中,這位“小跟斑”不但對於“播放音樂”“導航”等一系列的簡單指令的反應非常迅速,並且還能理解更復雜的對話並作出反應,並進行系列深度對話。與其他語音助手不同的是,“小跟斑”不需要特定的語音指令來啟用,在AI語義的加持下,使用者可以與車機用自然語義互動,如與真人對話一般和車機交流。
更厲害的是,“小跟斑”還具備自己學習自己進化的能力。例如你說虹橋機場,系統並不理解你是要導航區虹橋機場,還是想要搜尋虹橋機場的介紹,當你選擇了導航,那你下次說虹橋機場時,它便會直接開始導航。這種簡單問題AI語義可以做到隨學隨會。如果是複雜的問題,系統還會反饋雲端語義庫訓練學習,7天內答覆進展。
開發團隊:
做一款系統級的語音助手,目標是未來的“人機共駕”
MG ONE所搭載的這套系統,實際上是由上汽集團聯合阿里斑馬智行團隊共同打造的。為了深入探索和了解這款車載語音助手,我們採訪了斑馬智行語音助手研發團隊負責人楊揚。“斑馬對車場景中的語音互動有多年深刻的理解和積累,在語音產品創新方面有豐富的經驗。達摩院在語音核心基礎演算法上業界領先,多次在各種世界級大賽上獲獎,使用斑馬工程/演算法團隊基於其核心能力打造的引擎能力可以站在巨人的肩膀上。天貓精靈多年來深耕於家庭智慧領域,並積累了豐富的技能,可以給斑馬語音補充更多的優勢CP/SP。這種‘三智融合’可以讓斑馬的語音產品產生化學反應,從而帶給使用者不一樣的互動體驗,這也是這款語音助手要達到的一個最初的目標。”可見,在最初的設計中,這款語音助手就有了一個高起點。
此外,語音助手不再是僅僅支援產品經理在後臺定義的功能,而主要是要靠使用者與“小跟斑”的互動來解鎖更多新技能,因為系統的自我學習能力,使用者用得越多,語音助手就會越容易理解和作出反應,簡單來說,就是會“越用越好用”。
斑馬與上汽乘用車聯合開發的語音互動技術,一直在語音領域保持著前沿步伐,連續引領了三個時代的產品,而MG ONE是最新的一代。楊楊介紹,從2016年到2019年是第一代產品,叫做命令式互動,代表產品是YunOS Auto,它是AliOS車載系統前身,代表車型是榮威RX5。這一代產品可以準確理解簡單命令並作出反應,解決駕駛場景下最基本的需求。2019年到2021年是第二代產品,叫做自然對話式互動,代表產品是Venus,代表車型是榮威RX5 Plus和Marvel R。從2021年開始,是以智慧助手式互動為代表的第三代產品,洛神,MG ONE是這個階段的代表車型。
在楊揚看來,如果說觸控式螢幕技術是“解鎖”智慧手機時代的關鍵性互動技術,那麼智慧語音互動技術則是解鎖車聯網和智慧汽車時代的關鍵性技術。而互動技術的發展只有內建並與OS完美結合才能得到最佳的使用者體驗。“可以看看鍵鼠GUI和Windows的結合,觸控GUI和iOS/Android的結合,就不難理解為什麼斑馬的語音技術誕生之日起就和AliOS進行深度融合,成為系統級的能力而不是一個上層的助手應用。因為只有這種技術架構層面的深度融合,才能提供全場景互動的深度融合體驗。這也是斑馬做AliOS的優勢之一。”楊揚認為,這正是他們最大的優勢,也是車載語音技術真正的未來。
至於智慧汽車的大未來,楊揚認為必然是“人機共駕”。未來的語音助手,應該會隨著智慧汽車的不斷髮展,成為“人機共駕”的關鍵技術。智慧汽車未來無論多麼智慧,總需要與車內的人進行各種互動,車輛在未來,不但是代步工具,也是車主的“第二空間”,更將成為真正的夥伴和助手,而這一切的起點,或許就在當下。
好用的語音助手,其實只是MG ONE所定義的“智慧科技”的一個切面,而圍繞這部車,可以看到上汽所構建的未來智慧座駕的基本雛形。而更為難得的是,MG ONE的指導價格僅僅為10.78-12.98萬元,這是一個充分實現了“科技平權”的價位,人人可以輕鬆使用的智慧座駕,才是這個時代的“國民車”。