作者 | Don
編輯 | 青暮
作為粵港澳大灣區的第一AI盛會,GAIR大會已成功舉辦五屆,留下眾多精彩、經典和令人驚歎的瞬間。GAIR 2021則延續以往豪華陣容,以1場主旨論壇、2場行業峰會、9場高峰論壇,涵蓋自動駕駛、安防、積體電路、醫療、元宇宙、碳中和、隱私計算、新消費等熱門領域。
在今年的GAIR2021大會上,一個論壇人潮湧動。在這裡觀眾和演講者的思想激烈碰撞,一起探討著人工智慧和機器人的發展方向,這就是——IEEE Fellow 論壇。
本次論壇由IEEE Fellow李世鵬博士擔任主席,邀請到了來自國內外高校和研究所的多位IEEE Fellow:來自清華大學的王昭誠教授,香港科技大學的熊輝教授,京東集團的梅濤博士,香港中文大學的邢國良教授。
踏入2021年,國際上風雲依舊,生活中疫情未了,不管是AI、科技企業還是傳統企業,都面臨進一步的挑戰,也迎來未知的機會。今年的主題為“加速自主創新,重構數智轉型”,設立多個有前瞻性的高峰論壇以探討創新方向,其中IEEE Fellow論壇也在12月10日如約而至。
IEEE Fellow是IEEE授予成員的最高榮譽,在學術科技界被認定為權威的榮譽和重要的職業成就。為幫助科研人員瞭解最新的科學成果,助力學術界和企業界獲取研發的關鍵資訊,往屆GAIR大會已邀請了數十位Fellow做分享。
在今年的IEEE Fellow 論壇中,每位嘉賓的發言依然精彩:
王昭誠教授結合了多年的科研及工業落地經驗,為我們展現了人工智慧技術在未來6G行動通訊中的重要作用。
毫米波通訊熱度很高,但有很多因素阻礙了其廣泛應用,其中功耗、魯棒性、成本等原因最為明顯。如何使用人工智慧技術降低功耗、提高魯棒性、解決成本問題,就是毫米波技術突圍的核心所在。
梅濤博士結合了自己在大型科技公司多年的工作經驗,從生活和應用的角度為我們生動地總結了AI的各種成功應用,也以此由淺入深地介紹了從感知智慧到認知智慧的必要性。
從感知智慧過度到認知智慧是一種宏觀統籌的期望,希望演算法達到從視覺遷移到知覺、觸覺、聽覺等方面的能力。在未來,這是AI發展的大方向。
熊輝教授用清晰的思路和生動的比喻為我們介紹了人工智慧和人類社會的關係。
注意力機制Attention、聚類Clustering、規則化Regularization等等都是簡易工具。它們都是簡易的過程,其目的就是讓我們聚焦到事物的本質——不易。
邢國良教授則為我們展現了物聯網+AI+視覺+自動駕駛的新型融合模式,其為未來的智慧城市、自動駕駛輔助駕駛等領域開拓了新的方向和可能。
以智慧燈柱為代表的路邊基礎設施輔助的自動駕駛挑戰在於有效使用燈柱的感測器輔助車輛的感知。這需要精準的點雲配準技術來利用路邊的鐳射雷達擴充套件車輛的視野。這就像連線了燈柱上的感測器一樣,開了“天眼”。
李世鵬博士為我們詳細介紹了人工智慧和機器人領域上的發展方向,分別從機器學習能力提升、運動智慧的發展、人機諧作的未來以及人群體協作四個方面進行了綜述和展望,具有很強的導向意義。
人工智慧在很大程度上是在模仿人類的認知過程。認知科學的很多觀察和結論,目前還沒有充分被人工智慧所借鑑。比如說人有些智慧是生而知之;人的學習認知過程在早期就會收斂到一個“思路”模型;人是從多源多模態的輸入中學習和進化認知的;人的歸納總結能力往往透過人類示教獲得和完善的等等。因此在未來的機器學習過程中,其可能的發展方向可能是多源和多模態的輸入,加上考慮示教和歸納能力的學習模型。
以下是每位嘉賓的演講要點精編:
王昭誠:AI賦能毫米波波束管理
王昭誠教授
首先由王昭誠教授帶來題為《AI賦能毫米波波束管理》的演講。
王昭誠教授是清華大學長聘教授,IEEE Fellow/IET Fellow,2020年科睿唯安全球高被引科學家,而波束管理正是王教授的個人學術標籤。王教授的研究方向包括面向6G的毫米波/太赫茲無線通訊、面向智慧交通的可見光通訊和AI賦能的智慧通訊。
在演講中,王教授結合了多年的科研及工業落地經驗,為我們展現了人工智慧技術在未來6G行動通訊中的重要作用。6G行動通訊作為未來爆發的焦點話題之一,成為學術和工業界的兵家必爭之地,而AI賦能的智慧通訊成為其核心關鍵技術。
王教授介紹了毫米波在未來6G行動通訊中的重要意義,並著重介紹了融合低頻/毫米波終端的技術挑戰和未來發展趨勢。
毫米波通訊熱度很高,但有很多因素阻礙了其廣泛應用,其中功耗、魯棒性、成本等原因最為明顯。如何使用人工智慧技術降低功耗、提高魯棒性、解決成本問題,就是毫米波技術突圍的核心所在。
王教授介紹了基於深度學習的低頻輔助毫米波波束預測。在使用毫米波進行通訊時,存在著多方面的問題,比如損耗大、成本高、功耗大、魯棒性差等問題。
在王教授的工作中,核心思想為利用毫米波和低頻的直射徑/反射徑達到角的一致性解決上述困難。
首先,在入網的階段,王教授提出可以利用低頻和高頻通道的一致性降低終端功耗:當終端裝置需要利用毫米波鏈路進行高速資訊傳輸時,其功耗較大。因此可以使用低頻估計直射徑是否存在,如果有直射徑的條件下才開啟毫米波服務。
其次,在開啟毫米波服務後,使用低頻預測毫米波波束的到達方向。由於任務的複雜性和多模態特徵,需要使用AI尋找最佳的到達角。王教授透過使用專門設計卷積神經網路、實部/虛部預處理、以及降取樣等組合技術解決上述問題並得到極佳的實驗效果。
隨後,王教授介紹了基於深度學習的低頻輔助毫米波波束跟蹤。利用低頻通道估計資訊,實現毫米波終端的動態跟蹤。特別地,利用LSTM網路來進行平滑跟蹤,LSTM可以估計出通訊中隱藏的重要中間變數,實現快速跟蹤。
最後,王教授介紹了基於深度學習的毫米波快速波束訓練,可以使用功率洩露的寬波速來進行最優波束的估計和掃描。
未來毫米波和人工智慧的應用廣泛,比如無線環境感知和工業物聯網,王教授總結了當前的應用進展,並提出了多項技術挑戰。
梅濤:感知智慧到認知智慧的關鍵蛻變
梅濤博士(線上演講)
第二位演講者是梅濤博士,他的演講題目是《從感知智慧到認知智慧的視覺計算》。
梅濤是IEEE/IAPR Fellow,京東集團副總裁,京東探索研究院副院長。 在演講中,梅博士結合了自己在大型科技公司多年的工作經驗,從生活和應用的角度為我們生動地總結了AI的各種成功應用,也以此由淺入深地介紹了從感知智慧到認知智慧的必要性。認知智慧面臨著多方面的挑戰,而這正是學術和工業界未來的發展方向。相信終有一天,AI能夠脫離領域的束縛,達到像人類一樣多模泛化的程度。
當前的計算機視覺領域發展飛快,多項技術已經可以達到媲美人類甚至超越一般人類的能力。例如影象分類識別、目標定位。同時AI在內容合成(影象生成、圖片描述生成)上進步飛速。但是這畢竟知識感知智慧(學標),並非具有“認知能力”的真正人工智慧(學本)。
在梅濤博士的演講中,他分別介紹了視覺認知技術上的最新技術及應用情況、演算法從感知智慧到認知智慧的必要,以及視覺領域的未來發展方向。
在過去的50年中,計算機視覺領域經歷了巨大的變革。從最初的特徵工程到目前的深度學習,其效能和精度都在同步的提升。最新的計算機視覺技術可以分為標籤識別、目標跟蹤、影片流行為識別、語義分割、文字生成影象、3D視覺感知等領域。
在細粒度的視覺識別研究中,基於各種模型結構技術(例如自注意力機制)已經可以實現精細物體、標籤的識別。而在3D影象處理領域,很多技術能夠輔助將日趨成熟的2D技術遷移至3D領域。在影象的文字描述方法中,很多商品圖片的描述、根據文字自動生成模擬換裝效果的技術也已經大規模使用。
隨後,梅博士結合實際的產品為我們介紹了視覺AI的各種有趣應用,包括基於圖片的商品搜尋、搭配推薦、智慧導播、智慧客服等。這些技術已經深入到我們生活的方方面面。
梅博士介紹道,從感知智慧過度到認知智慧是一種宏觀統籌的期望,希望演算法達到從視覺遷移到知覺、觸覺、聽覺等方面的能力。在未來,這是AI發展的大方向。
在這個過程中,魯棒性、資料偏見等方面的挑戰十分嚴峻。從目標的角度上來說,傳統人工智慧能夠增強人們的認知並且提供輔助。而感知智慧則是希望能夠理解人類的行為,並且擬人進行推理等功能。在能力方面,以前的人工智慧方法希望能夠找到模式,而感知智慧是想將人類的意識和理解進行建模,並且找到解決事情的思路和邏輯。
在這個前進的過程中,需要解決三個核心問題:對結構知識進行建模,模型的可解釋性,以及推理能力的整合。
最後,梅博士介紹了視覺領域的未來發展方向。他認為計算機視覺目前已經行進到技術谷的第四階段尾聲,意味著它可以在未來的兩三年間被工業界大量應用,從而影響我們的生活。
熊輝:AI思想在人性和社會性中的體現
熊輝教授
第三位演講者是熊輝教授,他的演講題目是《人工智慧演算法中的人性和社會性》。
熊輝教授現為香港科學技術大學(廣州)講席教授,人工智慧學域主任;曾在學術休假期間擔任百度研究院副院長並主管5個實驗室。
熊輝教授一直致力於資料探勘、大資料分析等領域的科學研究。在熊教授的演講中,他深入淺出的將人工智慧經典演算法進行更高層級的審視和回顧。他用清晰的思路和生動的比喻為我們介紹了人工智慧和人類社會的關係。如果想真正做好演算法,一定要知道領域知識和專業知識的結合,明白什麼是不易。領域知識能夠告訴我們不易在哪、是什麼。然後做到藝術和哲學的有機平衡,才能做好演算法的應用。
熊教授首先介紹了GAN演算法與人性以至於社會性的關聯。在GAN的世界中,有目標驅動的辨別式學習方法,就像為了考試而背題。還有以學習問題根源為目標的生成式學習方法,即學習問題背後的本質。
而站在個人的層面,我們也需要一個很好的辨別器。不同的人有不同的經歷和選擇。他們有的成功,有的失敗,主要的區分在於自己所使用或經歷的辨別器。好的匡正你的未來,來讓你的人生走在正確的方向上,讓你的資源用在正確的方向上。人生就是一場漫長的演算法,二者一一對應。演算法之所以有用,很大的原因就是它從生活中來,抽象了我們的經驗和哲理。
站在一個系統的宏觀角度來觀察所有的人工智慧演算法,可以將其用易經的理論進行梳理。它們可以分成三個主要類別,不易、簡易和變易。
事物的本質就是不易,是萬事萬物中那些恆定不變的東西。我們最重要的失去學習事物中那些不易的知識樹。那麼如何去把握住這些根本性的不變的東西,就是我們學習的難點。
熊教授介紹道,CNN其實就是一個透過簡易尋找不易的過程。而整合學習Ensemble learning就是民主投票,少數服從多數,讓多數人認可的結果作為最終輸出,這也是一種尋找不易的過程。
而後,熊教授介紹了簡易的過程。注意力機制Attention、聚類Clustering、規則化Regularization等等都是簡易工具。它們都是簡易的過程,其目的就是讓我們聚焦到事物的本質——不易。
大資料帶來的最好的本質提升是讓其“不易”的本質更容易被識別和捕獲,也就是帶來機率本質上的一些資訊的凸顯。其中,分層級的聚類方法類似於資本主義,而k-means方法類似於社會主義。當我們在實際中將兩者結合起來,便是我們的“中國特色社會主義”。它既能堅固市場經濟的靈活性,又能融合社會主義的大局領導力。這便是聚類演算法的社會性表現。
最後熊教授介紹“變易”。這裡面的代表性演算法是強化學習。
強化學習演算法的Agent能夠感知環境的狀態,之後可以採取一些動作,比如動作就是砍樹。當樹砍光,環境變差,就要透過Reward來懲罰我們的Agent。如此一來,人類就知道這樣做不好。因此,人類不光不要砍樹,還要去植樹。如此,就能形成一個良性閉環。人類不斷感知環境並採取行動,這就是強化學習演算法的人性化特點。
在總結階段,熊教授說,只有當我們瞭解了演算法人性和社會性,我們才能發揮演算法的藝術性。而且做演算法一定要有“中庸之道”。我們知道機器學習要在bias和variance之間取得平衡。前者導致過擬合,後者導致欠擬合,任何一種都是我們不能接受,也無法使用的。
邢國良:物聯網與AI的新時代碰撞
邢國良教授(線上演講)
第三位分享者是邢國良教授,他的演講題目是《支援車路協同自動駕駛的實時邊緣系統》。
邢國良現任香港中文大學資訊工程系教授,IEEE Fellow,2006年獲美國聖路易斯華盛頓大學博士學位,並曾在美國密歇根州立大學任助理教授、終身副教授。他領導了多項人工智慧專案,在智慧城市城市、智慧駕駛等領域有著深入的研究。
在演講中,邢教授介紹了支援車路協同自動駕駛的實時邊緣系統。物聯網、自動駕駛和智慧城市作為AI落地的沃土,其蘊含的潛力十分龐大。從邢老師的精彩分享中,我們看到了物聯網+AI+視覺+自動駕駛的新型融合模式,並且為未來的智慧城市、自動駕駛輔助駕駛等領域開拓了新的方向和可能。
自動駕駛在近些年大熱,也成為了未來市場的爆發點。在世界的各大城市中,為了支援自動駕駛也逐漸開始了城市智慧化的升級,包括利用電線杆和燈柱等設施輔助自動駕駛。如此的設計可以提高自動駕駛的安全性,並且降低自動駕駛的成本,這是一個很有意義的方向。
邢教授介紹道,智慧城市中的智慧燈柱,可以在不侵犯使用者隱私的前提下,使用鐳射雷達等下一代智慧感測器實現行人車輛的識別。這樣的裝置也可以用在輔助駕駛和自動駕駛場景中。然而其計算資源通常十分有限。
為了解決這些問題,邢教授提出了基於模型壓縮和優先順序排程的實時AI系統。這種方法針對不同的深度網路進行多級壓縮,而後透過聯合最佳化壓縮級別和優先順序來最佳化執行策略。在經過模型多變體壓縮融合、優先順序聯調等技術後,實際效果十分良好。
邢教授介紹道,以智慧燈柱為代表的路邊基礎設施輔助的自動駕駛挑戰在於有效使用燈柱的感測器輔助車輛的感知。這需要精準的點雲配準技術來利用路邊的鐳射雷達擴充套件車輛的視野。這就像連線了燈柱上的感測器一樣,開了“天眼”。
為了實現這樣的目的,邢教授團隊設計了一個可以找到點雲語義資訊(如路邊的交通標誌)的輕量化方法等。其優點在於精簡了配準所需的資料量,僅需進行語義級別的配準,而不需要傳輸原始鐳射雷達影象,從而降低車輛的算力要求。以上技術已經在邢教授團隊部署的大型智慧燈柱平臺上進行了驗證。
李世鵬:機器人中的人工智慧何去何從?
李世鵬博士現場照片
最後進行演講的是李世鵬博士,他的演講題目是《人工智慧與機器人前沿研究思考》。
李世鵬博士,IEEE Fellow,國際歐亞科學院院士 。李院士歷任深圳市人工智慧與機器人研究院首席科學家和執行院長、科大訊飛集團副總裁及訊飛研究院聯席院長、微軟亞洲研究院創始成員與副院長。
在演講中,李博士介紹了人工智慧和機器人前沿研究的深入思考。機器人作為人類未來社會中不可缺少的重要組成部分,其發展與我們的生活、隱私和便利息息相關。李老師為我們詳細介紹了人工智慧和機器人領域上的發展方向,分別從機器學習能力提升、運動智慧的發展、人機諧作的未來以及人群體協作四個方面進行了綜述和展望,具有很強的導向意義。
首先李博士帶我們瞭解了人工智慧和機器人研究的全景圖。而後對其中的關鍵技術,即機器學習、運動智慧、人機諧作、群體協作進行了介紹。
在這個全景圖裡,核心的三元素是人、人工智慧和與物理世界介面的機器人/物聯網;他們兩兩之間的互動和作用,形成了一個個人工智慧與機器人領域的不同學科和方向;而這些智慧體變得眾多時,群體之間的協作就變的很重要。在AI+機器人領域中,最重要和核心的一個主題便是研究人、機器和環境之間的互動和協作的哲學和方法。李博士介紹說,該領域的研究方向可以分成機器學習、運動智慧、人機諧作和群體協作等基本方向。
在機器學習方面,由於深度學習等演算法對標記資料的嚴重依賴性,模仿人類認知的建模研究成為未來的突破口,因此,認知科學啟發的機器學習或成為人工智慧未來的發展方向。
李博士介紹到,人工智慧在很大程度上是在模仿人類的認知過程。認知科學的很多觀察和結論,目前還沒有充分被人工智慧所借鑑。比如說人有些智慧是生而知之;人的學習認知過程在早期就會收斂到一個“思路”模型;人是從多源多模態的輸入中學習和進化認知的;人的歸納總結能力往往透過人類示教獲得和完善的等等。因此在未來的機器學習過程中,其可能的發展方向可能是多源和多模態的輸入,加上考慮示教和歸納能力的學習模型。
而在機器人的運動智慧方面,李博士介紹說,雖然目前的最先進機器人已經可以執行靈活絲滑的運動控制,但是其計算資源消耗嚴重,因為它基於電機的控制。但是人類是基於肌肉-骨骼-感測-神經的系統中進行低能耗的運動,此時自適應、低耗能、魯棒性、靈活性都得到了體現。
人機諧作也是未來的重要方向。我們目前總是希望AI能夠完成所有任務,完全解放人類。但是就算演算法再強大,仍然有一些邊界情況無法完成。那麼人機協作——“AI不行,UI來補”則是很好的解決方案。即機器只需要知道什麼情況是它無法解決的,此時交給人類即可。
更遠一點,隨著各種智慧機器走進人們的生活,人和機器如何和諧相處,更高效地協同完成任務,又是一個重要的研究課題。在人機增強機體方面,李博士認為,我們可以希望機器人能夠自動感知到人們的需求,恰到好處地執行輔助功能。
最後在群體協作方面,李博士認為演算法可以借鑑人類、動物群體的群體智慧經驗,脫離單獨智慧體的侷限性,做到1+1>>2的卓越效果。
總結
聆聽五位IEEE Fellow的前沿佈道,讓我們對當前人工智慧、物聯網、視覺和機器人領域有了更加深入的理解和認識。在這裡,人工智慧不再變得冰冷,它被賦予了社會性、人性,它的發展聚焦到了生活的每個角落,包括每輛車、每個燈柱、每座樓宇和每臺手機電腦。相信在不遠的未來,AI和機器人的有機結合將會為我們的生活帶來巨大的驚喜!
讓我們期待下一屆的IEEE Fellow 論壇。
GAIR 2021大會首日:18位Fellow的40年AI歲月,一場技術前沿的傳承與激辯
2021-12-10
致敬傳奇:中國並行處理四十年,他們從無人區探索走到計算的黃金時代 | GAIR 2021
2021-12-09
時間的力量——1991 人工智慧大辯論 30 週年紀念:主義不再,共融互生|GAIR 2021
2021-12-12
未來已來,元宇宙比你想象中來得更早丨GAIR 2021
2021-12-12