澎湃新聞記者 邵文
“小資料”逐漸熱門,背後是技術演進的自然結果還是“大資料”碰壁後的重新選擇?認知智慧世界裡的“暗物質”是什麼?我們該如何期待和思考通用人工智慧?
“我們是世界上比較早研究大資料問題的團隊,差不多在17年前(2004年)就開始做大資料領域的研究。研究了大概三四年以後就發現大資料存在一些固有的問題,當時預見到這些問題用感知智慧是無法解決的。後來我們就開始嘗試正規化轉換,從2009年開始研究認知智慧。”近日,北京通用人工智慧研究院常務副院長董樂接受澎湃新聞(www.thepaper.cn)採訪時表示。
北京通用人工智慧研究院定位為非營利性的新型研發機構,由北京市政府、科技部支援共建,北京大學、清華大學等單位合作支撐,由全球著名計算機視覺專家、統計與應用數學家、人工智慧專家朱松純教授於2020年籌建並擔任院長。其目標是實現具有自主的感知、認知、決策、學習、執行和社會協作能力,符合人類情感、倫理與道德觀念的通用智慧體。
董樂闡述道,目前大家看到比較多的AI採用的是“大資料+算力+深度學習”正規化,屬於感知層的智慧,在真正產業落地時,當前的感知智慧遇到了很多問題,比如只能做特定的人類事先定義的任務,存在長尾效應、訓練成本高的問題,大量資料標註牽扯到隱私與安全性問題,此外還存在模型的不可解釋、不能交流、演算法偏見等各種問題。
“現在大家慢慢形成了共識,認知智慧可能才是下一個10年人工智慧要重點發展的方向。”董樂教授表示。
怎麼理解認知智慧與感知智慧?
“烏鴉正規化”和“鸚鵡正規化”
日本一位野生動物學家採集了野生烏鴉的很多日常生活習性影片。他發現,當野生烏鴉來到城市,它需要堅果飽腹但又沒有辦法開啟堅果。這時,它有個很偶然的發現,把堅果扔到路上,汽車開過去後堅果被碾碎了,就可以直接過去吃。
但它在去吃的過程中又面臨一個新問題,馬路上很危險,它要怎麼完成這個任務?很聰明的是,它又發現訊號燈,當紅燈的時候,所有車都停下來,它就把堅果扔到斑馬線上,堅果被車輪碾破,等訊號燈指示,車都停了再下來把堅果吃了。
“所有這一系列動作都是它自主完成,透過要解決一個任務——安全吃到堅果,它進行了觀察、推理,發現了交通的規律,然後去執行和決策。我們把這稱之為‘烏鴉正規化’,即“小資料,大任務”正規化。它沒有很高的訓練成本,也不需要太多的資料訓練,但它要完成一個任務目標,所以它是由任務驅動的。”董樂說道。
與“烏鴉正規化”相對的就是“鸚鵡正規化”,鸚鵡需要大量的資料反覆訓練,教給他什麼它就說什麼。它可以不斷重複,但並不理解其中含義,它不能反映現實中的因果邏輯,是“大資料,小任務”正規化。
在認知智慧視野下,人工智慧系統的三個關鍵要素是“架構、任務和資料”。董樂認為,相比於感知智慧所強調的“資料、算力和模型”,這是又向前演進了一步。其中,架構最重要。“就像判斷一個人的能力,並不是來自他掌握了多少知識,而是他有很完整的知識構建模型能力,那麼即便目前擁有的知識不夠多,但到一個新的領域,有了這樣健全的架構也可以迅速習得新知識。我們認為架構是基礎,任務是關鍵,在這個過程中資料起了一部分作用,但並不是全部的作用。”
比如訓練AI完成椅子識別的任務。如果按照感知智慧深度學習的正規化,需要把大量椅子影象中的特徵標註出來,再讓AI學習。但此後,遇到異形的椅子,依然會出現難以識別的情況。“不光是單純的物體識別,在包括無人駕駛和醫療等領域,都會遇到類似的問題。”董樂表示。
但人不需要看過很多椅子也很容易做出是否是椅子的判斷,人是如何做的呢?
董樂概括道,“我們人會把這個任務從單純的物體識別問題上升到對任務的理解的高度。透過視覺感知和物理想象進行判斷,也就是說我們看到它,就可以想象它能不能承受讓我安全地坐,以及坐上去舒不舒服,就這麼簡單。”
董樂曾在BEYOND國際科技創新博覽會的論壇中提到認知智慧世界裡的“暗物質”。她認為,在日常生活中,我們很容易感知到視覺等感官的資訊輸入,但這只是冰山一角。“在感官背後的推理、想象其實發揮了巨大能量,我們將其稱作‘智慧暗物質’。我們會對物理和社會常識進行理解、推理,然後結合時空、因果模型作用在現實場景中,把感知和認知進行融合。”
AI可以學習人類這種把看不見的知識提煉出來的抽象能力,基於這樣“Dark Beyond Deep”的正規化轉化,即透過少量資料完成“大任務”,以少量樣本、簡單標註,做到舉一反百,以感知智慧和認知智慧相結合的方式來理解世界,探索智慧“暗物質”。
對於“小資料”逐漸熱門,背後是技術演進的自然結果?還是“大資料”碰壁後的重新選擇?董樂認為,兩個層面都有。
“我們不否定大資料,大資料在很多場景上確實有很大價值,但是在另外一些場景上怎麼辦?同時還有資料問題,成本問題,能耗問題……用大資料去解決一些根本不用大資料就能解決的問題,其實是非常不科學的。”董樂對澎湃新聞(www.thepaper.cn)表示。
如果粗略對比鸚鵡正規化烏鴉正規化的效能,董樂說道,“鸚鵡正規化可能是2:8,即通用能力大約只有20%,還需要按任務要求對80%的能力進行個性化定製;烏鴉正規化則是8:2,通用能力達到80%,只有20%的能力需要按任務要求進行最佳化迭代。”
對於是否認可人工智慧前進道路中類腦智慧的研究路線,董樂對澎湃新聞(www.thepaper.cn)談到,“如果拋開要解決的問題和任務,單純討論一個技術正規化或者說一種路徑,我認為意義和價值都不大。每一條技術路徑都有它探索和研究的某種必要性,單純去說哪條路徑可能有問題,或者有人有質疑,這都不足為奇,關鍵的是要解決什麼問題,要把任務確定好。”
董樂以登山做比喻,從山腳往山頂有很多路,周圍的風景也不同,過程中要解決的問題也不一樣,現在從山底下往上看的時候,沒有辦法去評判哪條路是最好的。可能只有真正到了上面以後,再回過頭來思考這個問題。
通用人工智慧是像人一樣的“人造智慧”嗎?
2014年,物理學家斯蒂芬·威廉·霍金(Stephen William Hawking)在接受英國廣播公司(BBC)採訪時曾表示了對一個“像人”的人工智慧的擔憂,“製造能夠思考的機器無疑是對人類自身存在的巨大威脅。當人工智慧發展完全,就將是人類的末日。”
此後幾年,霍金也在多次演講中表達了這樣的看法。2017年,霍金在接受英國《泰晤士報》採訪時更是發出警告,“人工智慧進一步發展便可能會透過核戰爭或生物戰爭摧毀人類。人類需要利用邏輯和理性去控制未來可能出現的威脅。”
那麼在當下,我們在討論通用人工智慧時指向的是霍金所擔憂的人工智慧嗎?
中國科學院院士、清華大學人工智慧研究院院長張鈸曾在第五屆中國人工智慧大會上表示,“通用人工智慧的發展是好事,真發展出來了也是喜事,但是這裡不能把通用人工智慧和強人工智慧混淆。”
南京大學人工智慧學院院長周志華曾在《中國計算機學會通訊》2018年第1期《專欄》裡將“強人工智慧”描述為,達到甚至超越人類智慧水平的人造物,具有心智和意識、能根據自己的意圖開展行動的“人造智慧”。“通用人工智慧”則是希望借鑑人類的智慧行為,研製出更好的工具以減輕人類智力勞動,其實質是行為智慧和任務智慧,本質還是“弱人工智慧”,類似於“高階仿生學”。
“人工智慧技術現在所取得的進展和成功,是緣於‘弱人工智慧’而不是‘強人工智慧’的研究”,周志華稱,“從技術上來說,主流人工智慧學界的努力從來就不是朝向強人工智慧,現有技術的發展也不會自動地使強人工智慧成為可能。”
國際人工智慧聯合會前主席、牛津大學計算機系主任邁克爾·伍德里奇(Michael Wooldrige)曾在2016年CCF-GAIR大會報告中說,強人工智慧“幾乎沒有進展”,“幾乎沒有嚴肅的活動”(little progress, little serious activity)。
“通用人工智慧是根據任務驅動,目前在有限邊界內進行的,就像我們人一樣,人的能力也是有邊界的。”董樂對澎湃新聞(www.thepaepr.cn)表示。
什麼樣才能達到真正所說的通用人工智慧?董樂認為,實際上是一個使命,一個方向,它不斷讓智慧體以更加通用化的方式解決問題。第一個體現是,智慧體能夠具備普遍意義上的常識推理能力,大概百分之八九十的任務都能做到準確理解、並能實現。第二是一項技術基本在具有同樣邏輯的場景中都能通用。
“例如在醫療、教育、金融,包括能源等領域都有大量的資源匹配的問題,決策者需要根據有限的資訊實時做出預測,因此分析光快不行,要準確,準確以後還要全面,要分析出原因,這樣才能更清晰更合理,”董樂表示,“我們的認知AI通用智慧體,它起到的作用實際上就是把這些綜合的資訊,更合理化地給到需要的人手裡,幫助決策者,更好、更公平地統籌、分配資源,做出最科學的決策。”
在當下,很多企業也在藉助人工智慧完成智慧化轉型。記者走訪中發現,對於要不要自建AI團隊,很多轉型中的企業是有猶豫的。 “目前會看到很多國家企業也都面臨這樣的問題,一個是資料能不能給,第二是自己的專業能力能不能夠。”董樂對澎湃新聞(www.thepaper.cn)表示。
董樂認為,“如果只是一個企業的應用,應該去跟專業團隊合作。AI人才本身很緊缺,成本很高,如果沒有很強的科學研究和工程化能力,最後會發現投入越來越多但產出不明顯。如果從企業戰略層面考慮要佈局自己的AI團隊,這是另外一個問題。單純從結果的產出導向來說,我認為對於大部分的企業來說沒有必要組建自己的專業AI隊伍,找到一個優秀的專業團隊,搭建好的合作模式,各自做各自擅長的事才是最優解。”
談到AI對人類和社會福祉的幫助,董樂表示,實際上就是用技術的方式打破不平衡的、可能帶來浪費和損耗的資源分配方式,使社會整體的運轉效率得到智慧化提升。“我們認為在未來50年必將產生人工智慧與人類文明的碰撞與融合。其實對所有社會治理者,包括我們每一個人都要去思考,智慧時代的社會,我們要去面臨什麼?”
校對:丁曉