Pieter Abbeel 在 NTECH 2021(NVIDIA 年度內部工程會議)上發表了線上演講,為機器人技術的飛躍制定了路線圖。
機器人技術先驅 Pieter Abbeel 表示,機器人技術需要在 AI 訓練方面實現巨大的飛躍,才能成為我們日常生活中的多功能助手。如今的家用機器人已經擁有成熟的電子和機械系統,但它們缺乏適用於各種情況的 AI 技術。這是因為我們的軟體和 AI 還沒有好到足以讓機器人普及到家庭的程度。
Abbeel 是加州大學伯克利分校的電子工程和計算機科學教授,也是該大學機器人學習實驗室主任和伯克利人工智慧研究(BAIR)實驗室聯合主任。在開展這些工作的同時,這位說話溫和的比利時工程師還在主持機器人大腦播客。
在兼顧各種角色的同時,Abbeel 還在 OpenAI 工作了近兩年。OpenAI 是由本次 GTC 2021 的演講者—— Ilya Sutskever 等科技界名人於 2015 年成立的非營利組織,該組織旨在開發和釋出造福人類的人工通用智慧。
Abbeel 於 2017 年離開 OpenAI 並創辦了 Covariant,開發用於倉庫和工廠機器人自動化技術的 AI。該公司目前已融資 1.47 億美元。在此之前,他與別人共同創辦了 AI 輔助評級初創企業 Gradescope,該公司於 2018 年被收購。
NVIDIA 執行長黃仁勳在機器人技術講座後與 Abbeel 進行了交談,稱他是“地球上最聰明的人之一”。
有大腦的機器人
Abbeel 在講座中提出了他所認為的一個“好的起點”,即如何創造出更有能力、擁有大腦並且可以自己學習新任務的機器人。講座中提到了 Geoffrey Hinton 等許多 AI 研究者的工作為實現這一目標所打下的基礎。
Abbeel 將這一切歸功於深度學習先驅 Yann LeCun,他很看好使用網際網路影片為機器人訓練一個用於預測的大型神經網路這一想法。這個想法需要機器人學習關於這個世界的知識,而且是機器人 AI 的一個重要組成部分。
機器人可以從影片(一連串待辦事項)中學習完整的行為表徵,而僅使用圖片進行訓練存在限制。他表示:“影片預測可能是構建一個良好預訓練神經網路最為缺失的部分。該神經網路在構建後可以迅速用於現實世界中的其他機器人任務。”
文字訓練對機器人也可能十分重要。他表示,機器人可能會從完整的事例中學習如何執行一連串活動,比如根據車主的命令將汽車送到汽車修理工處並處理整個過程,包括駕駛和與修理工商量取車時間。
大多數訓練可透過模擬完成
Abbeel 認為大多數機器人訓練應該在模擬中進行——我們不可能在現實世界中慢慢地訓練機器人,任由機器人撞到各種東西,使其透過試驗和錯誤來學習。
只需要在現實世界中進行少許訓練,就能確保機器人也能在現實世界中做到同樣的事情。“在現實世界中要想收集數百萬個場景非常困難。”
“我們可以透過數千,甚至數百萬次模擬進行訓練,從而在較短的時間內獲得想要的神經網路。這樣做更經濟,而且可以擴大規模、同時執行多項模擬。”
將研究成果轉化為商業成果
在演講結束後與黃仁勳的談話中,Abbeel討論瞭如何將大學研究與商業應用相聯絡。
黃仁勳表示:“在大學裡進行開創性的研究,同時也將這門技術運用於機器人行業,還把它放到了一家真正的公司裡,這樣99%的問題將迎刃而解。”
Abbeel 也認為必須確保客戶對網路效能和賣給他們的產品感到滿意。他認為關鍵在於瞭解所開發的網路、進行大量的測試並獲得統計資料。
他表示 Covariant 目前正在將 Covariant Brain 系統用於倉庫中的貨物取放,並且實現出色的端到端效能至關重要。
“如果不能讓客戶滿意,那麼向他們銷售產品的意義何在?”