sponsored links

當機器人碰到沒有訓練過的指示指令,同樣可以執行新任務嗎?

人們可以靈活地在物理環境中操縱物體以實現各種目標。機器人技術的一大挑戰是成功地訓練機器人做同樣的事情,即開發一種能夠根據任意使用者命令執行多種任務的通用機器人。面對現實世界的機器人也不可避免地會遇到新的使用者指令和訓練過程中沒有看到的情況。因此,必須訓練機器人在各種情況下執行多項任務,更重要的是,能夠根據人類使用者的要求解決新任務,即使機器人沒有明確接受這些任務的培訓。

當機器人碰到沒有訓練過的指示指令,同樣可以執行新任務嗎?

現有的機器人研究在允許機器人泛化到新的物件、任務 描述和目標方面取得了長足的進步。. 然而,讓機器人完成描述全新任務的指令在很大程度上仍然遙不可及。這個問題非常困難,因為它需要機器人既能破譯新指令,又能識別如何在沒有任何訓練資料的情況下完成任務。當機器人需要同時處理其他泛化軸時,這個目標變得更加困難,例如場景的可變性和物體的位置。因此,Google提出了一個問題:Google如何才能將值得注意的泛化能力賦予能夠從原始畫素執行復雜操作任務的真實機器人?此外,語言模型的泛化能力能否幫助支援其他領域更好的泛化,例如真實機器人的 視覺運動控制?

當機器人碰到沒有訓練過的指示指令,同樣可以執行新任務嗎?

在CoRL 2021上發表的 “ BC-Z: Zero-Shot Task Generalization with Robotic Imitation Learning ”中,Google提出了一項新研究,研究機器人如何泛化到他們未經訓練的新任務。該系統稱為 BC-Z,包括兩個關鍵元件:

( i ) 涵蓋 100 個不同任務的大規模演示資料集的集合

( ii ) 以任務的語言或影片指令為條件的神經網路策略。

由此產生的系統可以執行至少 24 項新任務,包括需要與以前未一起看到的物件進行互動的任務。Google也很高興釋出 用於訓練Google的策略的機器人演示資料集,以及預先計算的任務嵌入。

當機器人碰到沒有訓練過的指示指令,同樣可以執行新任務嗎?

BC-Z 系統允許機器人完成未明確訓練機器人執行的新任務的指令。它透過訓練策略以將任務描述與機器人的相機影象一起作為輸入並預測正確的動作來做到這一點。

收集 100 個任務的資料 完全泛化到一個新任務比泛化到訓練任務中的保留變化要困難得多。簡而言之,Google希望機器人具有更多的泛化能力,這需要Google在大量不同的資料上訓練它們。

Google透過使用虛擬現實耳機遙控機器人來 收集資料。該資料收集遵循類似於如何教自動駕駛汽車駕駛的方案。首先,人工操作員記錄每個任務的完整演示。然後,一旦機器人學習了初始策略,就會在密切監督下部署該策略,如果機器人開始犯錯誤或卡住,操作員會進行干預並在允許機器人恢復之前進行更正。

這種示範和干預的結合已被證明可以透過減少複合錯誤來顯著提高績效。在Google的實驗中,與僅使用人工演示相比,Google發現使用這種資料收集策略時效能提高了 2 倍。

為 100 個訓練任務中的 12 個收集示例演示,從機器人的角度進行視覺化並以 2 倍速度顯示。

訓練通用策略

對於所有 100 個任務,Google使用這些資料來訓練神經網路策略,將相機影象對映到機器人抓手和手臂的位置和方向。至關重要的是,為了讓這個策略有可能解決超過 100 個訓練任務的新任務,Google還輸入了任務的描述,可以是語言命令的形式(例如,“將葡萄放在紅色碗中”)或影片做任務的人。

當機器人碰到沒有訓練過的指示指令,同樣可以執行新任務嗎?

為了完成各種任務,BC-Z 系統將描述任務的語言命令或執行任務的人的影片作為輸入,如此處所示。

透過在 100 個任務上訓練策略並根據這樣的描述調整策略,Google解鎖了神經網路能夠解釋和完成新任務指令的可能性。然而,這是一個挑戰,因為神經網路需要正確解釋指令,在視覺上識別該指令的相關物件,同時忽略場景中的其他雜波,並將解釋的指令和感知轉化為機器人的動作空間。

實驗結果

在語言模型中,眾所周知,句子嵌入泛化了訓練資料中遇到的概念組合。例如,如果您在“拿起杯子”和“推碗”等句子上訓練翻譯模型,該模型也應該正確翻譯“推杯子”。

Google研究了語言編碼器中的組合泛化能力是否可以轉移到真實機器人上的問題,即能夠組合看不見的物件-物件和任務-物件對。

Google透過預先選擇一組 28 個任務來測試這種方法,其中沒有一個在 100 個訓練任務中。例如,這些新的測試任務之一是拿起葡萄並將它們放入陶瓷碗中,但訓練任務涉及用葡萄做其他事情並將其他物品放入陶瓷碗中。訓練期間,葡萄和陶瓷碗從未出現在同一個場景中。

從數量上看,Google看到機器人可以在一定程度上成功完成 28 個保留任務中的 24 個,這表明其具有良好的泛化能力。此外,Google發現訓練任務的表現和測試任務的表現之間存在明顯的小差距。這些結果表明,簡單地改進多工視覺運動控制可以顯著提高效能。

當機器人碰到沒有訓練過的指示指令,同樣可以執行新任務嗎?

保持任務的 BC-Z 效能,即機器人未經過訓練執行的任務。系統正確解釋語言命令並將其轉化為行動以完成Google評估中的許多工。

這項研究的結果表明,簡單的模仿學習方法可以以一種能夠零樣本泛化到新任務的方式進行擴充套件。也就是說,它顯示了機器人能夠成功執行訓練資料中沒有的行為的第一個跡象。有趣的是,在無基礎的語言語料庫上預訓練的語言嵌入可用於出色的任務調節器。Google證明了自然語言模型不僅可以為機器人提供靈活的輸入介面,而且預訓練的語言表示實際上賦予下游策略新的泛化能力,例如將看不見的物件對組合在一起。

在構建該系統的過程中,Google確認定期人工干預是實現良好效能的一種簡單但重要的技術。雖然未來還有大量工作要做,但Google相信 BC-Z 的零樣本泛化能力是提高機器人學習系統的通用性和允許人們指揮機器人的重要進步。Google在本文中釋出了用於訓練策略的遙控演示,Google希望這將為研究人員提供寶貴的資源,用於未來的多工機器人學習研究。

分類: 財經
時間: 2022-02-13

相關文章

收評:滬指跌1.25%創業板指跌近2%,醫美概念強勢爆發,風電板塊尾盤異動

收評:滬指跌1.25%創業板指跌近2%,醫美概念強勢爆發,風電板塊尾盤異動
金融界網10月12日訊息 週二A股呈現縮量下跌行情,早盤三大指數集體低開低走,跌幅均超過1%:午後市場進一步下挫,三大指數跌幅擴大至2%,尾盤A股止跌小幅反抽. 截至收盤,滬指跌1.25%,報3546 ...

深度重點資訊解讀,方向和風險同步出現

深度重點資訊解讀,方向和風險同步出現
月 下面我們對國家近幾日重點政策和會議進行分解,用資料說明方向和市場風險,請仔細看完.(其中重要內容已經加粗) 一.2021年9月16日,2021世界新能源汽車大會在海南召開.其中主要提到,發展新能源 ...

背景帝湯傑19中3帶翻湖北!曾凡博轟18+7+4蓋帽,北京取開門紅

背景帝湯傑19中3帶翻湖北!曾凡博轟18+7+4蓋帽,北京取開門紅
第十四屆全運會籃球比賽大幕已經正式拉開,在揭幕戰當中,多名遼寧本鋼球員以及大魔王周琦領軍的遼寧男籃以40分的優勢,擊敗了東道主陝西男籃,隨後登場的兩支球隊是北京男籃和湖北男籃,和揭幕戰明顯的強弱差距不 ...

黎明前的黑暗
今天大盤受昨天美股下跌的情緒性因素影響,直接跳空低開,然後一路下殺,空方力量明顯強於多方力量.午後大盤延續了回落走勢,最低下探到了3515點,創出近期新低,尾市在護盤資金與短線抄底資金流入的推動下,出 ...

浪漫!全運會領獎臺上演求婚現場
我能想到最浪漫的事,就是在全運會賽場上向你求婚!9月18日,山東橄欖球運動員馬衝不僅收穫了金牌,還有一聲女友的"我願意". 金牌愛情雙豐收 18日,山東隊在大雨中以26:7擊敗北京 ...

懂手機的人會選這四款手機:各方面無短板 懂的都懂

懂手機的人會選這四款手機:各方面無短板 懂的都懂
[手機中國導購]在知乎上,有這樣一個問題:懂手機的人會選擇一加9 Pro嗎?對此,不少答主表示,他們非常在意手機的螢幕.效能和拍照,而一加9 Pro恰好在這些方面有著出色的表現,因此,他們會考慮這款手 ...

打櫃子用生態板還是顆粒板,怎麼選?聽老師傅一說,慶幸沒選錯

打櫃子用生態板還是顆粒板,怎麼選?聽老師傅一說,慶幸沒選錯
裝修時板材怎麼選?這一定是讓人非常頭痛的問題,而定製廠商推薦顆粒板,而木工推薦生態板,就更不知道怎麼選了. 那麼,到底誰更好?而我們又應該如何選購呢? 於是我請教了一位老師傅,下面我們就一起來看看吧! ...

定製櫃子用哪種板材?木工推薦生態板,定製廠商推薦顆粒板,糾結

定製櫃子用哪種板材?木工推薦生態板,定製廠商推薦顆粒板,糾結
定製櫃子用哪種板材?木工推薦生態板,定製廠商推薦顆粒板,糾結 大牌為啥愛用顆粒板?木工為啥喜歡推薦生態板? 定製櫃子的時候,選顆粒板還是生態板呢? 作為普通的消費者,我們在裝修的時候會遇到很多的問題, ...

恭喜!賈秀全棄用之人踢瘋了,3人破門+2人上演絕殺,女足迎首勝

恭喜!賈秀全棄用之人踢瘋了,3人破門+2人上演絕殺,女足迎首勝
第十四屆全運會女足成年組賽事打響!刺激一夜,賈秀全棄用之人踢瘋了,中國女足三大棄將取得進球+2人同步上演神絕殺!另外由水慶霞執教的女足聯合隊,也在此番全運會揭幕戰中迎來了開門紅. 女足成年組A組第一場 ...

國足決勝越南:近3次交鋒中國隊全勝,越南兩點短板可利用
國慶假期最後一日,中國隊將坐鎮名義上的主場,迎戰越南隊.這是兩隊時隔9年之後的又一次交鋒,在2012年,中國隊曾經以3-0大勝越南隊,而兩隊上一次在正賽中碰面則是在2009年的亞洲盃預選賽中,國足主場 ...

全運會金牌榜:廣東20金第1,山東又要上演反超,遼寧徹底沒落了

全運會金牌榜:廣東20金第1,山東又要上演反超,遼寧徹底沒落了
隨著第14屆全運會迎來美輪美奐的開幕式,各項賽事進入了全力衝刺的節奏,乒乓球.舉重等強勢專案迎來比賽日,運動員們也正奮力拼搏,賽出狀態,賽出風格.而全運會的金牌榜也在動態中變化,廣東20金第1,山東又 ...

2號位接班人?戈登點名火箭新星,2優勢1短板尚需提升!該學哈登

2號位接班人?戈登點名火箭新星,2優勢1短板尚需提升!該學哈登
不知不覺中,火箭隊只用了一年時間就幾乎完成了新老交替.杰倫-格林.小波特.泰特.申京等年輕球員的到來,也成功取代了哈登.塔克等老將.現在火箭隊又想將沃爾交易出去,徹底讓休斯頓變成年輕球員的天下,雖然這 ...

澳洲上演“人羊地盤戰”,百萬野山羊吃不完,為何不出口到中國?

澳洲上演“人羊地盤戰”,百萬野山羊吃不完,為何不出口到中國?
說起澳洲,總是很容易被其他物種入侵,經常會有野生動物氾濫的新聞報道,比如野兔氾濫.野豬氾濫等,當然還有今天的主題,野山羊氾濫.這不,澳洲又上演了"人羊地盤戰",百萬野山羊吃不完,中 ...

北京樣板間集中“返工”?你被“貨不對板”的樣板間迷惑過嗎?

北京樣板間集中“返工”?你被“貨不對板”的樣板間迷惑過嗎?
幸福裡百科詞條:北京新房的樣板間在市住建委釋出了<關於進一步規範新建商品住房銷售行為的通知>後,開啟了一輪集中整治,已入市的新盤正在加急"返工"整改樣板間.從前購房者遇 ...

無補大紅酸枝皇宮椅三件套全獨板

無補大紅酸枝皇宮椅三件套全獨板
無補大紅酸枝皇宮椅三件套 全獨板,一木雙開,️拼補 材質:大紅酸枝(交趾黃檀)

新能源車+風電概念,4天3板,半個月股價漲55.89%,還能進場嗎?

新能源車+風電概念,4天3板,半個月股價漲55.89%,還能進場嗎?
一.熱門個股解讀--五洲新春(603667) 二.後市分析 五洲新春(603667)軸承套圈定位中高階產品,穩定供應於世界排名前五位的軸承製造商.其主營業務是軸承.精密機械零部件及各類空調管路的研發. ...

智慧礦山+華為合作,2天2板,2天股價大漲40%,還能進場嗎?

智慧礦山+華為合作,2天2板,2天股價大漲40%,還能進場嗎?
一.熱門個股解讀--梅安森(300275) 二.後市分析 梅安森(300275)是一家主營煤礦安全生產檢測監控裝置及成套安全保障系統的高新技術企業.公司在監測監控與預警技術領域始終走在行業的前列. 該 ...

又一跳水小將橫空出世!10米臺上演水花消失術,有望成下一全紅嬋

又一跳水小將橫空出世!10米臺上演水花消失術,有望成下一全紅嬋
與奧運會不同的是,全運會的賽場對運動員年齡的限制沒有那麼嚴格,因此在跳水比賽裡出現了很多隻有十一二歲的年輕小將.他們雖然非常稚嫩,但是也顯現出了強大的天賦和實力,他們將會成為中國跳水的未來之星.又一跳 ...

全運會上演三盤大逆轉!世界冠軍迎來首勝,山東男乒3-2驚險獲勝

全運會上演三盤大逆轉!世界冠軍迎來首勝,山東男乒3-2驚險獲勝
9月18日,全運會乒乓球男團比賽,山東隊與湖南隊的小組賽,山東隊在0-2落後的情況下,全開源3-2出現了反擊號角,劉丁碩.於子洋各得一分,最終山東隊3-2上演大逆轉獲勝. 頭頂國乒世界冠軍頭銜的於子洋 ...

觀點 | 工信部辛國斌:新能源汽車產業還存在短板,整車成本偏高

觀點 | 工信部辛國斌:新能源汽車產業還存在短板,整車成本偏高
文:懂車帝原創 常思玥 [懂車帝原創 行業] 2021年,新能源汽車在全球範圍內開啟了高速的推廣模式,在這一大背景下,2021世界新能源汽車大會(WNEVC)於9月15日在海南海口召開.3天的活動包含 ...