一位忙碌的上班族準備走出門,卻發現他們把鑰匙放錯了地方,必須翻找成堆的東西才能找到它們。他們迅速篩選雜物,希望自己能弄清楚哪堆東西下藏著鑰匙。
麻省理工學院的研究人員創造了一個機器人系統。該系統RFusion是一個機器人手臂,夾子上連線著攝像頭和射頻(RF)天線。它將天線的訊號與相機的視覺輸入融合在一起,以定位和檢索物品。
研究人員開發的RFusion原型依賴於RFID標籤,RFID標籤是廉價的無電池標籤,可以粘在物品上並反射天線傳送的訊號。由於射頻訊號可以穿過大多數表面(例如可能遮擋鑰匙的髒衣服堆),RFusion能夠找到一堆有標籤的物品。
使用機器學習,機器人手臂會自動鎖定物體的確切位置,移開目標物體頂部的物品,抓住物體,並確定它撿到了正確的東西。相機、天線、機器人手臂和人工智慧完全整合,因此RFusion可以在任何環境中工作,而無需特殊設定。
雖然尋找丟失的鑰匙很有幫助,不過RFusion將來可以有更多更廣泛的應用程式,例如整理倉庫中成堆的貨物以完成訂單,在汽車製造廠識別和安裝元件,或幫助老年人在家裡完成日常任務,儘管目前的原型還不足以快到應用於這些用途。
“能夠在混亂的世界中找到物品的想法是一個我們多年來一直在研究的開放式問題。擁有能夠搜尋一堆東西的機器人是當今工業界日益增長的需求。”電氣工程和計算機科學系副教授、麻省理工學院媒體實驗室訊號動力學小組主任Fadel Adib說:“現在,你可以把它想象成一種關於類固醇的Roomba,但短期內,這可能在製造和倉庫環境中有很多應用。”
傳送訊號
RFusion使用天線搜尋物體,天線將訊號從RFID標籤上彈出(就像陽光從鏡子上反射出來一樣),以識別標籤所在的球面區域。它將該球體與相機輸入相結合,從而縮小了物體的位置。例如,該專案無法位於表中空的區域上。
但一旦機器人大致瞭解了物品的位置,它就需要在房間裡到處擺動手臂,進行額外的測量,以得出確切的位置,這既慢又低效。
研究人員使用強化學習來訓練一個神經網路,該網路可以最佳化機器人到達目標物品的軌跡。在強化學習中,該演算法透過反覆試驗與獎勵系統進行訓練。
“這也是我們的大腦學習的方式。我們從老師、父母、電腦遊戲等那裡得到獎勵。同樣的事情發生在強化學習中。我們讓機器犯錯或做正確的事情,然後進行懲罰或獎勵。這就是機器學習如何學習一些很難建模的東西。”Boroushaki解釋道。
在RFusion的情況下,當最佳化演算法限制了定位物品移動的次數和拾取物品的距離時就會獲得獎勵。
一旦系統確定了確切的位置,神經網路將使用射頻和視覺資訊相結合來預測機器人手臂應該如何抓住物體,包括手的角度和夾持器的寬度,以及它是否必須先移除其他物品。最後它會再掃描一次物體的標籤,以確保它撿到了正確的物件。
穿透雜物
研究人員在幾種不同的環境中測試了RFusion。他們把鑰匙串埋在一個滿是雜物的盒子裡,並將遙控器藏在沙發上的一堆物品下。
但如果他們將所有相機資料和射頻測量輸入強化學習演算法,系統就會不堪重負。因此,根據全球定位系統用於整合衛星資料的方法,他們總結了射頻測量,並將視覺資料限制在機器人正前方的區域。
他們的方法效果很好——RFusion在檢索完全隱藏在一堆東西下的物品時成功率為96%。
“有時,如果你只依靠射頻測量,就會有一個異常值,如果你只依賴視覺,相機有時會出錯。但如果你把它們結合起來,它們會互相糾正。這就是該系統如此強大的原因。”Boroushaki說。
將來,研究人員希望提高系統的速度,使其平穩執行,而不是定期停下來進行測量。這將使RFusion能夠部署在快節奏的製造業或倉庫環境中。Boroushaki說,除了潛在的工業用途外,像這樣的系統甚至可以融入未來的智慧家居,以幫助人們完成各種家務。
“每年,數十億個RFID標籤用於識別當今複雜供應鏈中的物品,包括服裝和許多其他消費品。RFusion方法為自主機器人指明瞭道路,這些機器人可以從一堆混合物品中找到目標物品,並使用RFID標籤中儲存的資料進行分類,這比單獨檢查每個專案要高效得多,特別是當這些專案看起來像計算機視覺系統時,”華盛頓大學副教授Matthew S.Reynolds說道。RFusion方法是機器人在複雜供應鏈中執行的一大進步,在供應鏈中,快速準確地識別和“挑選”正確的物品是按時完成訂單和讓苛刻客戶滿意的關鍵。
本文由升哲科技編譯,轉載請註明。