sponsored links

Meta研究員探索用posed RGB video進行物件檢測、關聯和對映

賦予機器感知推斷3D物件對映的能力能夠幫助人工智慧系統更接近對世界的語義理解。所述任務需要構建場景的一致3D物件對映。在名為《ODAM: Object Detection, Association, and Mapping using Posed RGB Video》的論文中,Meta和阿德萊德大學的研究人員探索了一種利用posed RGB video來進行物件檢測,關聯和對映的方法。

Meta研究員探索用posed RGB video進行物件檢測、關聯和對映


研究人員關注類別級語義重建和物件對映之間的空間,並透過來自姿態RGB幀的3D bounding volume來表示物件。與在影象中使用2D bounding boxs(BBs)類似,3D bounding volume提供了位置和空間的抽象,例如可用於在物件例項錨定資訊。

透過諸如NeRF和GRAF等先進方法來可靠地推斷場景中單個物件的bounding volume和相關檢視是重建、嵌入和描述物件的墊腳石。然而,使用RGB-only影片在3D中定位物件並估計其範圍的任務帶來了眾多挑戰。

首先,儘管2D物件檢測器的深度學習方法取得了令人印象深刻的成功,但由於透視投影中的深度比例模糊性,其精度受到了影響;其次,關於如何將多檢視約束用於3D bounding volume位置和範圍的研究和共識很少。

具體而言,3D volume的表示以及如何制定合適的能量函式依然是一個開放的問題;第三,在多檢視最佳化之前需要解決的關鍵問題是,從不同角度檢測單個3D物件例項的關聯。與SfM或SLAM不同,不正確的關聯會顯著地影響3D物件定位。不過,這一問題在雜亂的室內環境中尚未得到充分的研究。在所述環境中,諸如具有幾乎相同視覺外觀和嚴重遮擋的多個物件是常見的具體問題。深度模糊和區域性觀測使資料關聯問題複雜化。

Meta研究員探索用posed RGB video進行物件檢測、關聯和對映


針對所述問題,Meta和阿德萊德大學的研究人員提出了ODAM。這是全新的框架結合了深度學習前端和多檢視最佳化後端,並旨在解決來自posed RGB video的3D物件對映問題。與RGB-D相比,RGB-only的優點是功耗顯著降低。

團隊假設影象的姿態已知。前端首先檢測感興趣物件,並預測每個物件的2D屬性(2D BB,物件類),以及由六自由度剛性姿態和三自由度比例引數化的3D BB,如圖2所示。團隊指出,RGB-olny方法可以在物件類別的子集中縮小與RGB-D方法的精度差距。

ODAM的目標是在RGB-only影象序列中精確定位物件並估計其bounding volume。如圖2所示,給定RGB幀,前端首先檢測物件並預測其在camera座標幀中的2D和3D屬性。所述檢測與對映中的現有物件例項相關聯,或透過使用GNN解決分配問題而成為新的物件例項。鑑於前端的關聯性,後端系統優化了來自多個關聯2D BB檢測的每個物件的超二次曲面表示,以及來自所有關聯檢視的類別條件物件比例優先順序。

Meta研究員探索用posed RGB video進行物件檢測、關聯和對映


其次,GNN中的注意機制不再只考慮手動資料關聯方法中的成對關係,而是聚合圖中其他節點的資訊,從而實現更穩健的匹配。因此,團隊的GNN可以從場景中的全套物件推斷物件檢測的關聯,如圖2所示。

團隊使用ScanNet和Scan2CAD來評估物件對映的效能。所有實驗均以Nvidia GeForce GTX 1070 GPU執行。單目探測器的執行速度約為10 fps。儘管GNN的推斷時間隨著對映中物件的數量線性增長,但在所有掃描網驗證序列中,GNN的平均執行速度為15 fps。總體而言,ODAM前端可實現約6 fps。使用Pytorch-Adam最佳化器進行簡單的後端最佳化需要20次迭代,耗時0.2秒。

Meta研究員探索用posed RGB video進行物件檢測、關聯和對映


ODAM的關鍵在於:(1)attention-based的GNN,用於對映資料關聯的魯棒檢測;(2)基於超二次曲面的多檢視最佳化,用於根據關聯的2D BB和類觀測值精確估計物件bounding volume。

每個檢測的3D屬性的主要用途是促進新幀和當前全域性3D對映之間的資料關聯。具體來說,團隊開發了一個圖形神經網路(GNN),它將當前幀檢測的2D和3D屬性作為輸入,並將它們與對映中現有的物件例項進行匹配。對於現代GPU,系統的前端在雜亂場景中的平均執行速度是6 fps,如ScanNet中的場景。

ODAM的後端是一個多檢視最佳化,在給定多個關聯的2D BB觀測值的情況下,最佳化每個物件由超二次曲面表示的定向bounding volume。以前的物件集別SLAM框架採用長方體或橢球體作為其物件表示,但它們通常不是通用物件範圍的優秀模型。超二次曲面允許長方體和橢球體(以及圓柱體)之間的混合,因此可以為多檢視最佳化提供緊密的bounding volume。

超二次曲面已用於擬合點雲資料或使用深度網路從單個影象解析物件形狀,而團隊提出了一種根據多個2D BB觀察值來最佳化超二次曲面的方法。除此之外,研究人員同時認識到,在雜亂的室內環境中,由於遮擋,物件檢測器給出的2D BB不是零誤差。團隊在最佳化目標中加入類別條件先驗以提高魯棒性。

Meta研究員探索用posed RGB video進行物件檢測、關聯和對映


使用GNN進行資料關聯的優勢有兩點。首先,可以將不同的屬性(例如2D BB、3D BB、物件類)作為網路的聯合輸入,以提取更具辨別力的特徵進行匹配。

總的來說,這份論文的貢獻有三個方面:

  1. 全新的線上3D物件對映系統ODAM,它集成了以6fps速度執行的深度學習前端和基於幾何體的後端。ODAM是目前在ScanNet中用於複雜室內場景的效能最好的3D檢測和對映純RGB-only系統;
  2. 提出了一種將單檢視檢測與物件級關聯的新方法。所述關聯採用了一種attention-based的GNN,並將檢測的2D和3D屬性作為輸入;
  3. 指出了常用的3D bounding volume表示在多檢視最佳化中的侷限性,並介紹了一種基於物件尺度先驗的超二次曲面最佳化方法,其與以前的方法相比有明顯的改進。

文章來源:映維網

分類: 軍事
時間: 2021-12-08

相關文章

解放戰爭:西南戰役中國軍6個兵團臨陣倒戈!剩下2個結局如何

解放戰爭:西南戰役中國軍6個兵團臨陣倒戈!剩下2個結局如何
在國民黨前線部隊節節敗退後,孤注一擲的蔣介石準備屯兵在西南,伺機"反攻". 1949年,為了將蔣介石這種念頭扼殺在搖籃裡,更為了讓廣大人民脫離國民黨反動統治,人民解放軍發動了&qu ...

砍分機器!安東尼面對全聯盟各隊最高得分:黃蜂62 24隊超40

砍分機器!安東尼面對全聯盟各隊最高得分:黃蜂62 24隊超40
直播吧9月21日訊 今日,美媒LakersDaily曬出了湖人新援安東尼職業生涯面對聯盟各隊砍下的最高分的圖片. 最高分是面對黃蜂拿下的62分,最低的是面對掘金拿下的34分. (逮蝦戶)

贏陝西40分!遼籃U22全運首勝,周琦10+7,郭艾倫趙繼偉輪番喂球

贏陝西40分!遼籃U22全運首勝,周琦10+7,郭艾倫趙繼偉輪番喂球
9月21日,第十四屆全運會U22五人籃球正式打響,小組賽第一場,遼寧98-58戰勝陝西拿到開門紅,40分的分差反應了雙方巨大的實力差距.遼寧男籃是上屆全運會冠軍得主,這次他們希望能夠實現衛冕,拿下東道 ...

寧武大屠殺:日軍變態虐殺4800人,慘烈場景讓八路軍不惜代價復仇

寧武大屠殺:日軍變態虐殺4800人,慘烈場景讓八路軍不惜代價復仇
" 今天,世上所有的罪行都可以在這座城市裡找到."--明妮·魏特琳的凝重地令人窒息的南京日記 據<侵華日軍大屠殺暴行>統計:"日軍在中國進行了154場千人以上 ...

這個編造的故事,試圖給林彪貼金,實際上卻抹黑了林彪

這個編造的故事,試圖給林彪貼金,實際上卻抹黑了林彪
戰爭年代的林彪,智計百出,廟算精準,戰功赫赫,不僅贏得了全軍的尊敬,而且不知迷倒了多少後世擁躉.不過,正如<魔戒>裡所說的那樣:歷史成了傳說,傳說變成了神話.圍繞著林彪,坊間也流傳著許多神 ...

北京地鐵能防原子彈?你不知道的人防工程,關鍵時刻救你命

北京地鐵能防原子彈?你不知道的人防工程,關鍵時刻救你命
如果防空警報響了,你知道往哪躲嗎 2018年1月13日早上8點,剛睡醒的夏威夷居民突然從手機上收到一條即將遭受導彈打擊的警報! ▲緊急警報,夏威夷即將受到彈道導彈攻擊! 當地居民瞬間睡意全無 緊急警報 ...

王陽的低調情史:靠帥氣征服了2個女人,寵妻如命成娛圈一股清流

王陽的低調情史:靠帥氣征服了2個女人,寵妻如命成娛圈一股清流
他是<諜戰之特殊較量>中,溫文爾雅,談吐風趣的AG情報站間諜"林子豪". 他是<無間道>中,混入黑幫內部的臥底警察"子彈". 他是< ...

師長被馬家軍殺害,政委裝成乞丐逃脫,12年後率一個軍報仇

師長被馬家軍殺害,政委裝成乞丐逃脫,12年後率一個軍報仇
1949年8月26日,在彭德懷的指揮下,一野第2.19兵團攻克蘭州,蘭州宣告解放! 一位軍長眼噙熱淚,向西北下跪. 這位軍長就是時任19兵團63軍軍長鄭維山.師長被馬家軍殺害,政委裝成乞丐逃脫,12年 ...

講個小時候的故事,你們聽過嗎?

講個小時候的故事,你們聽過嗎?
清末時期,有個書生,名字無人記得,就叫他張生吧.張生家境一般,父母除了種田,還靠著手藝補貼家用,供張生唸書.張生長得眉清目秀,看上去一副文文弱弱的樣子,實際上膽子很大,他的三五好友經常約他晚上喝酒,他 ...

電影《長津湖》中的伍千里連長,之前在淮海戰場到底經歷了什麼?

電影《長津湖》中的伍千里連長,之前在淮海戰場到底經歷了什麼?
文|三將軍 最近熱播的電影<長津湖>中,由吳京飾演的男主人公"鋼七連"連長伍千里,曾幾次與戰友提起淮海戰場上的經歷,如進攻並戰勝數倍於己方的敵人.繳獲敵人的榴彈炮.兄弟 ...

轟44+9記三分,熱火水花大爆發!火箭雙少空砍32分,豪斯7中0拉胯

轟44+9記三分,熱火水花大爆發!火箭雙少空砍32分,豪斯7中0拉胯
繼季前賽首戰大勝老鷹,取得開門紅後,馬不停蹄的邁阿密熱火隊此役又奔赴休斯頓,挑戰實力不容小覷的青年軍火箭隊. 熱火隊方面,巴特勒此役迎來複出,主教練斯波爾斯特拉也順勢擺出了阿德巴約+PJ·塔克+鄧肯· ...

都說王楚然vs劉亦菲傻傻分不清,看完對比照:我信了

都說王楚然vs劉亦菲傻傻分不清,看完對比照:我信了
不知從何時開始,"劉亦菲"已經成為一個形容詞. "你長得很劉亦菲"成為誇獎美女的"高級別"形容,在00花都紛紛湧現的當下,一個85花的顏值卻 ...

季前賽-字母哥8+9+6米德爾頓14分雄鹿輕取雷霆

季前賽-字母哥8+9+6米德爾頓14分雄鹿輕取雷霆
NBA新賽季季前賽繼續進行,最終雄鹿以130-110戰勝雷霆. 首節字母哥上來就瘋狂衝擊內線得分率隊9-0開局!多爾特迅速連中三分止血,隨後雙方一陣瘋狂對飈!桑德羅.康諾頓和沃拉連中三分拉開分差,雷霆 ...

中國斯諾克黑暗1日!3人出局,00後小將1分未得,慘敗特魯姆普
昨夜今晨,2021年斯諾克北愛爾蘭公開賽繼續進行,中國斯諾克迎來黑暗1日:範爭一.徐思.高陽全部出局,2人被橫掃,00後小將更是被特魯姆普打得1分未得,僅魯寧收到傑米-奧尼爾的退賽禮,不戰而勝直通32 ...

抗日名將王銘章犧牲後:義士贈名貴棺,妻子終生未再嫁,幼子修佛

抗日名將王銘章犧牲後:義士贈名貴棺,妻子終生未再嫁,幼子修佛
"你們快去同敵人拼吧,不要管我,我死在這裡很痛快!" 這句話,是抗日戰爭時期的"川軍代表"王銘章犧牲前留下的最後一句話. 王銘章口中的"這裡" ...

1929年,毛主席妹妹被害犧牲,38年後遺體才被找到,兇手何人?

1929年,毛主席妹妹被害犧牲,38年後遺體才被找到,兇手何人?
1929年8月20日,衡山縣城南門外馬王廟坪上,一個年輕女子全身枷鎖,被幾十個全副武裝的國民黨士兵押解著. 她腰板挺直,彷彿閒庭信步一般,絲毫不見階下囚的落魄之感,而她身邊的十幾個士兵卻是嚴陣以待,緊 ...

父親,您犧牲在哪裡?我的父親任化芝烈士

父親,您犧牲在哪裡?我的父親任化芝烈士
編髮||拂曉哨位(ID:fxsw2021) 來源||[孟秀玲]新四軍四師群英譜18集[任化芝烈士團偵察參謀] 編輯製作||孟秀玲 提供照片||孟秀玲.任亞東 父親,您犧牲在哪裡? --記我的父親任化芝 ...

解放戰爭不為人知真正的轉折點

解放戰爭不為人知真正的轉折點
首發於微信公眾號[貓哥的視界] 在傳統的歷史書中,對解放戰爭轉折點的描述有兩個. 一個是劉鄧千里躍進大別山,這是解放軍戰略反攻的起點: 一個是三大戰役,因為三大戰役幾乎全殲了國民黨在長江以北的全部主力 ...

“海派大佬”陳逸飛:捧紅周莊,與姜文決裂,畫作拍出華人最高價

“海派大佬”陳逸飛:捧紅周莊,與姜文決裂,畫作拍出華人最高價
在2000年之前,滬上文化界,有三位風頭最健的頭面人物,號稱"二陳一餘":餘秋雨.陳丹青.陳逸飛. 他們仨,在文學.藝術.娛樂等領域,都是佔山為王的名流,儼然"海派&qu ...

土匪殘害我軍副師長,王震出動41輛坦克:用大炮和他們講道理

土匪殘害我軍副師長,王震出動41輛坦克:用大炮和他們講道理
抗日戰爭結束,國內滿目瘡痍,大好河山慘遭踐踏,中華大地死傷無數.百廢待興.抗戰14年間,軍隊.平民傷亡高達2100萬人,戰爭之慘烈,令無數家庭家破人亡-- 但從樂觀的角度來看 ,內憂外患的時刻已經過去 ...