作者:Caleb
痛苦的週一又開始了。
俗話說,知己知彼才能百戰百勝。
如果能清楚地看見坐在辦公室裡的上司在幹什麼,準備什麼時候出來巡視,那簡直就是如虎添翼。
還別說,現在還真有這麼一項技術,能幫助“看”清房間裡的一切。
這就是 非視線(NLOS)成像方法。多年來,研究人員不斷完善這項技術,為了創造出能夠清晰看到角落的相機,由此生成不在視野內的物體影象,或者被障礙物擋住的物體影象。
如今,斯坦福大學計算成像實驗室的研究人員對該技術進行了擴充套件,現在,只需讓一個鐳射點 進入房間,就可以看到裡面可能有哪些實物。
不過這可不是拿來摸魚用的。未來,該技術可以與自動駕駛等技術繫結,這樣司機就能提前發現隱藏在拐角處的潛在危險,提高安全性和避障能力。
https://www.computationalimaging.org/publications/keyhole-imaging/
1 MIT提出“鎖眼成像方法”
其實非視線成像由來已久了,但無法否認,這的確是一項聰明的技術。
此前,該技術已經利用了像地板或牆壁這樣的平面,這些平面一般處於攝像機和被遮擋物體的視線範圍內。然後,一系列來自攝像機的鐳射脈衝,在這些平面的表面上反彈,然後在隱藏的物體上反彈,最終回到攝像機的感測器上。演算法利用光反射的時間生成相機看不到的物體影象。
遺憾的是,這些物體影象的解析度不高,儘管如此還是能一下子確認物體是什麼。
這次,MIT的研究人員對其改善後提出了鎖眼成像(keyhole imaging)的方法。
從命名上我們也可以猜到,要“看”清封閉房間內的物體,我們只需要一個小孔,比如鑰匙孔或窺視孔,讓鐳射束穿過,在裡面的牆上形成一個光點。
與上述過程類似,鐳射會在牆上、房間物體上反彈,無數的光子最終透過小孔口反射回相機,相機利用一個單光子雪崩光電探測器測量它們返回的時間。
如果隱藏物體是靜態的,鎖眼成像無法得到足夠的資訊。為了繞過這個問題,研究人員發現,他們可以用鐳射脈衝成像一個移動的物體,這種鐳射能夠在較長的曝光時間內產生足夠的可行資料,從而為演算法構建物體的影象提供足夠的資訊。
如下圖所示,木製人體模型看起來像幽靈一樣,但當與經過適當訓練的影象識別人工智慧相配時,確定房間裡有一個人(或人形物體)倒是非常可行的。
除了自動駕駛技術外,該項研究未來還可以協助警方偵破案件。比如,要在破門而入前評估某個房間的風險,只需利用牆上的一個小裂縫或窗戶。
同時,這項新技術還可以為自主導航系統提供新的思路。在以前的無損檢測技術不實用的情況下,在威脅之前就發現隱藏的危險因素。
2 利用光傳播和陰影也能還原遮擋物
相關技術在 MIT 中也已有先例。
2019年,MIT 計算機科學與人工智慧實驗室提出,他們能透過細微的陰影和反射重現被遮擋的動作。也就是說,開啟攝像機之後,即使是攝像機視野之外的物體或動作,也可以進行再現。
MIT的研究員們基於視域外的影片投射在附近物體上的陰影,預測出視域外的內容。上面一行顯示的是研究員使用這種方法重現的視覺元素,下面一行則是原始物體。
透過觀察陰影和幾何圖形之間的相互作用,新的演算法可以預測光在場景中的傳播方式,即“光傳輸”。然後,再利用這種傳播方式從觀察到的陰影中估計被隱藏的內容,甚至可以構建真人表演的大致輪廓。
該技術是“被動的”,這意味著對場景沒有鐳射或其他干預,整個過程需要大約2個小時的處理時間。研究人員表示,該技術最終有助於重現視線之外的場景,包括但不限於上述應用。
“透過使用非視距成像裝置(例如鐳射器)可以完成許多工,但是在我們的方法中,只能使用自然到達相機的光線,並嘗試充分利用這些稀缺的資訊,”前CSAIL博士後、NVIDIA現任研究科學家,新技術首席研究員Miika Aittala表示, “鑑於神經網路的最新進展,這似乎是一個很好的時機,可以解決在這個領域以前被認為是無法解決的一些挑戰。”
為了捕獲這些看不見的資訊,團隊使用了細微的間接照明提示,例如被觀察區域雜亂的陰影和高光。在某種程度上,一堆雜物的行為有點像針孔照相機,類似於在小學科學課中可能會製作的東西:它阻擋了一些光線,但允許其他光線透過,並且無論在何處,它們都描繪出周圍環境的影象。
但如果針孔相機被設計為僅允許透過足以形成可讀影象的光線,那麼一堆雜亂的雜物會產生無法識別的的影象、(透過光傳輸)被擾亂的陰影的複雜運動。
可以將雜物想像成一面鏡子,使我們可以看到周圍的環境,尤其是在無法直接看到的角落。這個演算法所解決的挑戰是要弄清並理解這些照明的提示。
怎麼樣,是不是又“學廢了”?
種種跡象表明,或許,我們離擁有“透視眼”的那天真的不遠了。