sponsored links

神經輻射場去掉「神經」,訓練速度提升100多倍,3D效果質量不減

機器之心報道

編輯:張倩

沒有了神經網路,輻射場(Radiance Fields)也能達到和神經輻射場(Neural Radiance Fields,NeRFs)相同的效果,但收斂速度快了 100 多倍。

2020 年,加州大學伯克利分校、谷歌、加州大學聖地亞哥分校的研究者提出了一種名為「NeRF」的 2D 影象轉 3D 模型,可以利用少數幾張靜態影象生成多視角的逼真 3D 影象。其改進版模型 NeRF-W (NeRF in the Wild)還可以適應充滿光線變化以及遮擋的戶外環境,分分鐘生成 3D 旅遊觀光大片。

神經輻射場去掉「神經」,訓練速度提升100多倍,3D效果質量不減

NeRF 模型 demo。

神經輻射場去掉「神經」,訓練速度提升100多倍,3D效果質量不減

NeRF-W 模型 demo。

然而,這些驚豔的效果是非常消耗算力的:每幀圖要渲染 30 秒,模型用單個 GPU 要訓練一天。因此,後續的多篇論文都在算力成本方面進行了改進,尤其是渲染方面。但是,模型的訓練成本並沒有顯著降低,使用單個 GPU 訓練仍然需要花費數小時,這成為限制其落地的一大瓶頸。

在一篇新論文中,來自加州大學伯克利分校的研究者瞄準了這一問題,提出了一種名為 Plenoxels 的新方法。這項新研究表明,即使沒有神經網路,從頭訓練一個輻射場(radiance field)也能達到 NeRF 的生成質量,而且最佳化速度提升了兩個數量級。

神經輻射場去掉「神經」,訓練速度提升100多倍,3D效果質量不減

  • 論文連結:https://arxiv.org/pdf/2112.05131.pdf
  • 專案主頁:https://alexyu.net/plenoxels/
  • 程式碼連結:https://github.com/sxyu/svox2

他們提供了一個定製的 CUDA 實現,利用模型的簡單性來達到可觀的加速。在有界場景中,Plenoxels 在單個 Titan RTX GPU 上的典型最佳化時間是 11 分鐘,NeRF 大約是一天,前者實現了 100 多倍的加速;在無界場景中,Plenoxels 的最佳化時間大約為 27 分鐘,NeRF++ 大約是四天,前者實現了 200 多倍的加速。雖然 Plenoxels 的實現沒有針對快速渲染進行最佳化,但它能以 15 幀 / 秒的互動速率渲染新視點。如果想要更快的渲染速度,最佳化後的 Plenoxel 模型可以被轉換為 PlenOctree(本文作者 Alex Yu 等在一篇 ICCV 2021 論文中提出的新方法:https://alexyu.net/plenoctrees/)。

神經輻射場去掉「神經」,訓練速度提升100多倍,3D效果質量不減

神經輻射場去掉「神經」,訓練速度提升100多倍,3D效果質量不減

具體來說,研究者提出了一個顯式的體素表示方法,該方法基於一個不含任何神經網路的 view-dependent 稀疏體素網格。新模型可以渲染逼真的新視點,並利用訓練檢視上的可微渲染損失和 variation regularizer 對校準的 2D 照片進行端到端最佳化。

他們把該模型稱為 Plenoxel(plenoptic volume elements),因為它由稀疏體素網格組成,每個體素網格儲存不透明度和球諧係數資訊。這些係數被 interpolated,以在空間中連續建模完整的全光函式。為了在單個 GPU 上實現高解析度,研究者修剪了空體素,並遵循從粗到細的最佳化策略。雖然核心模型是一個有界體素網格,但他們可以透過兩種方法來建模無界場景:1)使用標準化裝置座標(用於 forward-facing 場景);用多球體影象圍繞網格來編碼背景(用於 360° 場景)。

神經輻射場去掉「神經」,訓練速度提升100多倍,3D效果質量不減

Plenoxel 在 forward-facing 場景中的效果。

神經輻射場去掉「神經」,訓練速度提升100多倍,3D效果質量不減

Plenoxel 在 360° 場景中的效果。

該方法表明,我們可以使用標準工具從反問題中進行逼真體素重建,包括資料表示、forward 模型、正則化函式和最佳化器。這些元件中的每一個都可以非常簡單,並且仍然可以實現 SOTA 結果。實驗結果表明,神經輻射場的關鍵要素不是神經網路,而是可微分的體素渲染器。

框架概覽

Plenoxel 是一個稀疏體素網格,其中每個被佔用的體素角儲存一個標量不透明度σ和每個顏色通道的球諧係數向量。作者將這種表徵稱為 Plenoxel。任意位置和觀察方向上的不透明度和顏色是透過對儲存在相鄰體素上的值進行三線性插值並在適當的觀察方向上評估球諧係數來確定的。給定一組校準過的影象,直接使用 training ray 上的渲染損失來最佳化模型。模型的架構如下圖 2 所示。

神經輻射場去掉「神經」,訓練速度提升100多倍,3D效果質量不減

上圖 2 是稀疏 Plenoxel 模型框架的概念圖。給定一組物體或場景的影象,研究者在每個體素處用密度和球諧係數重建一個:(a)稀疏體素(Plenoxel)網格。為了渲染光線,他們(b)透過鄰近體素係數的三線性插值計算每個樣本點的顏色和不透明度。他們還使用(c)可微體素渲染來整合這些樣本的顏色和不透明度。然後可以(d)使用相對於訓練影象的標準 MSE 重建損失以及總 variation regularizer 來最佳化體素係數。

實驗結果

研究者在合成的有界場景、真實的無界 forward-facing 場景以及真實的無界 360° 場景中展示了模型效果。他們將新模型的最佳化時間與之前的所有方法(包括實時渲染)進行了對比,發現新模型速度顯著提升。定量比較結果見表 2,視覺比較結果如圖 6、圖 7、圖 8 所示。

神經輻射場去掉「神經」,訓練速度提升100多倍,3D效果質量不減

神經輻射場去掉「神經」,訓練速度提升100多倍,3D效果質量不減

神經輻射場去掉「神經」,訓練速度提升100多倍,3D效果質量不減

另外,新方法即使在最佳化的第一個 epoch 之後,也能獲得高質量結果,用時不到 1.5 分鐘,如圖 5 所示。

神經輻射場去掉「神經」,訓練速度提升100多倍,3D效果質量不減

分類: 家居
時間: 2021-12-27

相關文章

適合庭院種的“四大名貴樹”,經典美麗寓意好,寓意深遠價值高

適合庭院種的“四大名貴樹”,經典美麗寓意好,寓意深遠價值高
庭院,是中國人的對家的完美詮釋.院子裡有菜.有花.有果,也有樹,春華秋實,恬靜又美好. 不過,院子裡種樹,也要因地而宜,小院種小樹,大院可種一二棵大樹,但一般都會選擇壽命長,寓意吉祥的樹. 下面,來看 ...

當代散文||故鄉的雲與野果

當代散文||故鄉的雲與野果
文/禾子 我的故鄉是章丘南部山區的一個小村莊,它小到包含在相鄰的一個村莊--石匣裡面,不能獨立為行政區劃,但它有自己獨特的生命印記,它的名字叫"相峪口". 印象中,小小的故鄉總是躺 ...

院子裡有空地種上這“三種樹”,不僅美化環境,寓意美好旺家

院子裡有空地種上這“三種樹”,不僅美化環境,寓意美好旺家
自古以來民間對院落內外種植什麼樹木都有諸多講究,不僅要考慮美化環境的需求,還有考慮實用性,另外在還非常看重所帶的寓意好不好.老話說:"桑皂杜梨槐,不宜入陽宅",就是民間比較忌諱的五 ...

農村有些人收楊樹芽,他們收楊樹芽幹什麼用?取之楊樹用之楊板

農村有些人收楊樹芽,他們收楊樹芽幹什麼用?取之楊樹用之楊板
楊樹是近三十年來,農村人特別喜愛種的一種樹,人們愛種的原因非常簡單,因為它長得快,生長期短,所以就經濟方面來說,它較其它樹更容易變成錢,所以這就成為了人們喜歡種的理由. 楊樹木質並不好,生長太快,木質 ...

果皮吃完別扔,這7種果皮,居家派上大用場

果皮吃完別扔,這7種果皮,居家派上大用場
不少人都有吃完果皮就隨手扔掉的習慣,但水果的營養豐富,更渾身是寶,果皮吃完了也別扔,有7種果皮能在居家生活中派上大用場,趕緊收藏起來吧! 一.橘子皮 橘子皮酸酸的,有著明顯的清新氣味,淡淡的橙子香在哪 ...

湖羊肉怎麼這麼好吃!跟著羊倌兒看看“羊村”的“巴適”生活

湖羊肉怎麼這麼好吃!跟著羊倌兒看看“羊村”的“巴適”生活
鄉村振興戰略是黨的十九大提出的一項重大戰略.鄉村振興.產業先行.為了推動區域協調發展.促進共同富裕,國家開展了東西部協作和定點幫扶工作. 2018年,浙江湖州和四川廣安成為了東西部扶貧協作的夥伴,並啟 ...

江蘇的“四大怪菜”,看著就讓人害怕,再聽名字你敢吃嗎?

江蘇的“四大怪菜”,看著就讓人害怕,再聽名字你敢吃嗎?
不得不感慨,生活在中國實在是太幸福了.我國地大物博,美食資源雄厚,食物種類也是豐富多彩.不同的地方具有不同的人文氣息,不同的環境孕育了不同的人,大家的生活方式各異,對於食物的口味也不同.一個地方的有些 ...

秋季給娃吃啥好?營養師發話了:4種蔬菜+1種肉,必吃

秋季給娃吃啥好?營養師發話了:4種蔬菜+1種肉,必吃
你發現了嗎? 古人云:春華秋實,夏蟬冬雪. 春夏冬都是景色和意趣,只有秋天是果實,是吃的東西.大自然用規律告訴你,秋天就是用來吃的. 多數寶寶,在告別炎炎夏日之後,胃口也會猛增,家長們都摩拳擦掌,想要 ...

被美國列為戰略物資,我國農村常見的蓖麻,究竟有什麼用途?

被美國列為戰略物資,我國農村常見的蓖麻,究竟有什麼用途?
我們乍一聽戰略物資這四個字是不是想起的都是飛機.大炮或者是石油.核心技術,事實上,我們一開始想得都不錯,戰略物資是對國計民生和國防有重要作用的物質資料.而隨處可見的蓖麻為何能被美國作為國家機密和戰略物 ...

和田玉手串之福豬手串

和田玉手串之福豬手串
和田玉手串無疑是極美的.它的美,不僅美在青春時尚,還美在充滿寓意,既能裝扮,又能養心.它的款式多樣,種類齊全,總有一款讓你傾心不已,今天就給大家介紹福豬題材的手串. 豬肉是我們生活中離不開的肉製品,它 ...

俗話“庭院有四樹,不貴也能富”,指的是哪四種樹?有何寓意?

俗話“庭院有四樹,不貴也能富”,指的是哪四種樹?有何寓意?
中華文化博大精深,源遠流長,包羅萬千,其中的一個分支,便是俗話,俗話你可以理解為通俗易懂,但是言簡意賅的話語.俗話是經過一代又一代的人們口口相傳流傳至今的,很多俗話,有一定的道理,是古人智慧的結晶,對 ...

又是角蛋白,人類明明自己有,為什麼對動物的角蛋白念念不忘?

又是角蛋白,人類明明自己有,為什麼對動物的角蛋白念念不忘?
人們對角蛋白的獨特癖好,讓大象因牙.犀牛因角.穿山甲因鱗變得極"危". 說來也怪,角蛋白長在人自己身上(頭髮.指甲)就沒了吸引力,長在動物們身上就給它們招惹了殺身之禍.在眾多不幸而 ...

“孟加拉國”現狀,帶你看看真實的孟加拉國

“孟加拉國”現狀,帶你看看真實的孟加拉國
1,孟加拉人民共和國,簡稱"孟加拉國",面積為147570平方公里,人口1.6 億,全國由7個行政區組成,GDP總計3024 億美元,人均GDP1827 美元.東南山區一小部分與緬 ...

人口稀少、經濟落後的西藏,為何能成為西方日夜惦念之地呢?

人口稀少、經濟落後的西藏,為何能成為西方日夜惦念之地呢?
它平均海拔在4000米以上,有著"世界屋脊"的美稱,世界第一高峰珠穆朗峰矗立於此,黃河.長江.瀾滄江.雅魯藏布江等重要河流發源於此,它又被稱為中華文明的重要發源地,它就是西藏. 自 ...

馬奎:內功樁法的四個階段

馬奎:內功樁法的四個階段
內家拳(功),是指習武者不以個人外形優勢為依仗:(身體有多麼強壯.力量多麼過人.肌肉多麼發達等),主要是以開發人體內在心智.精神為目的一種高階練拳方法,他不僅可用於防身自衛,對健康.延年益壽更具有特效 ...

小小木藝,卻是無雙之寶!海南黃花梨三足線圓壺
這件海南黃花梨紫油梨三足線圓壺是我私藏的一件木器! 其經典海黃山水紋環繞相湊,層層線條清晰可見,勾勒出木的年華,器型優美,精緻典雅,材質一流,不可多得! 其規格:長15.5壺肚11.1高10.3cm重 ...

國漫電影《白蛇二》裡寶青坊主的真實身份,居然是九尾狐蘇妲己?

國漫電影《白蛇二》裡寶青坊主的真實身份,居然是九尾狐蘇妲己?
哈嘍大家好,我是館長,今天給大家聊聊國漫電影國漫電影<白蛇2:青蛇劫起>裡面一位嬌小可愛又御味十足的小蘿莉,那就是萬宜超市的老闆娘寶青坊主. 她不僅在白蛇的第一部和第二部都有出現,就連第二 ...

怒放的木裡,美到不真實

怒放的木裡,美到不真實
為什麼說木裡是香格里拉的"心腹"? 為什麼說木裡才是真正的"伊甸園", 連亞當和夏娃都生錯了地方? 為什麼木裡被稱為"最後的香巴拉"? 為什 ...

天涼了,女人有條件多喝“四寶湯”,提升元氣,面如桃花好過秋

天涼了,女人有條件多喝“四寶湯”,提升元氣,面如桃花好過秋
俗話說"一場秋雨一場寒",最近幾天,秋雨淅瀝瀝地下個不停,氣溫驟降,天氣變冷,人們會覺得渾身不舒服,此時喝一些滋補暖身的湯水再合適不過了,一碗熱騰騰的湯水下肚既能驅趕體內的寒氣,又 ...

女版“洪金寶”:從田間“打”到央視舞臺,被稱為“武館黑寡婦”

女版“洪金寶”:從田間“打”到央視舞臺,被稱為“武館黑寡婦”
網友說她是李洪賈,有李連杰的功夫.洪金寶的身材.賈玲的臉蛋和心態. 她是"武館黑寡婦",所到之處,多家武校接連倒閉. 別人家的孩子是寒窗苦讀十餘年,她卻寒窗苦打了十九年. 憑藉一身 ...