儘管從RTX 20開始,NVIDIA就在GPU中引入了物理光追單元,但是即使在效能更好的RTX 30系列顯示卡上,光線追蹤依然是一個讓人頭疼的遊戲技術。儘管光線追蹤能提升遊戲畫面的真實度,但不可否認的是,這項技術的確要消耗太多的顯示卡資源,往往一個遊戲開啟光線追蹤效果後,整體的幀數下滑甚至能接近50%。所以這項技術至今還沒能成為主流,也是有其原因的,至少AMD和NVIDIA都不敢說自己的顯示卡能在4K高畫質遊戲中開啟光追後,還能非常流暢的執行,哪怕是發燒級產品。
所以現在對圖形核心公司以及遊戲開發人員來說,如何提升光線追蹤的效率是非常關鍵的一環。當然從硬體角度而言,如果AMD和NVIDIA繼續堆疊物理光追單元,以及改善自己的引擎,那自然是一個可行的方案,但是這就意味著顯示卡最終的成本會繼續攀升,甚至達到一個使用者無法接受的價格(當然現在顯示卡的價格也沒法接受……),所以大家更多是想在底層做一些最佳化和改進,這樣更方便效能的提升,也不需要花更多的成本。
NVIDIA的科研人員一直在研究提高GPU 光線追蹤效能的技術。最近有人發現NVIDIA發表了一篇論文,這其中將GPU Subwarp Interleaving視為一項潛力巨大的技術,這項技術可以將實時光線追蹤的效能提升高達20%。當然現在我們還不好說這個技術的具體中文名稱,如果強行翻譯的話,比較合適的是“GPU子曲線交錯”,不過這個還要等NVIDIA給出一個準確的技術名詞才行。
這項技術其實就是更改GPU底層執行模式的一種方法,因為現在GPU渲染影象的時候,在設計方法上就受到光線追蹤的各種限制,GPU現在使用的是SIMD的執行模式,相同的渲染會被打包成一組並行執行,每組其實就是GPU工作時的最小執行單元,NVIDIA將其稱為“warp”。而GPU透過對warp的調動來隱藏渲染停頓,不過在實時的光線追蹤運算中,這種可能會出現問題從而導致效能的損失,而“GPU Subwarp Interleaving”則是解決當前光線追蹤效率不夠的一個方法。
GPU Subwarp Interleaving這項技術如何提升光追效率呢?NVIDIA的描述是:“當一個長延遲操作停止一個warp,並且GPU的warp排程器找不到一個活動的warp來切換時,一個subwarp排程器可以將當前的warp切換到另一個不同的subwarp。”這個說法相當拗口,估計只有對GPU執行機制比較瞭解的人,才能準確理解這個含義。不過簡單來說,就是N卡在調動warp的時候,GPU會更加靈活和快速,提升GPU的工作效率以此來提升光線追蹤的效能。
不過這種底層運作模式的改動,勢必要涉及到架構的細微調整。在NVIDIA的實驗中,更改一些底層架構的圖靈顯示卡,光追效能有明顯的提升,平均達到6.3%的提升,最高則能超過20%的提升。不過很顯然這只是用圖靈顯示卡來做測試,而實際上因為NVIDIA的圖靈GPU比較古老,所以未來即使這項技術上線的時候,也不會支援圖靈顯示卡,包括GTX 10系列和RTX 20系列實際上都不會支援GPU Subwarp Interleaving這項加強光追效能的技術。
目前來看,這項技術會用在安培架構以及NVIDIA下一代顯示卡架構上,也就是RTX 30以及RTX 40顯示卡。雖然這項技術最近才正式披露,但按照慣例,NVIDIA應該是已經研究了很久,所以理論上,安培的架構改進應該已經可以適應這項技術,至於下一代的RTX 40顯示卡更是沒有問題。或許以後RTX 30顯示卡的使用者,只需要更新一個驅動,就能獲得更強的光追效能。