[ZZ] KlayGE 遊戲引擎之 Order Independent Transparency（OIT）

時間 2019-11-17

標籤 klayge 遊戲引擎 order independent transparency oit 欄目遊戲简体版

原文原文鏈接

轉載請註明出處爲KlayGE遊戲引擎，本文的永久連接爲http://www.klayge.org/?p=2233web

http://dogasshole.iteye.com/blog/1429665算法

http://www.gdcvault.com/api

2009年AMD在發佈HD 5800的時候也發佈了一個Order Independent Transparency（OIT）的demo，但只有介紹，沒有多少能夠參考的東西。GDC 2010上的OIT and GI using DX11 linked lists纔給出了比較完整的算法細節。雖然說這幾年也有很多新的OIT算法出現，但做爲具備標杆意義的OIT算法，Per-Pixel Linked Lists仍是值得實現到KlayGE的開發版本中，以作對比。數據結構

算法

顧名思義，Per-Pixel Linked Lists的意思就是每一個pixel上一個鏈表，存放屬於該pixel的全部fragment。這種不均勻的數據結構對GPU來講是很要命的。框架

在Per-Pixel Linked Lists中，鏈表須要兩個額外的buffer，一個稱爲fragments buffer，須要是屏幕尺寸的N倍，負責存放全部的fragment；另外一個是start offset buffer，和屏幕尺寸相同，存放每一個pixel的鏈表隊頭。構造出存儲的數據結構後，算法自己就變得很簡單了，只有兩步：ssh

PS計算出shading後的顏色，讓fragments buffer自帶的計數器加一，獲得一個空間後把顏色和深度存進去，同時更新該像素位置對應的start offset buffer。
在post process裏，PS從start offset buffer讀到隊頭，由此索引這個pixel的整個鏈表，根據深度進行排序，而後按順序作alpha blending。

因而可知，該算法只須要在原有流水線PS里加上幾行，同時多一個全屏post process便可完成。全部的fragment只須要通過PS一次，絕無浪費。相對於之前流行的OIT方法Depth Peeling來講，在相同層數的狀況下，Per-Pixel Linked Lists的結果與其徹底相同，並無近似計算，但理論性能要高得多。由於Depth Peeling若是要peeling N層，全部的fragment就要生成N次，並丟棄大部分fragment，就剩下須要剝離的那層fragment。wordpress

實際測試的結果也證明了以前的分析，一樣的結果，在NVS 4200M上，Per-Pixel Linked Lists能夠跑到62.47FPS，而Depth Peeling只能46.05FPS。post