一篇文章搞懂到底什麼是渲染流水線

本文其實是《Unity Shader入門精要》一書的讀書筆記,書中關於渲染流水線的講解清楚易懂,很是適合做爲Shader學習的入門書籍。自知好記性不如爛筆頭,遂將相關內容再結合本身的一些理解寫做這篇博客記錄下來。編程

咱們將圖像繪製的流程稱爲渲染流水線,是由CPU和GPU協做完成的。通常一個渲染流程能夠分紅3個概念階段,分別是:應用階段(Application Stage),幾何階段(Geometry Stage),光柵化階段(Rasterizer Stage)。函數

應用階段

應用階段是在CPU中進行的,主要任務是準備好場景數據,設置好渲染狀態,而後輸出渲染圖元,即爲下一階段提供所需的幾何信息。什麼是圖元?圖元是指渲染的基本圖形,通俗來說圖元能夠是頂點,線段,三角面等,複雜的圖形能夠經過渲染多個三角形來實現。性能

應用階段可細分爲3個子階段學習

  1. 把數據加載到顯存中。全部渲染所需的數據都須要從硬盤加載到系統內存中(RAM),而後網格和紋理等數據又被加載到顯存(VRAM)。這是由於顯卡對於顯存的訪問速度更快,並且大多數顯卡對於RAM沒有直接的訪問權利。
  2. 設置渲染狀態。好比設置使用的着色器,材質,紋理,光源屬性等。
  3. 調用Draw Call。Draw Call就是一個命令,它的發起方是CPU,接收方是GPU。這個命令僅僅會指向一個須要被渲染的圖元列表,而不會再包含任何材質信息,這是由於咱們已經在上一個階段設置過了。當給定了一個Draw Call時,GPU就會根據渲染狀態和全部輸入的頂點數據來進行計算,最終輸出成屏幕上顯示的那些漂亮的像素。

幾何階段

幾何階段是在GPU上進行的,主要任務是輸出屏幕空間的頂點信息。幾何階段用於處理從上一階段接收到的待繪製物體的幾何數據(能夠理解爲Draw Call指向的圖元列表),與每一個渲染圖元打交道,進行逐頂點,逐多邊形的操做。幾何階段的一個重要任務就是把頂點座標變換到屏幕空間中,再交給光柵化器進行處理。經過對輸入的圖元進行多步處理後,這一階段將會輸出屏幕空間的二維頂點座標,每一個頂點對應的深度值,着色等相關信息。測試

光柵化階段

這一階段也是在GPU上執行的,將會使用上個階段傳遞的數據來產生屏幕上的像素,並輸出最終的圖像。光柵化的任務主要是決定每一個渲染圖元中的哪些像素應該被繪製在屏幕上。它須要對上一個階段獲得的逐頂點數據(例如紋理座標,頂點顏色等)進行插值,而後再進行逐像素處理。能夠這樣理解,幾何階段只是獲得了圖元頂點的相關信息,例如對於三角形圖元,獲得的就是三個頂點的座標和顏色信息等。而光柵化階段要作的就是根據這三個頂點,計算出這個三角形覆蓋了哪些像素,併爲這些像素經過插值計算出它們的顏色。動畫

GPU渲染流水線(幾何階段和光柵化階段)

7e4b37ee-cfbb-424c-9451-3834ea5433f6.jpg

綠色表示徹底可編程控制,黃色表示可配置,藍色表示由GPU固定實現,不可修改。實線表示必須由開發者編程實現,虛線表示該Shader是可選的。下面咱們將分別介紹上圖中的主要子階段。spa

(順便提一下,曲面細分着色器可用於細分圖元,例如將三角面細分紅更小的三角面來添加幾何細節。幾何着色器可決定輸出的圖元類型和個數,當輸出的圖元減小時,實際上起到了裁剪的做用,當輸出的圖元增多或類型改變時,起到了產生或改變圖元的做用)3d

頂點着色器

頂點着色器的處理單位是頂點,輸入進來的每一個頂點都會調用一次頂點着色器。頂點着色器自己不能夠建立或者銷燬任何頂點,並且沒法獲得頂點和頂點之間的關係,例如咱們沒法得知兩個頂點是否屬於同一個三角網格。但正由於這樣的相互獨立性,GPU能夠利用自己的特性並行化處理每個頂點,這意味着這一階段的處理速度會很快。blog

頂點着色器完成的工做主要有:座標變換和逐頂點光照。內存

af562b7f-cc43-4043-a86a-c13b1605b5ee.gif

頂點着色器必須進行頂點的座標變換,須要時還能夠計算和輸出頂點的顏色。例如咱們可能須要進行逐頂點的光照。

座標變換,就是對頂點的座標進行某種變換。頂點着色器能夠在這一步中改變頂點的位置,這在頂點動畫中是很是有用的。不管咱們在頂點着色器中怎樣改變頂點的位置,一個基本的頂點着色器必需要完成的一個工做是,把頂點座標從模型空間轉換到齊次裁剪空間。

97a80074-01a0-46b5-89a8-c499cd6acb3c (1).gif

把頂點座標轉換到齊次裁剪空間後,接着一般再由硬件作透視除法,最終獲得歸一化的設備座標(NDC)。

裁剪

裁剪階段的目的是將那些不在攝像機視野內的頂點裁減掉,並剔除某些三角圖元的面片(面片一般是由一個一個更小的圖元來構成的)。

一個圖元和攝像機視野的關係有3種:徹底在視野內,部分在視野內,徹底在視野外。徹底在視野內的圖元就繼續傳遞給下一個流水線階段,徹底在視野外的圖元不會繼續向下傳遞,由於它們不須要被渲染。而那些部分在視野內的圖元須要被裁剪。例如,一條線段的頂點在視野內,而另外一個頂點不在視野內,那麼在視野外部的頂點應該使用一個新的頂點來代替,這個新的頂點位於這條線段和視野邊界的交點處。

b964b393-8b5e-41b7-8e65-f08bec7d6309.gif

屏幕映射

這一步輸入的座標仍然是三維座標系下的座標(範圍在單位立方體內)。屏幕映射的任務是把每一個圖元的x和y座標轉換到屏幕座標系下,這其實是一個縮放的過程。屏幕座標系是一個二維座標系,它和咱們用於顯示畫面的分辨率有很大關係。

f122a8af-24f2-442d-9618-f7cd83ff7f62.gif

屏幕映射獲得的屏幕座標決定了這個頂點對應屏幕上哪一個像素以及距離這個像素有多遠。

屏幕映射不會對輸入的z座標作任何處理。實際上,屏幕座標系和z座標一塊兒構成了窗口座標系。這些值會被一塊兒傳遞到光柵化階段。

三角形設置

這個階段會計算光柵化一個三角網格所需的信息。具體來講,上一個階段輸出的都是三角網格的頂點,但若是要獲得整個三角網格對像素的覆蓋狀況,咱們就必須計算每條邊上的像素座標。爲了可以計算邊界像素的座標信息,咱們就須要獲得三角形邊界的表示方式。這樣一個計算三角網格表示數據的過程就叫作三角形設置。它的輸出是爲了給下一個階段作準備。

三角形遍歷

三角形遍歷階段將會檢查每一個像素是否被一個三角網格所覆蓋。若是被覆蓋的話,就會生成一個片元。而這樣一個找到哪些像素被三角網格覆蓋的過程就是三角形遍歷,這個階段也被稱爲掃描變換。

三角形遍歷階段會根據上一個階段的計算結果來判斷一個三角網格覆蓋了哪些像素,並使用三角網格3個頂點的頂點信息對整個覆蓋區域的像素進行插值。像素和片元是一一對應的,每一個像素都會生成一個片元,片元中的狀態記錄了對應像素的信息,是對三個頂點的信息進行插值獲得的。

24a72f4b-f25d-4e9c-aa37-ef706da28f01.gif

這一步的輸出就是獲得一個片元序列。須要注意的是一個片元並非真正意義上的像素,而是包含了不少狀態的集合,這些狀態用於計算每一個像素的最終顏色。這些狀態包括了但不限於它的屏幕座標,深度信息,以及其餘從幾何階段輸出的頂點信息,例如法線,紋理座標等。

片元着色器

片元着色器用於實現逐片元的着色操做,輸出是一個或者多個顏色值(即計算該片元對應像素的顏色,但不是最終顏色)。這一階段能夠完成不少重要的渲染技術,其中最重要的技術之一就是紋理採樣。爲了在片元着色器中進行紋理採樣,咱們一般會在頂點着色器階段輸出每一個頂點對應的紋理座標,而後通過光柵化階段對三角網格的3個頂點對應的紋理座標進行插值後,就能夠獲得其覆蓋的片元的紋理座標了。

501c3553-6f95-49ed-8507-c239e8263c0b.gif

根據上一步插值後的片元信息,片元着色器計算該片元的輸出顏色

雖然片元着色器能夠完成不少重要效果,但它的侷限在於,它僅能夠影響單個片元。也就是說,當執行片元着色器時,它不能夠將本身的任何結果直接發送給它的鄰居們。固然導數信息例外。

逐片元操做

逐片元操做階段負責執行不少重要的操做,例如修改顏色,深度緩衝,進行混合等。

這一階段有幾個主要任務

  1. 決定每一個片元的可見性。這涉及了不少測試工做,例如深度測試,模板測試等。
  2. 若是一個片元經過了全部的測試,就須要把這個片元的顏色值和已經存儲在顏色緩衝區中的顏色進行合併,或者所是混合。

3adef744-9c4d-4487-af1f-575080f2e7f6.gif

一個片元,只有經過了全部的測試後,才能和顏色緩衝區中已經存在的像素顏色進行混合,最後再寫入顏色緩衝區。

915acd41-8eaf-4bbb-bf3d-d0a8165cfb7a.gif

模板測試

模板測試,能夠做爲一種丟棄片元的輔助方法,與之相關的是模板緩衝。若是開啓了模板測試,GPU會首先讀取(使用讀取掩碼)模板緩衝區中該片元位置的模板值,而後將該值和讀取到(使用讀取掩碼)的參考值進行比較,這個比較函數能夠是由開發者指定的,例如小於時捨棄該片元,或者大於等於時捨棄。若是這個片元沒有經過這個測試,該片元就會被捨棄。無論一個片元有沒有經過模板測試,咱們均可以根據模板測試和下面的深度測試結果來修改模板緩衝區,這個修改操做也是由開發者指定的。開發者能夠設置不一樣結果下的修改操做,例如,在失敗時模板緩衝區保持不變,經過時將模板緩衝區中對應位置的值加1等。模板測試一般用於限制渲染的區域。另外模板測試還有一些更高級的用法,如渲染陰影,輪廓渲染等。

深度測試

若是開啓了深度測試,GPU會把該片元的深度值和已經存在於深度緩衝區中的深度值進行比較。這個比較函數也是由開發者設置的。一般若是這個片元的深度值大於等於當前深度緩衝區中的值,那麼就會捨棄它。由於咱們總想只顯示出離攝像機最近的物體,而那些被其餘物體遮擋的就不須要出如今屏幕上。若是這個片元沒有經過這個測試,該片元就會被捨棄。和模板測試不一樣的是,若是一個片元沒有經過深度測試,它就沒有權利更改深度緩衝區中的值。而若是它經過了測試,開發者還能夠指定是否要用這個片元的深度值覆蓋掉原有的深度值,這是經過開啓/關閉深度寫入來作到的。

混合

爲何須要混合?渲染過程是一個物體接着一個物體畫到屏幕上的。而每一個像素的顏色信息被存儲在一個名爲顏色緩衝的地方。所以,當咱們執行此次渲染時,顏色緩衝中每每已經有了上次渲染以後的顏色結果,那麼咱們是使用此次渲染獲得的顏色徹底覆蓋掉以前的結果,仍是進行其餘處理?這就是混合須要解決的問題。

對於不透明物體,開發者能夠關閉混合操做。但對於不透明物體,咱們就須要使用混合操做來讓這個物體看起來是透明的。

fe017ed2-709f-4e6f-854f-1670f079f8bd.gif

使用混合函數來進行混合操做。混合函數一般和透明通道息息相關,例如根據透明通道的值進行相加,相減,相乘等。

須要注意的是,上面給出的測試順序並非惟一的,對於大多數GPU來講,它們會盡量在執行片元着色器以前就進行這些測試。可是,若是將這些測試提早的話,其檢驗結果可能會與片元着色器中的一些操做衝突。例如,若是咱們在片元着色器進行了透明度測試,而這個片元沒有經過透明度測試,咱們會經過調用API來手動將其捨棄掉。這就致使GPU沒法提早執行各類操做。所以現代的GPU會判斷片元着色器中的操做是否和提早測試發生衝突,若是有衝突,就會禁用提早測試。可是,這樣也會形成性能上的降低,由於有更多片元須要被處理了。這也是透明度測試會致使性能降低的緣由。

相關文章
相關標籤/搜索