這是一份文件草稿,在正式發佈前將會有很大的變化。不要依賴它當前的內容。算法
本文檔指定開放媒體聯盟AV1編解碼器比特流格式和解碼過程。緩存
AC coefficient服務器
任何頻域索引在至少一個維度上爲非零的變換系數oop
Altref編碼
(Alternative reference frame)能在幀間編碼中使用的幀spa
Base layer設計
spatial_id和temporal_id都等於0的層code
Bitstreamorm
由編碼幀序列產生的比特序列視頻
Bit string
比特數目有限的有序字符串,最左邊的位是MSB,最右邊的位是LSB
Block
由一個亮度和兩個色度矩陣組成的正方形或長方形像素區域
Block scan
量化係數的指定順序
Byte
一個8位比特串
Byte alignment
一個位相較於比特流開始的位置是8的整數倍那麼這個位就是字節對齊的
CDEF
(Constrained Directional Enhancement Filter)設計用來基於識別方向的自適應過濾塊
CDF
(Cumulative distribution function)表示一個符號的值小於等於給定水平的機率乘以32768
Chroma
兩個色差信號中的一個樣點值或者一個樣點矩陣,色度符號是U和V
Coded frame
表示進行解碼以前的一個幀
Component
亮度或者兩個色度矩陣中的一個矩陣,也能夠表示它的一個樣點值
Compound prediction
經過將兩個參考幀的預測混合在一塊兒來計算樣點值的一種幀間預測類型
DC coefficient
一個變換系數,其頻域索引在兩個維度都爲零
Decoded frame
由解碼器在比特流中重建的幀
Decoder
解碼過程的一個具體實現
Decoding process
從句法元素推導解碼幀的過程
Dequantization
經過對量子化係數的縮放來得到變換系數的過程
Encoder
編碼過程的一個具體實現
Encoding process
生成符合本文檔描述的比特流,可是具體過程沒有在本規範中指定。
Enhancement layer
spatial_id或者temporal_id大於0的層
Flag
一個二值變量,突出顯示句法元素只能等於0或者等於1
Frame
視頻信號在空間域中的表示,由一個亮度矩陣(Y)和兩個色度矩陣(UV)組成
Frame context
用在解碼過程當中的一系列機率
Frame buffer
一個存儲已解碼幀和相關信息的區域
Golden frame
在幀間編碼中可使用的幀,一般狀況下,golden frame編碼的質量更高,並被用做多個幀間幀的參考
Inter coding
用幀間預測編碼一個塊或者一個幀
Inter frame
經過參考先前解碼幀壓縮的幀,可使用幀內預測或者幀間預測
Inter prediction
利用先前的解碼幀,推導出當前幀的預測值的過程
Intra coding
用幀內預測編碼一個塊或者一個幀
Intra frame
一種只使用幀內預測的幀,能夠獨立解碼
Intra prediction
在同一解碼幀中,利用先前解碼的樣點值,推導出當前樣點預測值的過程
Inverse transform
將變換系數矩陣轉化爲空間樣點值矩陣的過程(獲得殘差係數)
Key frame
一個幀內幀,當它出現時重置解碼過程
Layer
一系列具備相同spatial_id和temporal_id的片組OBUs
Level
對句法元素和變量值定義的一組約束
Loop filter
一種用於重建幀的過濾過程,旨在減小塊效應
Luma
一個樣點值矩陣或單個樣點值,表示與主色相關的單色信號,符號用Y表示
Mode info
在解碼過程當中,包含指示塊如何被預測的塊的語法元素
Mode info block
一個大小爲4x4或者更大的亮度樣點值塊,以及它的兩個相應的色度樣點值塊(若是存在的話)
Motion vector
一個二維矢量,用於將當前幀引用到參考幀,它的值提供了從當前幀的位置到參考幀中位置的座標偏移量
OBU
全部句法結構封包在「開放比特流單元」中,每一個OBU都有一個頭,它爲包含的數據(有效負載)提供標識信息
Parse
從比特流中獲取句法元素的過程
Prediction
預測過程的實現,包括幀內預測和幀間預測
Prediction process
用預測器估計解碼樣點值或數據元素的過程
Prediction value
值,即以前解碼的樣點值或數據元素的組合,用於下一個樣點值或數據元素的解碼過程
Profile
部分句法、語義和算法的子集
Quantization parameter
用於在解碼過程當中縮放量化係數的變量
Quantized coefficient
反量化以前的變換系數
Raster scan
(光柵掃描)將二維矩形光柵映射爲一維光柵,其中一維光柵的入口從二維光柵的第一行開始,而後掃描進入第二行和第三行,以此類推。每一個行從左到右掃描
Reconstruction
解碼得到的殘差和對應的預測值相加
Reference frame
在幀間預測過程當中使用的以前已解碼的幀
Reserved
一種特殊的句法元素值,能夠用來在未來擴展這個部分
Residual
重建值和對應的預測值的差
Sample
構成幀的基本元素
Sample value
樣點的值,對8位幀來講,這是一個0~255的整數;對於10位幀來講,這是一個0~1023的整數;對於12位幀來講,這是一個0~4095的整數
Segmentation map
一個3bit的數字包含了圖像中每一個4x4塊的段關係,每個參考緩存存儲了一個段映射容許新的幀使用以前的已編碼映射
Sequence
編碼比特流的最高層次句法結構,包括一個或幾個連續編碼的幀
Superblock
一個tile中塊四叉樹的最高層次,一個幀中全部超級塊大小都是同樣的而且都是正方形,超級塊能夠是128x128像素或者64x64像素,一個超級塊能夠包含1或2個模式信息塊,或者能夠在每一個方向上平分,建立4個子塊,這些子塊自己能夠被進一步細分,造成塊四叉樹
Switch Frame
一個幀間編碼幀能夠做爲序列切換的點,在不強制使用幀內編碼的狀況下,切換幀會覆蓋全部的幀緩衝區。其目的是容許一個流用例,其中視頻能夠被編碼成小塊(好比1秒的時間),每個都以一個切換幀開始。若是可用帶寬降低,服務器能夠開始從較低的比特率編碼中發送塊,切換後的解碼圖像可能有點不正確,可是這種方法容許一個切換,而不須要一個完整的關鍵幀的成本
Syntax element
在比特流中表示的數據元素
Temporal delimiter OBU
指示接下來的OBUs相對於時間分隔符以前的最後一幀有不一樣的顯示/解碼時間戳
Temporal unit
它由一個時間分隔符OBU和全部跟隨的OBUs組成,但不包括下一個時間分隔符
Temporal group
一組幀,其時間預測結構在視頻序列中週期性地使用
Tile
幀的一個矩形區域,能夠獨立的解碼和編碼,儘管跨tile邊緣的環路濾波仍然適用
Transform block
一種正方形變換系數矩陣,用於反變換過程的輸入
Transform coefficient
頻域中的一個標量值,包含在一個變換塊中
Uncompressed header
解碼幀的高級描述,編碼的時候沒有用算術編碼