AV1 比特流&解碼過程規範-術語和定義

草稿文件

這是一份文件草稿,在正式發佈前將會有很大的變化。不要依賴它當前的內容。算法

1.範圍

本文檔指定開放媒體聯盟AV1編解碼器比特流格式和解碼過程。緩存

2.術語和定義

AC coefficient服務器

任何頻域索引在至少一個維度上爲非零的變換系數oop

Altref編碼

(Alternative reference frame)能在幀間編碼中使用的幀spa

Base layer設計

spatial_id和temporal_id都等於0的層code

Bitstreamorm

由編碼幀序列產生的比特序列視頻

Bit string

比特數目有限的有序字符串,最左邊的位是MSB,最右邊的位是LSB

Block

由一個亮度和兩個色度矩陣組成的正方形或長方形像素區域

Block scan

量化係數的指定順序

Byte

一個8位比特串

Byte alignment

一個位相較於比特流開始的位置是8的整數倍那麼這個位就是字節對齊的

CDEF

(Constrained Directional Enhancement Filter)設計用來基於識別方向的自適應過濾塊

CDF

(Cumulative distribution function)表示一個符號的值小於等於給定水平的機率乘以32768

Chroma

兩個色差信號中的一個樣點值或者一個樣點矩陣,色度符號是U和V

Coded frame

表示進行解碼以前的一個幀

Component

亮度或者兩個色度矩陣中的一個矩陣,也能夠表示它的一個樣點值

Compound prediction

經過將兩個參考幀的預測混合在一塊兒來計算樣點值的一種幀間預測類型

DC coefficient

一個變換系數,其頻域索引在兩個維度都爲零

Decoded frame

由解碼器在比特流中重建的幀

Decoder

解碼過程的一個具體實現

Decoding process

從句法元素推導解碼幀的過程

Dequantization

經過對量子化係數的縮放來得到變換系數的過程

Encoder

編碼過程的一個具體實現

Encoding process

生成符合本文檔描述的比特流,可是具體過程沒有在本規範中指定。

Enhancement layer

spatial_id或者temporal_id大於0的層

Flag

一個二值變量,突出顯示句法元素只能等於0或者等於1

Frame

視頻信號在空間域中的表示,由一個亮度矩陣(Y)和兩個色度矩陣(UV)組成

Frame context

用在解碼過程當中的一系列機率

Frame buffer

一個存儲已解碼幀和相關信息的區域

Golden frame

在幀間編碼中可使用的幀,一般狀況下,golden frame編碼的質量更高,並被用做多個幀間幀的參考

Inter coding

用幀間預測編碼一個塊或者一個幀

Inter frame

經過參考先前解碼幀壓縮的幀,可使用幀內預測或者幀間預測

Inter prediction

利用先前的解碼幀,推導出當前幀的預測值的過程

Intra coding

用幀內預測編碼一個塊或者一個幀

Intra frame

一種只使用幀內預測的幀,能夠獨立解碼

Intra prediction

在同一解碼幀中,利用先前解碼的樣點值,推導出當前樣點預測值的過程

Inverse transform

將變換系數矩陣轉化爲空間樣點值矩陣的過程(獲得殘差係數)

Key frame

一個幀內幀,當它出現時重置解碼過程

Layer

一系列具備相同spatial_id和temporal_id的片組OBUs

Level

對句法元素和變量值定義的一組約束

Loop filter

一種用於重建幀的過濾過程,旨在減小塊效應

Luma

一個樣點值矩陣或單個樣點值,表示與主色相關的單色信號,符號用Y表示

Mode info

在解碼過程當中,包含指示塊如何被預測的塊的語法元素

Mode info block

一個大小爲4x4或者更大的亮度樣點值塊,以及它的兩個相應的色度樣點值塊(若是存在的話)

Motion vector

一個二維矢量,用於將當前幀引用到參考幀,它的值提供了從當前幀的位置到參考幀中位置的座標偏移量

OBU

全部句法結構封包在「開放比特流單元」中,每一個OBU都有一個頭,它爲包含的數據(有效負載)提供標識信息

Parse

從比特流中獲取句法元素的過程

Prediction

預測過程的實現,包括幀內預測和幀間預測

Prediction process

用預測器估計解碼樣點值或數據元素的過程

Prediction value

值,即以前解碼的樣點值或數據元素的組合,用於下一個樣點值或數據元素的解碼過程

Profile

部分句法、語義和算法的子集

Quantization parameter

用於在解碼過程當中縮放量化係數的變量

Quantized coefficient

反量化以前的變換系數

Raster scan

(光柵掃描)將二維矩形光柵映射爲一維光柵,其中一維光柵的入口從二維光柵的第一行開始,而後掃描進入第二行和第三行,以此類推。每一個行從左到右掃描

Reconstruction

解碼得到的殘差和對應的預測值相加

Reference frame

在幀間預測過程當中使用的以前已解碼的幀

Reserved

一種特殊的句法元素值,能夠用來在未來擴展這個部分

Residual

重建值和對應的預測值的差

Sample

構成幀的基本元素

Sample value

樣點的值,對8位幀來講,這是一個0~255的整數;對於10位幀來講,這是一個0~1023的整數;對於12位幀來講,這是一個0~4095的整數

Segmentation map

一個3bit的數字包含了圖像中每一個4x4塊的段關係,每個參考緩存存儲了一個段映射容許新的幀使用以前的已編碼映射

Sequence

編碼比特流的最高層次句法結構,包括一個或幾個連續編碼的幀

Superblock

一個tile中塊四叉樹的最高層次,一個幀中全部超級塊大小都是同樣的而且都是正方形,超級塊能夠是128x128像素或者64x64像素,一個超級塊能夠包含1或2個模式信息塊,或者能夠在每一個方向上平分,建立4個子塊,這些子塊自己能夠被進一步細分,造成塊四叉樹

Switch Frame

一個幀間編碼幀能夠做爲序列切換的點,在不強制使用幀內編碼的狀況下,切換幀會覆蓋全部的幀緩衝區。其目的是容許一個流用例,其中視頻能夠被編碼成小塊(好比1秒的時間),每個都以一個切換幀開始。若是可用帶寬降低,服務器能夠開始從較低的比特率編碼中發送塊,切換後的解碼圖像可能有點不正確,可是這種方法容許一個切換,而不須要一個完整的關鍵幀的成本

Syntax element

在比特流中表示的數據元素

Temporal delimiter OBU

指示接下來的OBUs相對於時間分隔符以前的最後一幀有不一樣的顯示/解碼時間戳

Temporal unit

它由一個時間分隔符OBU和全部跟隨的OBUs組成,但不包括下一個時間分隔符

Temporal group

一組幀,其時間預測結構在視頻序列中週期性地使用

Tile

幀的一個矩形區域,能夠獨立的解碼和編碼,儘管跨tile邊緣的環路濾波仍然適用

Transform block

一種正方形變換系數矩陣,用於反變換過程的輸入

Transform coefficient

頻域中的一個標量值,包含在一個變換塊中

Uncompressed header

解碼幀的高級描述,編碼的時候沒有用算術編碼

相關文章
相關標籤/搜索