HTTP2協議之HPACK--之頭部壓縮規範介紹

接下來打算把HTTP2協議的頭部壓縮算法給翻譯下,敬請等候。
HPACK - Header Compression for HTTP/2html

HPACK:HTTP/2頭部壓縮

概要說明

這個規範定義了HPACK,它是應用在HTTP/2中的了爲了更加有效的表示HTTP頭部屬性的壓縮格式規範。

內容列表

1.介紹

在HTTP/1.1中,頭部域是沒有壓縮的。若是web頁面請求從十幾個增長大幾百個,那麼這些請求中的頭部域就會消耗不少的帶寬從而形成延遲。git

SPY經過使用DEFLATE格式來壓縮頭部域的方式來解決這個問題,這個方法在表示大量的頭部域中也是被證實是很是有效的。可是,這個方式在CRIME(Compression Ratio Info-leak Made Easy)攻擊中就會暴露出安全隱患。github

這個規範定義了一個能夠頭部域冗餘的壓縮器HPACK,它隱藏了安全攻擊的弱點並且在有限制的環境中使用有界的內存。更多的關於HPACK的安全問題在Section 7部分。web

HPACK格式被設計的簡單和靈活。這兩個特色減小了因爲事先錯誤產生的互用性的隱患或者安全問題。它沒有定義擴展機制,因此改變這種格式的惟一途徑就是經過定義一個完整的替代者。算法

1.1概述

在這個規範中,會把頭部域當成一個有序的名-值對的集合,並且有可能含有重複的名值對。名字和值會被當成八進制的,並且在解壓縮後頭部域的順序會被反轉。安全

頭部域列表會被編碼爲映射頭部域到索引值中。並且這些頭部域列表在當新的頭部域被解碼或者編碼後會更新。網絡

在編碼後,一個頭部域要麼是頭部域列表中的一個值要麼是指向一個頭部域列表中的引用。所以,經過使用引用或者具體的值就能夠對頭部域進行編碼。編碼

字面值能夠被直接編碼也可使用一個靜態的哈夫曼編碼。spa

一個編碼器須要決定頭部域列表中的哪個頭部域做爲一個新的輸入來插入。而解碼器在從新構建頭部域列表的過程當中須要執行編碼器對頭部域進行的修改。這個樣就解碼器可以比較簡單並且和種類繁多的編碼器保持協做。翻譯

1.2約定

這個文檔中的關鍵字 "MUST", "MUST NOT", "REQUIRED", "SHALL", "SHALL NOT", "SHOULD", "SHOULD NOT", "RECOMMENDED", "MAY", and "OPTIONAL"在RFC2119中可以獲得合適的解釋。

全部的數字都是以網絡中的字節排序。除非由說明不然值都是無符號的。字面值按須要多是小數的也多是十六進制的。

1.3術語

這個規範中使用了下面的術語:

Header Field(頭部域):一個名-值對。名字和值都是以八進制存在的。

Dynamic Table(動態表):動態表是用於存放含有索引值的頭部域的。這個表示動態變化的並且針對於編碼或者解碼的內容的。

Static Table(靜態表):靜態表只要用於存放含有索引值的頻繁出現的頭部域的。這個表是有序的、只讀、可訪問的並且在幾乎全部的編碼或者解碼的內容中能夠共享的。

Header List(頭部列表):頭部列表是頭部域的有序集合一塊兒被編碼的並且可能含有重複頭部域。一個完整的含有Http/2頭部快的頭部域就是一個頭部列表。

Header Field Respresentation(頭部域表示):一個頭部域在編碼後能夠以一個字面值也能夠是一個索引值。

Header Block(頭部塊):一個有序的頭部域表示在被解碼的時候就是一個完成頭部列表。

2.壓縮過程概述

這個規範中沒有表述針對一個編碼器的具體算法。取而代之的是,它詳細的定義瞭解碼器須要作的事情,並且容許一個編碼器產生這個規範容許的任何編碼形式。

2.1頭部列表序列

HPACK保證在頭部列表中的頭部域是有序的。一個編碼器必須根據頭部域在原始頭部列表中的順序來排序在頭部塊中的頭部域。一個解碼器必須根據在頭部塊的排列序列來在解碼的頭部列表排列頭部域。

2.2內容的編碼和解碼

爲了解壓頭部塊,一個解碼器只須要把動態表當作一個解碼的內容來進行操做。再也不須要其餘的動態狀態了。

好比在HTTP中,當用於雙線的通訊時,被某一端操做的編碼和解碼都是徹底獨立的,動態表的請求和相應都是獨立的。

2.3索引化表

HPACK使用兩個表格來將頭部域和索引聯繫在一塊兒。靜態表被提早定義好而且含有公共的頭部域(大部分的值都是空的)。動態表是動態的並且可以被編碼器指向在編碼的頭部列表中重複的頭部域的索引的時候。

這兩個表爲了定義索引值會結合成一個單一的地址空間。

2.3.1靜態表

靜態表是由提早定義好的靜態頭部列表組成。它的輸入時在Appendix A中定義的。

2.3.2動態表

動態表是由頭部域的列表組成,並且是按照先進先出的序列來操做的。第一個和最新加入動態表的索引值是最低的,而最早進入動態表的索引值是最高的。

動態表是初始化的時候是空表。當每一個頭部塊被解壓的時候就會添加新值。

動態表可以含有重複的值。所以,重複的值不可以被解碼器當作是一個錯誤。

編碼器決定如何去更新動態表並且可以控制被動態表使用的內存大小。爲了限制解碼器須要的內存,動態表的大小是被嚴格限制的。

解碼器在處理頭部域表的列表的時候會更新動態表。

2.3.3地址空間索引

靜態表和董彪會被組合成單一的地址索引空間。

在1和靜態表長度之間的mul指向了靜態表中的元素。

比靜態表長度的索引目錄會指向動態表的元素。靜態表的長度被減掉就是動態表的索引值的開始。

而比兩個表的長度之和都大的索引必定是解碼錯誤。

對於一個靜態表的大小s和動態表的大小k,下面的圖表示了完整的合法的索引地址空間。

<----------  Index Address Space ---------->
    <-- Static  Table -->  <-- Dynamic Table -->
    +---+-----------+---+  +---+-----------+---+
    | 1 |    ...    | s |  |s+1|    ...    |s+k|
    +---+-----------+---+  +---+-----------+---+
                           ^                   |
                           |                   V
                    Insertion Point      Dropping Point

2.4頭部域表示

一個編碼的頭部域既能夠是一個索引也能夠是一個字面值。

一個索引化的表示定義了頭部域的指向了靜態表或者動態表的引用。

一個字面表示就是經過指明它的名字或者值來定義頭部域。頭部域名字可以用字面值來表示或者指向靜態表或者動態表的值。頭部域的值就是以字面量來表示的。

有三種不一樣的字面表示定義以下:

  • 在動態表的開始處做爲一個新的輸入來添加頭部域的字面表示。
  • 不須要添加到動態表的頭部域的字面表示。
  • 含有額外的規定的頭部域通常使用字面值表示,特別是經過中間媒介從新編碼的。這種表示是爲了不壓縮的時候頭部域的值沒有保存。

爲了保護敏感的頭部的值的時候,這些字面值的選擇可以在作安全考慮的時候起到指導意義。

一個頭部域的名字或者頭部域的值的字面表示既可以直接使用八進制也可使用一個靜態的哈夫曼碼。

3.頭部塊解碼

3.1頭部塊處理

一個解碼器在處理一個頭部塊的時候一般會重建原始的頭部列表。

一個頭部塊就是頭部域表示的串聯。不一樣的頭部域表示描述可見Section 6

一旦頭部域被家嗎而且被添加到重建的頭部列表中,頭部域就不可以被移除了。一個被添加到頭部列表的頭部域能夠被安全的傳給應用程序。

經過傳遞頭部域給應用程序,一個解碼器在除了動態表需啊喲的內存外可以使用最小的瞬息內存來進行提交處理。

3.2頭部域表示處理過程

相關文章
相關標籤/搜索