以前深刻了解了一下HTTP1.一、2.0、SPDY等協議,發現HTTP層怎麼優化,始終要面對TCP自己的問題。因而瞭解到了QUIC,這裏分享一篇以前找到的有意義的文章。算法
原創地址:https://mp.weixin.qq.com/s/vpz6bp3PT1IDzZervyOfqw
windows
做者介紹:lancelot,騰訊資深研發工程師。目前主要負責騰訊 stgw(騰訊安全雲網關)的相關工做,總體推動騰訊內部及騰訊公有云,混合雲的七層負載均衡及全站 HTTPS 接入。對 HTTPS,SPDY,HTTP2,QUIC 等應用層協議、高性能服務器技術、雲網絡技術、用戶訪問速度、分佈式文件傳輸等有較深的理解。安全
本文將主要介紹 QUIC 協議產生的背景和核心特性。性能優化
寫在前面服務器
若是你的 App,在不須要任何修改的狀況下就能提高 15% 以上的訪問速度。特別是弱網絡的時候可以提高 20% 以上的訪問速度。網絡
若是你的 App,在頻繁切換 4G 和 WIFI 網絡的狀況下,不會斷線,不須要重連,用戶無任何感知。若是你的 App,既須要 TLS 的安全,也想實現 HTTP2 多路複用的強大。併發
若是你剛剛纔據說 HTTP2 是下一代互聯網協議,若是你剛剛纔關注到 TLS1.3 是一個革命性具備里程碑意義的協議,可是這兩個協議卻一直在被另外一個更新興的協議所影響和挑戰。負載均衡
若是這個新興的協議,它的名字就叫作「快」,而且正在標準化爲新一代的互聯網傳輸協議。ssh
你願意花一點點時間瞭解這個協議嗎?你願意投入精力去研究這個協議嗎?你願意全力推進業務來使用這個協議嗎?tcp
QUIC 概述
Quic 全稱 quick udp internet connection [1],「快速 UDP 互聯網鏈接」,(和英文 quick 諧音,簡稱「快」)是由 google 提出的使用 udp 進行多路併發傳輸的協議。
Quic 相比如今普遍應用的 http2+tcp+tls 協議有以下優點 [2]:
減小了 TCP 三次握手及 TLS 握手時間。
改進的擁塞控制。
避免隊頭阻塞的多路複用。
鏈接遷移。
前向冗餘糾錯。
爲何須要 QUIC
從上個世紀 90 年代互聯網開始興起一直到如今,大部分的互聯網流量傳輸只使用了幾個網絡協議。使用 IPv4 進行路由,使用 TCP 進行鏈接層面的流量控制,使用 SSL/TLS 協議實現傳輸安全,使用 DNS 進行域名解析,使用 HTTP 進行應用數據的傳輸。
並且近三十年來,這幾個協議的發展都很是緩慢。TCP 主要是擁塞控制算法的改進,SSL/TLS 基本上停留在原地,幾個小版本的改動主要是密碼套件的升級,TLS1.3[3] 是一個飛躍式的變化,但截止到今天,尚未正式發佈。IPv4 雖然有一個大的進步,實現了 IPv6,DNS 也增長了一個安全的 DNSSEC,但和 IPv6 同樣,部署進度較慢。
隨着移動互聯網快速發展以及物聯網的逐步興起,網絡交互的場景愈來愈豐富,網絡傳輸的內容也愈來愈龐大,用戶對網絡傳輸效率和 WEB 響應速度的要求也愈來愈高。
一方面是歷史悠久使用普遍的古老協議,另一方面用戶的使用場景對傳輸性能的要求又愈來愈高。以下幾個由來已久的問題和矛盾就變得愈來愈突出。
協議歷史悠久致使中間設備僵化。
依賴於操做系統的實現致使協議自己僵化。
創建鏈接的握手延遲大。
隊頭阻塞。
這裏分小節簡單說明一下:
中間設備的僵化
多是 TCP 協議使用得過久,也很是可靠。因此咱們不少中間設備,包括防火牆、NAT 網關,整流器等出現了一些約定俗成的動做。
好比有些防火牆只容許經過 80 和 443,不放通其餘端口。NAT 網關在轉換網絡地址時重寫傳輸層的頭部,有可能致使雙方沒法使用新的傳輸格式。整流器和中間代理有時候出於安全的須要,會刪除一些它們不認識的選項字段。
TCP 協議原本是支持端口、選項及特性的增長和修改。可是因爲 TCP 協議和知名端口及選項使用的歷史太悠久,中間設備已經依賴於這些潛規則,因此對這些內容的修改很容易遭到中間環節的干擾而失敗。
而這些干擾,也致使不少在 TCP 協議上的優化變得當心謹慎,寸步難行。
依賴於操做系統的實現致使協議僵化
TCP 是由操做系統在內核西方棧層面實現的,應用程序只能使用,不能直接修改。雖然應用程序的更新迭代很是快速和簡單。可是 TCP 的迭代卻很是緩慢,緣由就是操做系統升級很麻煩。
如今移動終端更加流行,可是移動端部分用戶的操做系統升級依然可能滯後數年時間。PC 端的系統升級滯後得更加嚴重,windows xp 如今還有大量用戶在使用,儘管它已經存在快 20 年。
服務端系統不依賴用戶升級,可是因爲操做系統升級涉及到底層軟件和運行庫的更新,因此也比較保守和緩慢。
這也就意味着即便 TCP 有比較好的特性更新,也很難快速推廣。好比 TCP Fast Open。它雖然 2013 年就被提出了,可是 Windows 不少系統版本依然不支持它。
創建鏈接的握手延遲大
無論是 HTTP1.0/1.1 仍是 HTTPS,HTTP2,都使用了 TCP 進行傳輸。HTTPS 和 HTTP2 還須要使用 TLS 協議來進行安全傳輸。這就出現了兩個握手延遲:
1.TCP 三次握手致使的 TCP 鏈接創建的延遲。
2.TLS 徹底握手須要至少 2 個 RTT 才能創建,簡化握手須要 1 個 RTT 的握手延遲。
對於不少短鏈接場景,這樣的握手延遲影響很大,且沒法消除。
隊頭阻塞
隊頭阻塞主要是 TCP 協議的可靠性機制引入的。TCP 使用序列號來標識數據的順序,數據必須按照順序處理,若是前面的數據丟失,後面的數據就算到達了也不會通知應用層來處理。
另外 TLS 協議層面也有一個隊頭阻塞,由於 TLS 協議都是按照 record 來處理數據的,若是一個 record 中丟失了數據,也會致使整個 record 沒法正確處理。
歸納來說,TCP 和 TLS1.2 以前的協議存在着結構性的問題,若是繼續在現有的 TCP、TLS 協議之上實現一個全新的應用層協議,依賴於操做系統、中間設備還有用戶的支持。部署成本很是高,阻力很是大。
因此 QUIC 協議選擇了 UDP,由於 UDP 自己沒有鏈接的概念,不須要三次握手,優化了鏈接創建的握手延遲,同時在應用程序層面實現了 TCP 的可靠性,TLS 的安全性和 HTTP2 的併發性,只須要用戶端和服務端的應用程序支持 QUIC 協議,徹底避開了操做系統和中間設備的限制。
QUIC 核心特性
鏈接創建延時低
0RTT 建連能夠說是 QUIC 相比 HTTP2 最大的性能優點。那什麼是 0RTT 建連呢?這裏面有兩層含義。
傳輸層 0RTT 就能創建鏈接。
加密層 0RTT 就能創建加密鏈接。
圖 1 HTTPS 及 QUIC 建連過程
好比上圖左邊是 HTTPS 的一次徹底握手的建連過程,須要 3 個 RTT。就算是 Session Resumption[14],也須要至少 2 個 RTT。
而 QUIC 呢?因爲創建在 UDP 的基礎上,同時又實現了 0RTT 的安全握手,因此在大部分狀況下,只須要 0 個 RTT 就能實現數據發送,在實現前向加密 [15] 的基礎上,而且 0RTT 的成功率相比 TLS 的 Sesison Ticket[13] 要高不少。
改進的擁塞控制
TCP 的擁塞控制實際上包含了四個算法:慢啓動,擁塞避免,快速重傳,快速恢復 [22]。
QUIC 協議當前默認使用了 TCP 協議的 Cubic 擁塞控制算法 [6],同時也支持 CubicBytes, Reno, RenoBytes, BBR, PCC 等擁塞控制算法。
從擁塞算法自己來看,QUIC 只是按照 TCP 協議從新實現了一遍,那麼 QUIC 協議到底改進在哪些方面呢?主要有以下幾點:
可插拔
什麼叫可插拔呢?就是可以很是靈活地生效,變動和中止。體如今以下方面:
應用程序層面就能實現不一樣的擁塞控制算法,不須要操做系統,不須要內核支持。這是一個飛躍,由於傳統的 TCP 擁塞控制,必需要端到端的網絡協議棧支持,才能實現控制效果。而內核和操做系統的部署成本很是高,升級週期很長,這在產品快速迭代,網絡爆炸式增加的今天,顯然有點知足不了需求。
即便是單個應用程序的不一樣鏈接也能支持配置不一樣的擁塞控制。就算是一臺服務器,接入的用戶網絡環境也千差萬別,結合大數據及人工智能處理,咱們能爲各個用戶提供不一樣的但又更加精準更加有效的擁塞控制。好比 BBR 適合,Cubic 適合。
應用程序不須要停機和升級就能實現擁塞控制的變動,咱們在服務端只須要修改一下配置,reload 一下,徹底不須要中止服務就能實現擁塞控制的切換。
STGW 在配置層面進行了優化,咱們能夠針對不一樣業務,不一樣網絡制式,甚至不一樣的 RTT,使用不一樣的擁塞控制算法。
單調遞增的 Packet Number
TCP 爲了保證可靠性,使用了基於字節序號的 Sequence Number 及 Ack 來確認消息的有序到達。
QUIC 一樣是一個可靠的協議,它使用 Packet Number 代替了 TCP 的 sequence number,而且每一個 Packet Number 都嚴格遞增,也就是說就算 Packet N 丟失了,重傳的 Packet N 的 Packet Number 已經不是 N,而是一個比 N 大的值。而 TCP 呢,重傳 segment 的 sequence number 和原始的 segment 的 Sequence Number 保持不變,也正是因爲這個特性,引入了 Tcp 重傳的歧義問題。
圖 2 Tcp 重傳歧義性
如上圖所示,超時事件 RTO 發生後,客戶端發起重傳,而後接收到了 Ack 數據。因爲序列號同樣,這個 Ack 數據究竟是原始請求的響應仍是重傳請求的響應呢?很差判斷。
若是算成原始請求的響應,但其實是重傳請求的響應(上圖左),會致使採樣 RTT 變大。若是算成重傳請求的響應,但其實是原始請求的響應,又很容易致使採樣 RTT 太小。
因爲 Quic 重傳的 Packet 和原始 Packet 的 Pakcet Number 是嚴格遞增的,因此很容易就解決了這個問題。
圖 3 Quic 重傳沒有歧義性
如上圖所示,RTO 發生後,根據重傳的 Packet Number 就能肯定精確的 RTT 計算。若是 Ack 的 Packet Number 是 N+M,就根據重傳請求計算採樣 RTT。若是 Ack 的 Pakcet Number 是 N,就根據原始請求的時間計算採樣 RTT,沒有歧義性。
可是單純依靠嚴格遞增的 Packet Number 確定是沒法保證數據的順序性和可靠性。QUIC 又引入了一個 Stream Offset 的概念。
即一個 Stream 能夠通過多個 Packet 傳輸,Packet Number 嚴格遞增,沒有依賴。可是 Packet 裏的 Payload 若是是 Stream 的話,就須要依靠 Stream 的 Offset 來保證應用數據的順序。如錯誤! 未找到引用源。所示,發送端前後發送了 Pakcet N 和 Pakcet N+1,Stream 的 Offset 分別是 x 和 x+y。
假設 Packet N 丟失了,發起重傳,重傳的 Packet Number 是 N+2,可是它的 Stream 的 Offset 依然是 x,這樣就算 Packet N + 2 是後到的,依然能夠將 Stream x 和 Stream x+y 按照順序組織起來,交給應用程序處理。
圖 4 Stream Offset 保證有序性
不容許 Reneging
什麼叫 Reneging 呢?就是接收方丟棄已經接收而且上報給 SACK 選項的內容 [8]。TCP 協議不鼓勵這種行爲,可是協議層面容許這樣的行爲。主要是考慮到服務器資源有限,好比 Buffer 溢出,內存不夠等狀況。
Reneging 對數據重傳會產生很大的干擾。由於 Sack 都已經代表接收到了,可是接收端事實上丟棄了該數據。
QUIC 在協議層面禁止 Reneging,一個 Packet 只要被 Ack,就認爲它必定被正確接收,減小了這種干擾。
更多的 Ack 塊
TCP 的 Sack 選項可以告訴發送方已經接收到的連續 Segment 的範圍,方便發送方進行選擇性重傳。
因爲 TCP 頭部最大隻有 60 個字節,標準頭部佔用了 20 字節,因此 Tcp Option 最大長度只有 40 字節,再加上 Tcp Timestamp option 佔用了 10 個字節 [25],因此留給 Sack 選項的只有 30 個字節。
每個 Sack Block 的長度是 8 個,加上 Sack Option 頭部 2 個字節,也就意味着 Tcp Sack Option 最大隻能提供 3 個 Block。
可是 Quic Ack Frame 能夠同時提供 256 個 Ack Block,在丟包率比較高的網絡下,更多的 Sack Block 能夠提高網絡的恢復速度,減小重傳量。
Ack Delay 時間
Tcp 的 Timestamp 選項存在一個問題 [25],它只是回顯了發送方的時間戳,可是沒有計算接收端接收到 segment 到發送 Ack 該 segment 的時間。這個時間能夠簡稱爲 Ack Delay。
這樣就會致使 RTT 計算偏差。以下圖:
能夠認爲 TCP 的 RTT 計算:
而 Quic 計算以下:
固然 RTT 的具體計算沒有這麼簡單,須要採樣,參考歷史數值進行平滑計算,參考以下公式 [9]。
基於 stream 和 connecton 級別的流量控制
QUIC 的流量控制 [22] 相似 HTTP2,即在 Connection 和 Stream 級別提供了兩種流量控制。爲何須要兩類流量控制呢?主要是由於 QUIC 支持多路複用。
Stream 能夠認爲就是一條 HTTP 請求。
Connection 能夠類比一條 TCP 鏈接。多路複用意味着在一條 Connetion 上會同時存在多條 Stream。既須要對單個 Stream 進行控制,又須要針對全部 Stream 進行整體控制。
QUIC 實現流量控制的原理比較簡單:
經過 window_update 幀告訴對端本身能夠接收的字節數,這樣發送方就不會發送超過這個數量的數據。
經過 BlockFrame 告訴對端因爲流量控制被阻塞了,沒法發送數據。
QUIC 的流量控制和 TCP 有點區別,TCP 爲了保證可靠性,窗口左邊沿向右滑動時的長度取決於已經確認的字節數。若是中間出現丟包,就算接收到了更大序號的 Segment,窗口也沒法超過這個序列號。
但 QUIC 不一樣,就算此前有些 packet 沒有接收到,它的滑動只取決於接收到的最大偏移字節數。
圖 5 Quic Flow Control
針對 Stream:
針對 Connection:
一樣地,STGW 也在鏈接和 Stream 級別設置了不一樣的窗口數。
最重要的是,咱們能夠在內存不足或者上游處理性能出現問題時,經過流量控制來限制傳輸速率,保障服務可用性。
沒有隊頭阻塞的多路複用
QUIC 的多路複用和 HTTP2 相似。在一條 QUIC 鏈接上能夠併發發送多個 HTTP 請求 (stream)。可是 QUIC 的多路複用相比 HTTP2 有一個很大的優點。
QUIC 一個鏈接上的多個 stream 之間沒有依賴。這樣假如 stream2 丟了一個 udp packet,也只會影響 stream2 的處理。不會影響 stream2 以前及以後的 stream 的處理。
這也就在很大程度上緩解甚至消除了隊頭阻塞的影響。
多路複用是 HTTP2 最強大的特性 [7],可以將多條請求在一條 TCP 鏈接上同時發出去。但也惡化了 TCP 的一個問題,隊頭阻塞 [11],以下圖示:
圖 6 HTTP2 隊頭阻塞
HTTP2 在一個 TCP 鏈接上同時發送 4 個 Stream。其中 Stream1 已經正確到達,並被應用層讀取。可是 Stream2 的第三個 tcp segment 丟失了,TCP 爲了保證數據的可靠性,須要發送端重傳第 3 個 segment 才能通知應用層讀取接下去的數據,雖然這個時候 Stream3 和 Stream4 的所有數據已經到達了接收端,但都被阻塞住了。
不只如此,因爲 HTTP2 強制使用 TLS,還存在一個 TLS 協議層面的隊頭阻塞 [12]。
圖 7 TLS 隊頭阻塞
Record 是 TLS 協議處理的最小單位,最大不能超過 16K,一些服務器好比 Nginx 默認的大小就是 16K。因爲一個 record 必須通過數據一致性校驗才能進行加解密,因此一個 16K 的 record,就算丟了一個字節,也會致使已經接收到的 15.99K 數據沒法處理,由於它不完整。
那 QUIC 多路複用爲何能避免上述問題呢?
QUIC 最基本的傳輸單元是 Packet,不會超過 MTU 的大小,整個加密和認證過程都是基於 Packet 的,不會跨越多個 Packet。這樣就能避免 TLS 協議存在的隊頭阻塞。
Stream 之間相互獨立,好比 Stream2 丟了一個 Pakcet,不會影響 Stream3 和 Stream4。不存在 TCP 隊頭阻塞。
圖 8 QUIC 多路複用時沒有隊頭阻塞的問題
固然,並非全部的 QUIC 數據都不會受到隊頭阻塞的影響,好比 QUIC 當前也是使用 Hpack 壓縮算法 [10],因爲算法的限制,丟失一個頭部數據時,可能遇到隊頭阻塞。
整體來講,QUIC 在傳輸大量數據時,好比視頻,受到隊頭阻塞的影響很小。
加密認證的報文
TCP 協議頭部沒有通過任何加密和認證,因此在傳輸過程當中很容易被中間網絡設備篡改,注入和竊聽。好比修改序列號、滑動窗口。這些行爲有多是出於性能優化,也有多是主動攻擊。
可是 QUIC 的 packet 能夠說是武裝到了牙齒。除了個別報文好比 PUBLIC_RESET 和 CHLO,全部報文頭部都是通過認證的,報文 Body 都是通過加密的。
這樣只要對 QUIC 報文任何修改,接收端都可以及時發現,有效地下降了安全風險。
以下圖所示,紅色部分是 Stream Frame 的報文頭部,有認證。綠色部分是報文內容,所有通過加密。
鏈接遷移
一條 TCP 鏈接 [17] 是由四元組標識的(源 IP,源端口,目的 IP,目的端口)。什麼叫鏈接遷移呢?就是當其中任何一個元素髮生變化時,這條鏈接依然維持着,可以保持業務邏輯不中斷。固然這裏面主要關注的是客戶端的變化,由於客戶端不可控而且網絡環境常常發生變化,而服務端的 IP 和端口通常都是固定的。
好比你們使用手機在 WIFI 和 4G 移動網絡切換時,客戶端的 IP 確定會發生變化,須要從新創建和服務端的 TCP 鏈接。
又好比你們使用公共 NAT 出口時,有些鏈接競爭時須要從新綁定端口,致使客戶端的端口發生變化,一樣須要從新創建 TCP 鏈接。
針對 TCP 的鏈接變化,MPTCP[5] 其實已經有了解決方案,可是因爲 MPTCP 須要操做系統及網絡協議棧支持,部署阻力很是大,目前並不適用。
因此從 TCP 鏈接的角度來說,這個問題是無解的。
那 QUIC 是如何作到鏈接遷移呢?很簡單,任何一條 QUIC 鏈接再也不以 IP 及端口四元組標識,而是以一個 64 位的隨機數做爲 ID 來標識,這樣就算 IP 或者端口發生變化時,只要 ID 不變,這條鏈接依然維持着,上層業務邏輯感知不到變化,不會中斷,也就不須要重連。
因爲這個 ID 是客戶端隨機產生的,而且長度有 64 位,因此衝突機率很是低。
其餘亮點
此外,QUIC 還能實現前向冗餘糾錯,在重要的包好比握手消息發生丟失時,可以根據冗餘信息還原出握手消息。
QUIC 還能實現證書壓縮,減小證書傳輸量,針對包頭進行驗證等。
限於篇幅,本文再也不詳細介紹,有興趣的能夠參考文檔 [23] 和文檔 [4] 和文檔 [26]。
參考線索
[1]. https:///quic
[2].
[3]. E. Rescorla, 「The Transport Layer Security (TLS) Protocol Version 1.3」, draft-ietf-tls-tls13-21, July 03, 2017
[4]. Adam Langley,Wan-Teh Chang, 「QUIC Crypto」, 20161206
[5]. https:///
[6]. Ha, S., Rhee, I., and L. Xu, "CUBIC: A New TCP-Friendly High-Speed TCP Variant", ACM SIGOPS Operating System Review , 2008.
[7]. M. Belshe,BitGo, R. Peon, 「Hypertext Transfer Protocol Version 2 (HTTP/2)」, RFC 7540, May 2015
[8]. M. Mathis,J. Mahdavi,S. Floyd,A. Romanow,「TCP Selective Acknowledgment Options」, rfc2018, October 1996
[9]. V. Paxson,M. Allman,J. Chu,M. Sargent,「Computing TCP's Retransmission Timer」, rfc6298, June 2011
[10]. R. Peon,H. Ruellan,「HPACK: Header Compression for HTTP/2」,RFC7541,May 2015
[11]. M. Scharf, Alcatel-Lucent Bell Labs, S. Kiesel, 「Quantifying Head-of-Line Blocking in TCP and SCTP」, July 15, 2013
[12]. Ilya Grigorik,「Optimizing TLS Record Size & Buffering Latency」, https:///2013/10/24/optimizing-tls-record-size-and-buffering-latency/, October 24, 2013
[13]. J. Salowey,H. Zhou,P. Eronen,H. Tschofenig, 「Transport Layer Security (TLS) Session Resumption without Server-Side State」, RFC5077, January 2008
[14]. Dierks, T. and E. Rescorla, "The Transport Layer Security (TLS) Protocol Version 1.2", RFC 5246, DOI 10.17487/RFC5246, August 2008, <http:///info/rfc5246>.
[15]. Shirey, R., "Internet Security Glossary, Version 2", FYI , RFC 4949, August 2007
[16]. 羅成,「HTTPS性能優化」, http:///cn/presentations/performance-optimization-of-https,February.2017
[17]. Postel, J., "Transmission Control Protocol", STD 7, RFC793, September 1981.
[18]. J. Postel,「User Datagram Protocol」, RFC768,August 1980
[19]. Q. Dang, S. Santesson,K. Moriarty,D. Brown.T. Polk, 「Internet X.509 Public Key Infrastructure: Additional Algorithms and Identifiers for DSA and ECDSA」,RFC5758, January 2010
[20]. Bassham, L., Polk, W., and R. Housley, "Algorithms and Identifiers for the Internet X.509 Public Key Infrastructure Certificate and Certificate Revocation List (CRL) Profile", RFC 3279, April 2002
[21]. D.Cooper,S.Santesson, S.Farrell,S. Boeyen,R. Housley,W.Polk, 「Internet X.509 Public Key Infrastructure Certificate and Certificate Revocation List (CRL) Profile」, RFC5280, May 2008
[22]. M. Allman,V. Paxson,E. Blanton, "TCP Congestion Control」,RFC5681, September 2009
[23]. Robbie Shade, 「Flow control in QUIC」, #, May, 2016,
[24]. ianswett , 「QUIC fec v1」, #heading=h.xgjl2srtytjt, 2016-02-19
[25]. D.Borman,B.Braden,V.Jacobson,R.Scheffenegger, Ed. 「TCP Extensions for High Performance」,rfc7323, 2014
[26]. 羅成,「WEB加速,協議先行」, ,july, 2017