面試官問我:一個 TCP 鏈接能夠發多少個 HTTP 請求?我居然回答不上來

曾經有這麼一道經典面試題:從 URL 在瀏覽器被被輸入到頁面展示的過程當中發生了什麼?git

相信大多數準備過的同窗都能回答出來,可是若是繼續問:收到的 HTML 若是包含幾十個圖片標籤,這些圖片是以什麼方式、什麼順序、創建了多少鏈接、使用什麼協議被下載下來的呢?github

要搞懂這個問題,咱們須要先解決下面五個問題:web

  1. 現代瀏覽器在與服務器創建了一個 TCP 鏈接後是否會在一個 HTTP 請求完成後斷開?什麼狀況下會斷開?面試

  2. 一個 TCP 鏈接能夠對應幾個 HTTP 請求?chrome

  3. 一個 TCP 鏈接中 HTTP 請求發送能夠一塊兒發送麼(好比一塊兒發三個請求,再三個響應一塊兒接收)?瀏覽器

  4. 爲何有的時候刷新頁面不須要從新創建 SSL 鏈接?服務器

  5. 瀏覽器對同一 Host 創建 TCP 鏈接到數量有沒有限制?chrome-devtools

第一個問題

現代瀏覽器在與服務器創建了一個 TCP 鏈接後是否會在一個 HTTP 請求完成後斷開?什麼狀況下會斷開?google

在 HTTP/1.0 中,一個服務器在發送完一個 HTTP 響應後,會斷開 TCP 連接。可是這樣每次請求都會從新創建和斷開 TCP 鏈接,代價過大。因此雖然標準中沒有設定,某些服務器對 Connection: keep-alive 的 Header 進行了支持。意思是說,完成這個 HTTP 請求以後,不要斷開 HTTP 請求使用的 TCP 鏈接。這樣的好處是鏈接能夠被從新使用,以後發送 HTTP 請求的時候不須要從新創建 TCP 鏈接,以及若是維持鏈接,那麼 SSL 的開銷也能夠避免,兩張圖片是我短期內兩次訪問 https://www.github.com 的時間統計:spa

頭一次訪問,有初始化鏈接和 SSL 開銷

 

初始化鏈接和 SSL 開銷消失了,說明使用的是同一個 TCP 鏈接

持久鏈接:既然維持 TCP 鏈接好處這麼多,HTTP/1.1 就把 Connection 頭寫進標準,而且默認開啓持久鏈接,除非請求中寫明 Connection: close,那麼瀏覽器和服務器之間是會維持一段時間的 TCP 鏈接,不會一個請求結束就斷掉。

因此第一個問題的答案是:默認狀況下創建 TCP 鏈接不會斷開,只有在請求報頭中聲明 Connection: close 纔會在請求完成後關閉鏈接。

第二個問題

一個 TCP 鏈接能夠對應幾個 HTTP 請求?

瞭解了第一個問題以後,其實這個問題已經有了答案,若是維持鏈接,一個 TCP 鏈接是能夠發送多個 HTTP 請求的。

第三個問題

一個 TCP 鏈接中 HTTP 請求發送能夠一塊兒發送麼(好比一塊兒發三個請求,再三個響應一塊兒接收)?

HTTP/1.1 存在一個問題,單個 TCP 鏈接在同一時刻只能處理一個請求,意思是說:兩個請求的生命週期不能重疊,任意兩個 HTTP 請求從開始到結束的時間在同一個 TCP 鏈接裏不能重疊。

雖然 HTTP/1.1 規範中規定了 Pipelining 來試圖解決這個問題,可是這個功能在瀏覽器中默認是關閉的。

先來看一下 Pipelining 是什麼,RFC 2616 中規定了:

A client that supports persistent connections MAY "pipeline" its requests (i.e., send multiple requests without waiting for each response). A server MUST send its responses to those requests in the same order that the requests were received. 一個支持持久鏈接的客戶端能夠在一個鏈接中發送多個請求(不須要等待任意請求的響應)。收到請求的服務器必須按照請求收到的順序發送響應。

至於標準爲何這麼設定,咱們能夠大概推測一個緣由:因爲 HTTP/1.1 是個文本協議,同時返回的內容也並不能區分對應於哪一個發送的請求,因此順序必須維持一致。好比你向服務器發送了兩個請求 GET/query?q=A 和 GET/query?q=B,服務器返回了兩個結果,瀏覽器是沒有辦法根據響應結果來判斷響應對應於哪個請求的。

Pipelining 這種設想看起來比較美好,可是在實踐中會出現許多問題:

  • 一些代理服務器不能正確的處理 HTTP Pipelining。

  • 正確的流水線實現是複雜的。

  • Head-of-line Blocking 鏈接頭阻塞:在創建起一個 TCP 鏈接以後,假設客戶端在這個鏈接連續向服務器發送了幾個請求。按照標準,服務器應該按照收到請求的順序返回結果,假設服務器在處理首個請求時花費了大量時間,那麼後面全部的請求都須要等着首個請求結束才能響應。

因此現代瀏覽器默認是不開啓 HTTP Pipelining 的。

可是,HTTP2 提供了 Multiplexing 多路傳輸特性,能夠在一個 TCP 鏈接中同時完成多個 HTTP 請求。至於 Multiplexing 具體怎麼實現的就是另外一個問題了。咱們能夠看一下使用 HTTP2 的效果。

 

綠色是發起請求到請求返回的等待時間,藍色是響應的下載時間,能夠看到都是在同一個 Connection,並行完成的

因此這個問題也有了答案:在 HTTP/1.1 存在 Pipelining 技術能夠完成這個多個請求同時發送,可是因爲瀏覽器默認關閉,因此能夠認爲這是不可行的。在 HTTP2 中因爲 Multiplexing 特色的存在,多個 HTTP 請求能夠在同一個 TCP 鏈接中並行進行。

那麼在 HTTP/1.1 時代,瀏覽器是如何提升頁面加載效率的呢?主要有下面兩點:

  1. 維持和服務器已經創建的 TCP 鏈接,在同一鏈接上順序處理多個請求。

  2. 和服務器創建多個 TCP 鏈接。

第四個問題

爲何有的時候刷新頁面不須要從新創建 SSL 鏈接?

在第一個問題的討論中已經有答案了,TCP 鏈接有的時候會被瀏覽器和服務端維持一段時間。TCP 不須要從新創建,SSL 天然也會用以前的。

第五個問題

瀏覽器對同一 Host 創建 TCP 鏈接到數量有沒有限制?

假設咱們還處在 HTTP/1.1 時代,那個時候沒有多路傳輸,當瀏覽器拿到一個有幾十張圖片的網頁該怎麼辦呢?確定不能只開一個 TCP 鏈接順序下載,那樣用戶確定等的很難受,可是若是每一個圖片都開一個 TCP 鏈接發 HTTP 請求,那電腦或者服務器均可能受不了,要是有 1000 張圖片的話總不能開 1000 個TCP 鏈接吧,你的電腦贊成 NAT 也不必定會贊成。

因此答案是:有。Chrome 最多容許對同一個 Host 創建六個 TCP 鏈接。不一樣的瀏覽器有一些區別。

https://developers.google.com/web/tools/chrome-devtools/network/issues#queued-or-stalled-requestsdevelopers.google.com

那麼回到最開始的問題,收到的 HTML 若是包含幾十個圖片標籤,這些圖片是以什麼方式、什麼順序、創建了多少鏈接、使用什麼協議被下載下來的呢?

若是圖片都是 HTTPS 鏈接而且在同一個域名下,那麼瀏覽器在 SSL 握手以後會和服務器商量能不能用 HTTP2,若是能的話就使用 Multiplexing 功能在這個鏈接上進行多路傳輸。不過也未必會全部掛在這個域名的資源都會使用一個 TCP 鏈接去獲取,可是能夠肯定的是 Multiplexing 極可能會被用到。

若是發現用不了 HTTP2 呢?或者用不了 HTTPS(現實中的 HTTP2 都是在 HTTPS 上實現的,因此也就是隻能使用 HTTP/1.1)。那瀏覽器就會在一個 HOST 上創建多個 TCP 鏈接,鏈接數量的最大限制取決於瀏覽器設置,這些鏈接會在空閒的時候被瀏覽器用來發送新的請求,若是全部的鏈接都正在發送請求呢?那其餘的請求就只能等等了。

相關文章
相關標籤/搜索