完全理解瀏覽器的緩存機制

這是我參與8月更文挑戰的第3天，活動詳情查看：8月更文挑戰css

概述

瀏覽器的緩存機制也就是咱們說的HTTP緩存機制，其機制是根據HTTP報文的緩存標識進行的，因此在分析瀏覽器緩存機制以前，咱們先使用圖文簡單介紹一下HTTP報文，HTTP報文分爲兩種：web

HTTP請求(Request)報文，報文格式爲：請求行 – HTTP頭(通用信息頭，請求頭，實體頭) – 請求報文主體(只有POST纔有報文主體)，以下圖瀏覽器

HTTP響應(Response)報文，報文格式爲：狀態行 – HTTP頭(通用信息頭，響應頭，實體頭) – 響應報文主體，以下圖緩存

注：通用信息頭指的是請求和響應報文都支持的頭域，分別爲Cache-Control、Connection、Date、Pragma、Transfer-Encoding、Upgrade、Via；實體頭則是實體信息的實體頭域，分別爲Allow、Content-Base、Content-Encoding、Content-Language、Content-Length、Content-Location、Content-MD五、Content-Range、Content-Type、Etag、Expires、Last-Modified、extension-header。這裏只是爲了方便理解，將通用信息頭，響應頭/請求頭，實體頭都歸爲了HTTP頭。性能優化

爲何須要瀏覽器緩存？

咱們知道經過HTTP協議，在客戶端和瀏覽器創建鏈接時須要消耗時間，而大的響應須要在客戶端和服務器之間進行屢次往返通訊才能得到完整的響應，這拖延了瀏覽器可使用和處理內容的時間。這就增長了訪問服務器的數據和資源的成本，所以利用瀏覽器的緩存機制重用之前獲取的數據就變成了性能優化時須要考慮的事情。服務器

緩存過程分析

瀏覽器與服務器通訊的方式爲應答模式，便是：瀏覽器發起HTTP請求 – 服務器響應該請求。那麼瀏覽器第一次向服務器發起該請求後拿到請求結果，會根據響應報文中HTTP頭的緩存標識，決定是否緩存結果，是則將請求結果和緩存標識存入瀏覽器緩存中，簡單的過程以下圖：markdown

由上圖咱們能夠知道：post

瀏覽器每次發起請求，都會先在瀏覽器緩存中查找該請求的結果以及緩存標識
瀏覽器每次拿到返回的請求結果都會將該結果和緩存標識存入瀏覽器緩存中

以上兩點結論就是瀏覽器緩存機制的關鍵，他確保了每一個請求的緩存存入與讀取，只要咱們再理解瀏覽器緩存的使用規則，那麼全部的問題就迎刃而解了。爲了方便理解，這裏根據是否須要向服務器從新發起HTTP請求將緩存過程分爲兩個部分，分別是強制緩存和協商緩存。性能

強制緩存

強制緩存就是向瀏覽器緩存查找該請求結果，並根據該結果的緩存規則來決定是否使用該緩存結果的過程。優化

強制緩存的狀況主要有三種(暫不分析協商緩存過程)，以下：

不存在該緩存結果和緩存標識，強制緩存失效，則直接向服務器發起請求（跟第一次發起請求一致），以下圖：

存在該緩存結果和緩存標識，但該結果已失效，強制緩存失效，則使用協商緩存(暫不分析)，以下圖

存在該緩存結果和緩存標識，且該結果還沒有失效，強制緩存生效，直接返回該結果，以下圖

那麼強制緩存的緩存規則是什麼？

當瀏覽器向服務器發起請求時，服務器會將緩存規則放入HTTP響應報文的HTTP頭中和請求結果一塊兒返回給瀏覽器，控制強制緩存的字段分別是Expires和Cache-Control，其中Cache-Control優先級比Expires高。

Expires

Expires是HTTP/1.0控制網頁緩存的字段，其值爲服務器返回該請求結果緩存的到期時間，即再次發起該請求時，若是客戶端的時間小於Expires的值時，直接使用緩存結果。

Expires是HTTP/1.0的字段，可是如今瀏覽器默認使用的是HTTP/1.1，那麼在HTTP/1.1中網頁緩存仍是否由Expires控制？

到了HTTP/1.1，Expire已經被Cache-Control替代，緣由在於Expires控制緩存的原理是使用客戶端的時間與服務端返回的時間作對比，那麼若是客戶端與服務端的時間由於某些緣由（例如時區不一樣；客戶端和服務端有一方的時間不許確）發生偏差，那麼強制緩存則會直接失效，這樣的話強制緩存的存在則毫無心義，那麼Cache-Control又是如何控制的呢？

Cache-Control

在HTTP/1.1中，Cache-Control是最重要的規則，主要用於控制網頁緩存，主要取值爲：

public：全部內容都將被緩存（客戶端和代理服務器均可緩存）
private：全部內容只有客戶端能夠緩存，Cache-Control的默認取值
no-cache：客戶端緩存內容，可是是否使用緩存則須要通過協商緩存來驗證決定
no-store：全部內容都不會被緩存，即不使用強制緩存，也不使用協商緩存
max-age=xxx (xxx is numeric)：緩存內容將在xxx秒後失效

接下來，咱們直接看一個例子，以下：

由上面的例子咱們能夠知道：

HTTP響應報文中expires的時間值，是一個絕對值
HTTP響應報文中Cache-Control爲max-age=600，是相對值

因爲Cache-Control的優先級比expires，那麼直接根據Cache-Control的值進行緩存，意思就是說在600秒內再次發起該請求，則會直接使用緩存結果，強制緩存生效。

注：在沒法肯定客戶端的時間是否與服務端的時間同步的狀況下，Cache-Control相比於expires是更好的選擇，因此同時存在時，只有Cache-Control生效。

瞭解強制緩存的過程後，咱們拓展性的思考一下：

瀏覽器的緩存存放在哪裏，如何在瀏覽器中判斷強制緩存是否生效？

這裏咱們以博客的請求爲例，狀態碼爲灰色的請求則表明使用了強制緩存，請求對應的Size值則表明該緩存存放的位置，分別爲from memory cache 和 from disk cache。

那麼from memory cache 和 from disk cache又分別表明的是什麼呢？何時會使用from disk cache，何時會使用from memory cache呢？

from memory cache表明使用內存中的緩存，from disk cache則表明使用的是硬盤中的緩存，瀏覽器讀取緩存的順序爲memory –> disk。

from disk cache和from memory cache 可能同時存在着？

對於這個問題，咱們須要瞭解內存緩存(from memory cache)和硬盤緩存(from disk cache)，以下:

內存緩存(from memory cache)：內存緩存具備兩個特色，分別是快速讀取和時效性：
- 快速讀取：內存緩存會將編譯解析後的文件，直接存入該進程的內存中，佔據該進程必定的內存資源，以方便下次運行使用時的快速讀取。
- 時效性：一旦該進程關閉，則該進程的內存則會清空。
硬盤緩存(from disk cache)：硬盤緩存則是直接將緩存寫入硬盤文件中，讀取緩存須要對該緩存存放的硬盤文件進行I/O操做，而後從新解析該緩存內容，讀取複雜，速度比內存緩存慢。

在瀏覽器中，瀏覽器會在js和圖片等文件解析執行後直接存入內存緩存中，那麼當刷新頁面時只需直接從內存緩存中讀取(from memory cache)；而css文件則會存入硬盤文件中，因此每次渲染頁面都須要從硬盤讀取緩存(from disk cache)。

協商緩存

協商緩存就是強制緩存失效後，瀏覽器攜帶緩存標識向服務器發起請求，由服務器根據緩存標識決定是否使用緩存的過程，主要有如下兩種狀況：

協商緩存生效，返回304，以下

304

協商緩存失效，返回200和請求結果結果，以下

200

一樣，協商緩存的標識也是在響應報文的HTTP頭中和請求結果一塊兒返回給瀏覽器的，控制協商緩存的字段分別有：Last-Modified / If-Modified-Since和Etag / If-None-Match，其中Etag / If-None-Match的優先級比Last-Modified / If-Modified-Since高。

Last-Modified / If-Modified-Since

Last-Modified是服務器響應請求時，返回該資源文件在服務器最後被修改的時間，以下。

last-modify

If-Modified-Since則是客戶端再次發起該請求時，攜帶上次請求返回的Last-Modified值，經過此字段值告訴服務器該資源上次請求返回的最後被修改時間。服務器收到該請求，發現請求頭含有If-Modified-Since字段，則會根據If-Modified-Since的字段值與該資源在服務器的最後被修改時間作對比，若服務器的資源最後被修改時間大於If-Modified-Since的字段值，則從新返回資源，狀態碼爲200；不然則返回304，表明資源無更新，可繼續使用緩存文件，以下。

If-Modified-Since

Etag / If-None-Match

Etag是服務器響應請求時，返回當前資源文件的一個惟一標識(由服務器生成)，以下。

Etag的工做原理

如上圖，服務器在第一次返回響應的時候設置了緩存的時間120s，假設瀏覽器在這120s通過以後再次請求服務器相同的資源，首先，瀏覽器會檢查本地緩存並找到以前的響應，不幸的是，這個響應如今已經’過時’，沒法在使用。此時，瀏覽器也能夠直接發出新請求，獲取新的完整響應，可是這樣作效率較低，由於若是資源未被更改過，咱們就沒有理由再去下載與緩存中已有的徹底相同的字節。

因而就到了Etag發揮做用的時候了，一般服務器生成並返回在Etag中的驗證碼，經常是文件內容的哈希值或者某個其餘指紋碼。客戶端沒必要了解指紋碼是如何生成的，只須要在下一個請求中將其發送給服務器(瀏覽器默認會添加)：若是指紋碼仍然一致，說明資源未被修改，服務器會反悔304 Not Modified，這樣咱們就能夠跳過下載，利用已經緩存了的資源，而且該資源會繼續緩存120s。

If-None-Match是客戶端再次發起該請求時，攜帶上次請求返回的惟一標識Etag值，經過此字段值告訴服務器該資源上次請求返回的惟一標識值。服務器收到該請求後，發現該請求頭中含有If-None-Match，則會根據If-None-Match的字段值與該資源在服務器的Etag值作對比，一致則返回304，表明資源無更新，繼續使用緩存文件；不一致則從新返回資源文件，狀態碼爲200，以下。

Etag-match

注：Etag / If-None-Match優先級高於Last-Modified / If-Modified-Since，同時存在則只有Etag / If-None-Match生效。

總結

瀏覽器緩存分爲強制緩存和協商緩存，強制緩存優先於協商緩存進行。

若強制緩存(Expires和Cache-Control,Cache-Control優先級高於Expires)生效則直接使用緩存
若不生效則進行協商緩存(Last-Modified / If-Modified-Since和Etag / If-None-Match，其中Etag / If-None-Match的優先級比Last-Modified / If-Modified-Since高)，協商緩存由服務器決定是否使用緩存
若協商緩存失效，那麼表明該請求的緩存失效，從新獲取請求結果，再存入瀏覽器緩存中；生效則返回304，繼續使用緩存

主要過程以下：

文中若有錯誤，歡迎在評論區指正，若是這篇文章幫到了你，歡迎點贊👍和關注😊，但願點贊多多多多...