衆所周知,在 Web 開發中,緩存很重要、頗有用。但同時其也很複雜。html
本文將從如下 5 個方面全面地介紹下緩存相關的內容。node
瀏覽器對於所請求資源的緩存處理有一套完整的機制,主要包含如下三個策略:存儲策略、過時策略、協商策略。git
其中,存儲策略發生在收到請求響應後,用於決定是否緩存相應資源;過時策略發生在請求前,用於判斷緩存是否過時;協商策略發生在請求中,用於判斷緩存資源是否更新。github
瀏覽器在應用緩存策略時,具體的判斷流程以下: web
上圖中的緩存判斷流程是瀏覽器在應用緩存時完整的判斷流程。可是在瀏覽器中訪問資源的方式不一樣也會致使判斷流程的不一樣。判斷流程會根據不一樣方式跳過一些流程。算法
瀏覽器下訪問資源的方式主要有如下 7 種:segmentfault
使用這 7 種方式訪問資源時,應用緩存的策略會有一些不一樣。以下圖所示。經過上述 7 種方式訪問資源,會從不一樣的緩存應用判斷步驟開始。此處不作驗證,相信你們看了後面的內容,可以自行驗證的。 瀏覽器
須要注意的是,Chrome 中在當前地址欄,不改變內容,直接回車,等同於刷新當前頁,而在 Firefox 下與其餘在地址欄回車同樣。這一點比較特殊,須要適當區分下。緩存
本文配有測試腳本,代碼在github上。下文會按照測試腳本進行述說,使用說明見下載連接。驗證上述內容,能夠執行
node cache-ETag+max-age.js
,會同時開啓ETag
和max-age
,而後觸發相應的動做,經過 Network 面板和 node 日誌便可驗證,此處篇幅有限先不贅述。安全
此外,這裏提一個概念,webkit 資源分爲主資源和派生資源。主資源是地址欄輸入的 URL 請求返回的資源,派生資源是主資源中所引用的 JS、CSS、圖片等資源。
在 Chrome 下刷新時,只有主資源的緩存應用方式如上圖所示,派生資源的緩存應用方式與新標籤打開相似,會判斷緩存是否過時。強緩存生效時的區別在於新標籤打開爲from disk cache
,而當前頁刷新派生資源是from memory cache
。
而在 Firefox 下,當前頁面刷新,全部資源都會如上圖所示。下文也會利用 Chrome 的這一特色在當前頁刷新,派生資源會使用緩存進行測試。否則每次都須要打開新標籤較爲繁瑣。
HTTP 中與緩存有關的字段主要有如下 10 個,以下表所示。爲明確表示其功能及用法,下表中分別區分了存儲策略、過時策略、協商策略、請求頭、響應頭。
注:乄表示半對,Last-Modified
之因此是半對,是由於有可能會觸發啓發式緩存,也會緩存文件。具體見下文。
緩存又分爲強緩存和弱緩存(又稱爲協商緩存)。其中強緩存包括
Expires
和Cache-Control
,主要是在過時策略生效時應用的緩存。弱緩存包括Last-Modified
和ETag
,是在協商策略後應用的緩存。強弱緩存之間的主要區別在於獲取資源時是否會發送請求。
如上所述,Expires
指定緩存的過時時間,爲絕對時間,即某一時刻。參考本地時間進行比對,在指定時刻後過時。RFC 2616建議最大值不要超過 1 年。
Expire
頭字段是響應頭字段,格式以下:Expires: Sat Oct 20 2018 00:00:00 GMT+0800 (CST)
。
能夠嘗試如下步驟進行驗證:
node cache-Expires.js
,該腳本會給請求的資源設定
Expires
,值爲:"2018-10-20 00:00:00"。
http://localhost:1030/
,開啓 Network Tab,查看 avatar.jpg 圖片,Expires 值以下所示。
(from memory cache)
。此時修改本地時間,將時間修改成「2018-10-15 00:00:00」,再刷新,會發現緩存仍然有效。
Cache-Control
用於指定資源的緩存機制,能夠同時在請求頭和響應頭中設定,涉及上述三個策略中的兩個策略:存儲策略、過時策略。
Cache-Control
的語法以下:Cache-Control: cache-directive[,cache-directive]
。cache-directive
爲緩存指令,大小寫不敏感,共有 12 個與 HTTP 緩存標準相關,以下表所示。其中請求指令 7 種,響應指令 9 種。Cache-Control
能夠設置多個緩存指令,以逗號,
分隔。
如上,cache-directive 指令大小寫不敏感,因此在設置 Cache-Control 時,指令能夠不區分大小寫。不過建議統一使用小寫。驗證以下:
node cache-directive-case-insensitive.js
,會服務端會將
max-age
寫成大寫,以下
Cache-Control: MAX-AGE=86400
。
max-age 在請求頭中的主要應用爲max-age=0
表示不使用緩存。Chrome 和 Firefox 瀏覽器下的刷新操做(Command+ R / F5)均是在請求頭上添加了max-age=0
指令,表示不使用強緩存,但容許協商緩存(在介紹了協商緩存的Last-Modified
和ETag
以後,能夠自行驗證下這一點)。
刷新時Cache-Control
爲max-age=0
驗證以下:
http://localhost:1030/avatar.jpg
,開啓 Network
此外,經驗證,Chrome 和 Firefox 均對max-age
>0 的狀況支持很差。
Modify Headers
插件(Chrome 和 Firefox 下均有相似插件)給請求添加
max-age=7200
。
node cache-max-age.js
,訪問
http://localhost:1030
,先強刷保證資源更新。
avatar.jpg
,刷新,會發現,資源訪問仍然走的是緩存。若是按照規範的定義應該是不生效。
Cache-Control 中的max-age
指令用於指定緩存過時的相對時間。資源達到指定時間後過時。該功能與 Expires 相似。但其優先級高於 Expires,若是同時設置 max-age 和 Expires,max-age 生效,忽略 Expires。驗證以下:
node cache-max-age+Expires.js
,會同時設置
Cache-Control: max-age=86400
/
Expires: Mon Oct 20 2018 00:00:00 GMT+0800 (CST)
,以下所示。
相反,能夠再試一下,max-age 的有效時間大於 Expires 的狀況,會發現依然是 max-age 生效。
還有一點須要注意的是,no-cache 並非指不緩存文件,no-store 纔是指不緩存文件。no-cache 僅僅是代表跳過強緩存,強制進入協商策略。
http1.0 字段, 一般設置爲Pragma:no-cache
, 做用與Cache-Control:no-cache
相同。當在瀏覽器進行強刷(Comand + Shift + R / Ctrl + F5)或在 NetWork 面板內勾選禁用緩存(Disable Caches)時,會自動帶上Pragma:no-cache
和Cache-Control:no-cache
,而且不會帶上協商策略中所涉及的信息(下面介紹的If-Modified-Since
/If-None-Match
)。這是不會使用任何緩存,從新獲取資源。以下圖所示。
Last-Modified
用於標記請求資源的最後一次修改時間。語法格式爲:Last-Modified: <day-name>,<day> <month> <year> <hour>:<minute>:<second> GMT
,即 GMT(格林尼治標準時間)。可用 new Date().toGMTString()獲取當前 GMT 時間。因爲 Last-Modified 只能精確到秒,所以不適合在一秒內屢次改變的資源。
若是 Expires,Cache-Control: max-age,或 Cache-Control:s-maxage 都沒有在響應頭中出現,而且設置了Last-Modified
時,那麼瀏覽器默認會採用一個啓發式的算法,即啓發式緩存。一般會取響應頭的 Date_value - Last-Modified_value 值的 10%做爲緩存時間。驗證以下:
node cache-Last-Modified.js
,服務器會獲取資源的最後修改時間,設置爲
Last-Modified
的值。訪問
localhost:1030
,查看
avatar.jpg
,以下圖所示:
返回的資源帶有Last-Modified
標識時,再次請求該資源,瀏覽器會自動帶上If-Modified-Since
,值爲返回的Last-Modified
值。請求到達服務器後,服務器進行判斷,若是從上次更新後沒有再更新,則返回 304。若是更新了則從新返回。驗證以下:
node cache-Last-Modified.js
,服務器會獲取資源的最後修改時間,設置爲
Last-Modified
的值。以下圖所示,而且注意看一下資源的大小。
If-Modified-Since
。若是服務器判斷資源未改變,則返回 304,此外因爲服務器返回 304,資源會從緩存獲取,因此資源大小也減小了,以下所示。
index.html
文件的內容,再次刷新。會發現返回變成 200,html 內容更新了,而且返回了新的
Last-Modified
的值,資源大小也相應地改變了。
304 請求也能夠觸發存儲策略,如文章開頭的流程判斷圖所示,可自行驗證,返回時添加相應 header 便可。
注意,If-Modified-Since
只能用於 GET、HEAD 請求。
If-Unmodified-Since
表示資源未修改則正常執行更新,不然返回 412(Precondition Failed)狀態碼的響應。主要有以下兩種場景。
If-Range
字段同時使用時,能夠用來保證新的片斷請求來自一個未修改的文檔。
ETag 是請求資源在服務器的惟一標識,瀏覽器能夠根據 ETag 值緩存數據。在再次請求時經過If-None-Match
攜帶上次的 ETag 值,若是值不變,則返回 304,若是改變你則返回新的內容。
須要注意的是,ETag 和 If-None-Match 的值均爲雙引號包裹的。
驗證步驟與Last-Modified
類似。執行node cache-ETag.js
便可。此處再也不詳述。
If-Match
判斷邏輯邏輯與If-None-Match
相反。
最後,ETag
的優先級高於Last-Modified
。當ETag
和Last-Modified
,ETag
優先級更高,但不會忽略Last-Modified
,須要服務端實現。驗證以下,其中服務端判斷優先級:
node cache-ETag+Last-Modified.js
。服務端會在資源的響應頭中,同時設置
ETag
和
Last-Modified
。以下圖:
index.html
請求時 304。查看 node 日誌,會看到
ETag生效
。以下:
好了,經過長長的第二部分,咱們簡單介紹了一下 HTTP Cache 的基礎知識。下面我再彙總一下各種緩存之間的優缺點吧。以下表所示:
從上面各種緩存的優缺點能夠看出,每一種緩存都不是完美的。因此建議像下面這樣作:
Cache-Control
和
ETag
來控制 HTML 中所使用的靜態資源的緩存。通常是將
Cache-Control
的
max-age
設成一個比較大的值,而後用
ETag
進行驗證。
還有兩個本文沒有介紹的內容,可是不建議你們使用:
看了這麼多內容,是時候來看當作果了。那麼一塊兒看下下面的問題吧。
若是首次訪問localhost:1030
時,頁面中 avatar.png 響應頭信息以下:
HTTP/1.1 200 OK Cache-Control: no-cache Content-Type: image/png Last-Modified: Tue, 16 Oct 2018 11:42:28 GMT Accept-Ranges: bytes Date: Tue, 16 Oct 2018 15:57:21 GMT 複製代碼複製代碼
問題 1:請問當刷新該頁面後,avatar.png 如何二次加載?
問題 2:若是將上述信息中的Cache-Control
設置爲 private,那麼結果又會如何呢?
你們先回憶下上面的內容,思考一下。
試題來源:完全弄懂 Http 緩存機制 - 基於緩存策略三要素分解法。在此致謝。
好了公佈答案。
問題 1:會帶着If-Modified-Since
和服務端進行驗證。未改變返回 304,改變返回 200。
問題 2:Cache-Control
設置爲 private,這時候會觸發啓發式緩存,則再次刷新時,avatar.png 命中強緩存,從緩存中換取。
好了,文章到此結束,但願能對你們有幫助。
感謝《深刻淺出 Vue.js》做者劉博文對本文提出的寶貴建議。