緩存詳解

前言

總括: 緩存歷來都是前端的一個痛點,不少前端搞不清楚緩存究竟是何物,從而給本身創造了一些麻煩,本文一如既往的用通俗易懂的文字和實例來說述緩存,但願能讓您有所得。javascript

天青色等煙雨,而我在等你。css

正文

緩存是一種保存資源副本並在下次請求時直接使用該副本的技術。

說實話,我起始真的不知道怎麼去介紹緩存,因此引用了上面相對官方的定義。我想幾乎每一個開發者都碰到過緩存的問題吧,甚至有不少狀況下咱們會說這個問題已經修復了,你清理下緩存就行了。這篇文章咱們就細細的來挖掘下緩存的種種軼事。html

?緩存的種類

不少開發者習慣把cookie、webStorage以及IndexedDB存儲的數據也稱之爲緩存,理由是都是保存在客戶端的數據,沒有什麼區別。其實這是不嚴謹的,cookie的存在更多的是爲了讓服務端區別用戶,webStorage和IndexedDB則更多用在保存具體的數據和在客戶端存儲大量結構化數據(文件/blobs)上面。前端

實際上所謂的緩存只有一種——它是請求資源的副本。試想一下,若是每個資源咱們客戶端都會保存一份副本,這會怎麼樣?客戶端會炸掉,開發者會瘋掉!因此咱們須要一份協議來處理緩存,可讓開發者控制緩存的創建和刪除。誰呢?還能有誰,HTTP唄。HTTP協議裏定義了不少關於緩存的請求和響應字段,這也是接下來咱們重點要逼逼叨的對象,研究下到底是哪些字段怎麼影響緩存的。java

納尼?你問我爲何要緩存??node

那就太容易說道了?,緩存好處有不少:jquery

  1. 緩解服務器壓力(不用每次去請求資源);
  2. 提高性能(打開本地資源速度固然比請求回來再打開要快得多);
  3. 減小帶寬消耗(我相信你能夠理解);

?‍♀️那麼問題又來了,既然緩存這麼好,若是我請求的服務器中間有代理也緩存了怎麼辦?代理服務器緩存了個人資源致使我無法從源服務器拿到最新的資源怎麼辦?HTTP固然也想到了這塊的訴求。接下來咱們也會逐層剖析。web

?緩存在宏觀上能夠分紅兩類:私有緩存共享緩存。共享緩存就是那些能被各級代理緩存的緩存(咋以爲有點繞)。私有緩存就是用戶專享的,各級代理不能緩存的緩存。算法

?微觀上能夠分下面三類:chrome

1. 瀏覽器緩存

我相信只要你常用某個瀏覽器?(Chrome,Firefox,IE等),確定知道這些瀏覽器在設置裏面都是有個清除緩存功能,這個功能存在的做用就是刪除存儲在你本地磁盤上資源副本,也就是清除緩存。

緩存存在的意義就是當用戶點擊back按鈕或是再次去訪問某個頁面的時候可以更快的響應。尤爲是在多頁應用的網站中,若是你在多個頁面使用了一張相同的圖片,那麼緩存這張圖片就變得特別的有用。?

2. 代理服務器緩存

代理服務器緩存原理和瀏覽器端相似,但規模要大得多,由於是爲成千上萬的用戶提供緩存機制,大公司和大型的ISP提供商一般會將它們設立在防火牆上或是做爲一個獨立的設備來運營。(下文若是沒有特殊說明,全部提到的緩存服務器都是指代理服務器。)

因爲緩存服務器不是客戶端或是源服務器的一部分,它們存在於網絡中,請求路由必須通過它們纔會生效,因此實際上你能夠去手動設置瀏覽器的代理,或是經過一箇中間服務器來進行轉發,這樣用戶天然就察覺不到代理服務器的存在了。?

代理服務器緩存就是一個共享緩存,不僅爲一個用戶服務,常常爲大量用戶使用,所以在減小相應時間和帶寬使用方面頗有效:由於同一個緩存可能會被重用屢次。

3. 網關緩存

也被稱爲代理緩存或反向代理緩存,網關也是一箇中間服務器,網關緩存通常是網站管理員本身部署,從讓網站擁有更好的性能。?

CDNS(網絡內容分發商)分佈網關緩存到整個(或部分)互聯網上,並出售緩存服務給須要的網站,好比國內的七牛雲、又拍雲都有這種服務。

4. 數據庫緩存

數據庫緩存是指當咱們的應用極其複雜,表天然也很繁雜,咱們必須進行頻繁的進行數據庫查詢,這樣可能致使數據庫不堪重負,一個好的辦法就是將查詢後的數據放到內存中,下一次查詢直接從內存中取就行了。關於數據庫緩存本篇不會展開。?

?瀏覽器的緩存策略

緩存的目標:

  • 一個檢索請求的成功響應: 對於 GET請求,響應狀態碼爲:200,則表示爲成功。一個包含例如HTML文檔,圖片,或者文件的響應;
  • 不變的重定向: 響應狀態碼:301;
  • 可用緩存響應:響應狀態碼:304,這個存在疑問,Chrome會緩存304中的緩存設置,Firefox;
  • 錯誤響應: 響應狀態碼:404 的一個頁面;
  • 不徹底的響應: 響應狀態碼 206,只返回局部的信息;
  • 除了 GET 請求外,若是匹配到做爲一個已被定義的cache鍵名的響應;

以上,對於咱們能夠和應該緩存的目標有個瞭解。?

瀏覽器對於緩存的處理是根據第一次請求資源時返回的響應頭來肯定的。

那麼瀏覽器怎麼肯定一個資源該不應緩存,如何去緩存呢❓響應頭!響應頭!響應頭!重要的事情說三遍。✌️

咱們看?:

Age:23146
Cache-Control:max-age=2592000
Date:Tue, 28 Nov 2017 12:26:41 GMT
ETag:W/"5a1cf09a-63c6"
Expires:Thu, 28 Dec 2017 05:27:45 GMT
Last-Modified:Tue, 28 Nov 2017 05:14:02 GMT
Vary:Accept-Encoding

1. 強緩存階段

以上請求頭來自百度首頁某個CSS文件的響應頭。我去除了一些和緩存無關的字段,只保留了以上部分。咱們來分析下,Expires是HTTP/1.0中的定義緩存的字段,它規定了緩存過時的一個絕對時間。Cache-Control:max-age=2592000是HTTP/1.1定義的關於緩存的字段,它規定了緩存過時的一個相對時間。優先級上固然是版本高的優先了,max-age > Expires

這就是強緩存階段,當瀏覽器再次試圖訪問這個CSS文件,發現有這個文件的緩存,那麼就判斷根據上一次的響應判斷是否過時,若是沒過時,使用緩存。加載文件,OVER!✌️

Firefox瀏覽器表現爲一個灰色的200狀態碼。

Chrome瀏覽器狀態碼錶現爲:

200 (from disk cache)或是200 OK (from memory cache)

多說一點:關於緩存是從磁盤中獲取仍是從內存中獲取,查找了不少資料,得出了一個較爲可信的結論:Chrome會根據本地內存的使用率來決定緩存存放在哪,若是內存使用率很高,放在磁盤裏面,內存的使用率很高會暫時放在內存裏面。這就能夠比較合理的解釋了爲何同一個資源有時是from memory cache有時是from disk cache的問題了。

那麼當這個CSS文件過時了怎麼辦?ETagLast-Modified就該閃亮登場了。

先說Last-Modified,這個字段是文件最後一次修改的時間;

ETag呢?ETag是對文件的一個標記,嗯,能夠這麼說,具體生成方式HTTP並無給出一個明確的方式,因此理論上只要不會重複生成方式無所謂,好比對資源內容使用抗碰撞散列函數,使用最近修改的時間戳的哈希值,甚至只是一個版本號。

2. 協商緩存階段

利用這兩個字段瀏覽器能夠進入協商緩存階段,當瀏覽器再次試圖訪問這個CSS文件,發現緩存過時,因而會在本次請求的請求頭裏攜帶If-Moified-SinceIf-None-Match這兩個字段,服務器經過這兩個字段來判斷資源是否有修改,若是有修改則返回狀態碼200和新的內容,若是沒有修改返回狀態碼304,瀏覽器收到200狀態碼,該咋處理就咋處理(至關於首次訪問這個文件了),發現返回304,因而知道了本地緩存雖然過時但仍然能夠用,因而加載本地緩存。而後根據新的返回的響應頭來設置緩存。(這一步有所差別,發現不一樣瀏覽器的處理是不一樣的,chrome會爲304設置緩存,firefox則不會)?

具體兩個字段攜帶的內容以下(分別和上面的Last-ModifiedETag攜帶的值對應):

If-Moified-Since: Tue, 28 Nov 2017 05:14:02 GMT
If-None-Match: W/"5a1cf09a-63c6"

到這協商緩存結束。

3. 啓發式緩存階段

咱們把上面的響應頭改下:

Age:23146
Cache-Control: public
Date:Tue, 28 Nov 2017 12:26:41 GMT
Last-Modified:Tue, 28 Nov 2017 05:14:02 GMT
Vary:Accept-Encoding

發現沒?瀏覽器用來肯定緩存過時時間的字段一個都沒有!那該怎麼辦?有人可能會說下次請求直接進入協商緩存階段,攜帶If-Moified-Since唄,不是的,瀏覽器還有個啓發式緩存階段?

根據響應頭中2個時間字段 Date 和 Last-Modified 之間的時間差值,取其值的10%做爲緩存時間週期。

這就是啓發式緩存階段。這個階段很容讓人忽視,但實際上每時每刻都在發揮着做用。因此在從此的開發過程當中若是遇到那種默認緩存的坑,不要叫囂,不要生氣,瀏覽器只是在遵循啓發式緩存協議而已。

我畫了下面這張圖,來解釋瀏覽器整個緩存策略的過程:

緩存

?對於緩存策略介紹到這,接下來再細細分析不一樣的HTTP首部字段的內容,以及它們之間的關係。

?HTTP中和緩存相關的首部字段

HTTP報文是什麼呢?就是HTTP報文,這是一個概念,主要由如下兩部分構成:

  1. 首部(header):包含了不少字段,好比:cookie、緩存、報文大小、報文格式等等);
  2. 主體(body):HTTP請求真正要傳輸的部分,好比:一個HTML文檔,一個js文件;

以上咱們知道瀏覽器對於緩存的處理過程,也簡單的提到了幾個相關的字段。?接下來咱們具體看下這幾個字段:

1. 通用首部字段

字段名稱 說明
Cache-Control 控制緩存具體的行爲
Pragma HTTP1.0時的遺留字段,當值爲"no-cache"時強制驗證緩存
Date 建立報文的日期時間(啓發式緩存階段會用到這個字段)

2. 響應首部字段

字段名稱 說明
ETag 服務器生成資源的惟一標識
Vary 代理服務器緩存的管理信息
Age 資源在緩存代理中存貯的時長(取決於max-age和s-maxage的大小)

3. 請求首部字段

字段名稱 說明
If-Match 條件請求,攜帶上一次請求中資源的ETag,服務器根據這個字段判斷文件是否有新的修改
If-None-Match 和If-Match做用相反,服務器根據這個字段判斷文件是否有新的修改
If-Modified-Since 比較資源先後兩次訪問最後的修改時間是否一致
If-Unmodified-Since 比較資源先後兩次訪問最後的修改時間是否一致

4. 實體首部字段

字段名稱 說明
Expires 告知客戶端資源緩存失效的絕對時間
Last-Modified 資源最後一次修改的時間

?瀏覽器緩存控制

HTTP/1.1一共規範了47種首部字段,而和緩存相關的就有以上12個之多。接下來的兩個小節會一個一個介紹給你們。?

1. Cache-Control

經過cache-control的指令能夠控制告訴客戶端或是服務器如何處理緩存。這也是11個字段中指令最多的一個,咱們先來看看請求指令

指令 參數 說明
no-cache 強制源服務器再次驗證
no-store 不緩存請求或是響應的任何內容
max-age=[秒] 緩存時長,單位是秒 緩存的時長,也是響應的最大的Age值
min-fresh=[秒] 必需 指望在指定時間內響應仍然有效
no-transform 代理不可更改媒體類型
only-if-cached 從緩存獲取
cache-extension - 新的指令標記(token)

響應指令

指令 參數 說明
public 任意一方都能緩存該資源(客戶端、代理服務器等)
private 可省略 只能特定用戶緩存該資源
no-cache 可省略 緩存前必須先確認其有效性
no-store 不緩存請求或響應的任何內容
no-transform 代理不可更改媒體類型
must-revalidate 可緩存但必須再向源服務器進確認
proxy-revalidate 要求中間緩存服務器對緩存的響應有效性再進行確認
max-age=[秒] 緩存時長,單位是秒 緩存的時長,也是響應的最大的Age值
s-maxage=[秒] 必需 公共緩存服務器響應的最大Age值
cache-extension - 新指令標記(token

請注意no-cache指令不少人誤覺得是不緩存,這是不許確的,no-cache的意思是能夠緩存,但每次用應該去想服務器驗證緩存是否可用。no-store纔是不緩存內容。另外部分指令也能夠組合使用,好比:

Cache-Control: max-age=100, must-revalidate, public

上面指令的意思是緩存的有效時間爲100秒,以後訪問須要向源服務器發送請求驗證,此緩存可被代理服務器和客戶端緩存。

2. Pragma

這是HTTP/1.0裏面的一個字段,但優先級很高,測試發現,Chrome和Firefox中Pragma的優先級高於Cache-Control和Expires,爲了向下兼容,這個字段依然發揮着它的做用。?通常可能咱們會這麼用:

<meta http-equiv="Pragma" content="no-cache">

Pragma屬於通用首部字段,在客戶端上使用時,常規要求咱們往html上加上上面這段meta元標籤(並且可能還得作些hack放到body後面去

事實上這種禁用緩存的形式用處頗有限:

  1. 僅有IE才能識別這段meta標籤含義,其它主流瀏覽器僅能識別Cache-Control: no-store的meta標籤(見出處)
  2. 在IE中識別到該meta標籤含義,並不必定會在請求字段加上Pragma,但的確會讓當前頁面每次都發新請求(僅限頁面,頁面上的資源則不受影響)。——淺談瀏覽器http的緩存機制

讀者能夠自行拷貝後面模擬服務端決策的代碼進行測試。

服務端響應添加'Pragma': 'no-cache',瀏覽器表現行爲和強制刷新相似。

3. Expires

這又是一個HTTP/1.0的字段,上面也說過了定義的是緩存到期的絕對時間。

一樣,咱們也能夠在html文件裏直接使用:

<meta http-equiv="expires" content="Thu, 30 Nov 2017 11:17:26 GMT">

若是設置的是已通過去的時間會怎樣呢?YES!!!則刷新頁面會從新發送請求。

Pragma禁用緩存,若是又給Expires定義一個還未到期的時間,那麼Pragma字段的優先級會更高。?

?Expires有一個很大的弊端,就是它返回的是服務器的時間,但判斷的時候用的倒是客戶端的時間,這就致使Expires很被動,由於用戶有可能改變客戶端的時間,致使緩存時間判斷出錯,這也是引入Cache-Control:max-age指令的緣由之一。

4. Last-Midified

接下來這幾個字段都是校驗字段,或者說是在協商緩存階段發揮做用的字段。第一個就是Last-modified,這個字段不光協商緩存起做用,在啓發式緩存階段一樣起到相當重要的做用。

在瀏覽器第一次請求某一個URL時,服務器端的返回狀態碼會是200,響應的實體內容是客戶端請求的資源,同時有一個Last-Modified的屬性標記此文件在服務器端最後被修改的時間。like this:

Last-Modified : Fri , 12 May 2006 18:53:33 GMT
If-Modified-Since

當瀏覽器第二次請求這個URL的時候,根據HTTP協議規定,瀏覽器會把第一次Last-Modified的值存儲在If-Modified-Since裏面發送給服務端來驗證資源有沒有修改。like this:

If-Modified-Since : Fri , 12 May 2006 18:53:33 GMT

服務端經過If-Modified-Since字段來判斷在這兩次訪問期間資源有沒有被修改過,從而決定是否返回完整的資源。若是有修改正常返回資源,狀態碼200,若是沒有修改只返回響應頭,狀態碼304,告知瀏覽器資源的本地緩存還可用。

用途:

  • 驗證本地緩存是否可用
If-Unmodified-Since

這個字段字面意思和If-Modified-Since相反,但處理方式並非相反的。若是文件在兩次訪問期間沒有被修改則返回200和資源,若是文件修改了則返回狀態碼412(預處理錯誤)。

用途:

  • 與含有 If-Range消息頭的範圍請求搭配使用,實現斷點續傳的功能,即若是資源沒修改繼續下載,若是資源修改了,續傳的意義就沒有了。
  • POST、PUT請求中,優化併發控制,即當多用戶編輯用一份文檔的時候,若是服務器的資源已經被修改,那麼在對其做出編輯會被拒絕提交。

?Last-Modified有幾個缺點:無法準確的判斷資源是否真的修改了,好比某個文件在1秒內頻繁更改了屢次,根據Last-Modified的時間(單位是秒)是判斷不出來的,再好比,某個資源只是修改了,但實際內容並無發生變化,Last-Modified也沒法判斷出來,所以在HTTP/1.1中還推出了ETag這個字段?

5. ETag

服務器能夠經過某種自定的算法對資源生成一個惟一的標識(好比md5標識),而後在瀏覽器第一次請求某一個URL時把這個標識放到響應頭傳到客戶端。服務器端的返回狀態會是200。

ETag: abc-123456

ETag的值有可能包含一個 W/ 前綴,來提示應該採用弱比較算法(這個是多此一舉,由於 If-None-Match 用且僅用這一算法)。?

If-None-Match

If-None-Match和If-Modified-Since同時存在的時候If-None-Match優先級更高。

當瀏覽器第二次請求這個URL的時候,根據HTTP協議規定,瀏覽器回把第一次ETag的值存儲在If-None-Match裏面發送給服務端來驗證資源有沒有修改。like this:

If-None-Match: abc-123456

Get請求中,當且僅當服務器上沒有任何資源的ETag屬性值與這個首部中列出的相匹配的時候,服務器端會才返回所請求的資源,響應碼爲200。若是沒有資源的ETag值相匹配,那麼返回304狀態碼。

POST、PUT等請求改變文件的請求,若是沒有資源的ETag值相匹配,那麼返回412狀態碼。

If-Match

在請求方法爲 GET) 和 HEAD的狀況下,服務器僅在請求的資源知足此首部列出的 ETag 之一時纔會返回資源。而對於 PUT或其餘非安全方法來講,只有在知足條件的狀況下才能夠將資源上傳。

用途:

  • For GET和 HEAD 方法,搭配 Range首部使用,能夠用來保證新請求的範圍與以前請求的範圍是對同一份資源的請求。若是 ETag 沒法匹配,那麼須要返回 416(範圍請求沒法知足) 響應。
  • 對於其餘方法來講,尤爲是 PUT, If-Match 首部能夠用來避免更新丟失問題。它能夠用來檢測用戶想要上傳的不會覆蓋獲取原始資源以後作出的更新。若是請求的條件不知足,那麼須要返回412(預處理錯誤) 響應。

固然和Last-Modified相比,ETag也有本身的缺點,好比因爲須要對資源進行生成標識,性能方面就勢必有所犧牲。?

關於強校驗和弱校驗:

ETag 1 ETag 2 Strong Comparison Weak Comparison
W/"1" W/"1" no match match
W/"1" W/"2" no match no match
W/"1" "1" no match match
"1" "1" match match

?服務端緩存控制

ExpiresCache-Control:max-age=xxx同時存在的時候取決於緩存服務器應用的HTTP版本。應用HTTP/1.1版本的服務器會優先處理max-age,忽略Expires,而應用HTTP/1.0版本的緩存服務器則會優先處理Expires而忽略max-age。接下來看下和緩存服務器相關的兩個字段。

6. Vary

Vary用來作什麼的呢?試想這麼一個場景:在某個網頁中網站提供給移動端的內容是不一樣的,怎麼讓緩存服務器區分移動端和PC端呢?不知道你是否注意,瀏覽器在每次請求都會攜帶UA字段來代表來源,因此咱們能夠利用User-Agent字段來區分不一樣的客戶端,用法以下:

Vary: User-Agent

再好比,源服務器啓用了gzip壓縮,但用戶使用了比較舊的瀏覽器,不支持壓縮,緩存服務器如何返回?就能夠這麼設定:

Vary: Accept-Encoding

固然,也能夠這麼用:

Vary: User-Agent, Accept-Encoding

這意味着緩存服務器會以 User-Agent Accept-Encoding 兩個請求首部字段來區分緩存版本。根據請求頭裏的這兩個字段來決定返回給客戶端什麼內容。

7. Age

這個字段說的是資源在緩存服務器存在的時長,前面也說了Cache-Control: max-age=[秒]就是Age的最大值。

這個字段存在的意義是什麼呢?用來區分請求的資源來自源服務器仍是緩存服務器的緩存的。

?但得結合另外一個字段來進行判斷,就是Date,Date是報文建立的時間。

Date

若是按F5頻繁刷新發現響應裏的Date沒有改變,就說明命中了緩存服務器的緩存如下面的一個響應爲?:

Accept-Ranges: bytes
Age: 1016859
Cache-Control: max-age=2592000
Content-Length: 14119
Content-Type: image/png
Date: Fri, 01 Dec 2017 12:27:25 GMT
ETag: "5912bfd0-3727"
Expires: Tue, 19 Dec 2017 17:59:46 GMT
Last-Modified: Wed, 10 May 2017 07:22:56 GMT
Ohc-Response-Time: 1 0 0 0 0 0
Server: bfe/1.0.8.13-sslpool-patch

如上圖來自百度首頁某個圖片的響應字段。咱們能夠看到Age=1016859,說明這個資源已經在緩存服務器存在了1016859秒。若是文件被修改或替換,Age會從新由0開始累計。

Age消息頭的值一般接近於0。表示此消息對象剛剛從原始服務器獲取不久;其餘的值則是表示代理服務器當前的系統時間與此應答消息中的通用消息頭 Date的值之差。

上面這個結論歸結爲一個等式就是:

靜態資源Age + 靜態資源Date = 原服務端Date

?用戶操做行爲對緩存的影響

搜索了好久有沒有關於這方面的權威總結,最後居然在百度百科找到了也是很驚訝,我本身加了一條用戶強制刷新操做瀏覽器的反應。強制刷新,window下是Ctrl+F5,mac下就是command+shift+R操做了。

操做 說明
打開新窗口 若是指定cache-control的值爲private、no-cache、must-revalidate,那麼打開新窗口訪問時都會從新訪問服務器。而若是指定了max-age值,那麼在此值內的時間裏就不會從新訪問服務器,例如:Cache-control: max-age=5 表示當訪問此網頁後的5秒內不會去再次訪問服務器.
在地址欄回車 若是值爲private或must-revalidate,則只有第一次訪問時會訪問服務器,之後就再也不訪問。若是值爲no-cache,那麼每次都會訪問。若是值爲max-age,則在過時以前不會重複訪問。
按後退按扭 若是值爲private、must-revalidate、max-age,則不會重訪問,而若是爲no-cache,則每次都重複訪問.
按刷新按扭 不管爲什麼值,都會重複訪問.(可能返回狀態碼:200、304,這個不一樣瀏覽器處理是不同的,FireFox正常,Chrome則會啓用緩存(200 from cache))
按強制刷新按鈕 當作首次進入從新請求(返回狀態碼200)

來自百度百科

若是想在瀏覽器點擊「刷新」按鈕的時候不讓瀏覽器去發新的驗證請求呢?辦法找到一個,知乎上面一個回答,在頁面加載完畢後經過腳本動態地添加資源:

$(window).load(function() {
      var bg='http://img.infinitynewtab.com/wallpaper/100.jpg';
      setTimeout(function() {
        $('#bgOut').css('background-image', 'url('+bg+')');
      },0);
});

來自知乎

?HTML5的緩存

這部分準備的說應該叫離線存儲。如今比較廣泛用的是Appcache,但Appcache已經從web標準移除了,在可預見的將來裏,ServiceWorker可能會是一個比較適合的解決方案。

1. Appcache

這是HTML5的一個新特性,經過離線存儲達到用戶在沒有網絡鏈接的狀況下也能訪問頁面的功能。離線狀態下即便用戶點擊刷新都能正常加載文檔。

使用方法以下,在HTML文件中引入appcache文件:

<!DOCTYPE html>
<html manifest="manifest.appcache">
<head>
  <meta charset="UTF-8">
  <title>***</title>
</head>
<body>
  <div id="root"></div>
</body>
</html>

?web 應用中的 manifest 特性能夠指定爲緩存清單文件的相對路徑或一個絕對 URL(絕對 URL 必須與應用同源)。緩存清單文件可使用任意擴展名,但傳輸它的 MIME 類型必須爲 text/cache-manifest。

注意:在 Apache 服務器上,若要設置適用於清單(.appcache)文件的 MIME 類型,能夠向根目錄或應用的同級目錄下的一個 .htaccess 文件中增長 AddType text/cache-manifest .appcache
CACHE MANIFEST
# 註釋:須要緩存的文件,不管在線與否,均從緩存裏讀取
# v1 2017-11-30
# This is another comment
/static/logo.png

# 註釋:不緩存的文件,始終從網絡獲取
NETWORK:
example.js

# 註釋:獲取不到資源時的備選路徑,如index.html訪問失敗,則返回404頁面
FALLBACK:
index.html 404.html

上面就是一個完整的緩存清單文件的示例。

注意:主頁必定會被緩存起來的,由於AppCache主要是用來作離線應用的,若是主頁不緩存就沒法離線查看了,所以把index.html添加到NETWORK中是不起效果的。

實際上這個特性已經web標準中刪除,但如今爲止還有不少瀏覽器支持它,因此這裏提一下。

你能夠用最新的Firefox(版本 57.0.1)測試下,控制檯會有這麼一行字?:

程序緩存 API(AppCache)已不同意使用,幾天後將被移除。需離線支持請嘗試使用 Service Worker。

最新Chrome(版本 62.0.3202.94)卻是沒有這個警告。?

AppCache之因此不受待見我想了下面幾個緣由:

  1. 一旦使用了manifest後,沒辦法清空這些緩存,只能更新緩存,或者得用戶本身去清空瀏覽器的緩存;
  2. 假如更新的資源中有一個資源更新失敗了,那麼全部的資源就會所有更新失敗,將用回上一版本的緩存;
  3. 主頁會被強制緩存(使用了manifest的頁面),而且沒法清除;
  4. appache文件可能會沒法被及時更新,由於各大瀏覽器對於appcache文件的處理方式不一樣;
  5. 以上幾個弊端一旦出問題,會讓用戶抓狂更會讓開發者抓狂!

2. Service Worker

Service worker仍是一個實驗性的功能,線上環境不推薦使用。?這裏大概介紹一下。

Service worker本質上充當Web應用程序與瀏覽器之間的代理服務器。

?首先講個小故事:

咱們都知道瀏覽器的js引擎處理js是單線程的,它就好像一個大Boss高高在上,同一個時間它只作一個事情(就是那麼傲嬌),基於這個弊端,W3C(HR)給大Boss招聘了一個祕書(web worker),大Boss能夠把瑣碎的事情交給祕書web worker去作,作完了發個微信(postMessage)通知大Boss,大Boss經過onmessage來獲取祕書web worker作的事情的結果。傍晚時分,下班時間到!大Boss回家哄兒子了,祕書也出去約會去了,沒人加班了!這怎麼行!W3C(HR)又提出了招個程序?的想法的想法,OK,Service Worker應聘成功!因而,程序?就堅持在工做崗位上了,今後開啓沒完沒了的加班之路。總的來講這隻猿的工做是這樣的:

  • 後臺數據同步
  • 響應來自其它源的資源請求
  • 集中接收計算成本高的數據更新,好比地理位置和陀螺儀信息,這樣多個頁面就能夠利用同一組數據
  • 在客戶端進行CoffeeScript,LESS,CJS/AMD等模塊編譯和依賴管理(用於開發目的)
  • 後臺服務鉤子
  • 自定義模板用於特定URL模式
  • 性能加強,好比預取用戶可能須要的資源

——Service Worker API

注意:Service workers之因此優於之前同類嘗試(如上面提到的AppCache)),是由於它們沒法支持當操做出錯時終止操做。Service workers能夠更細緻地控制每一件事情。如何控制的呢?

Service workers利用了ES6中比較重要的特性Promise,而且在攔截請求的時候使用的是新的fetch API,之因此使用fetch就是由於fetch返回的是Promise對象。能夠說Service workers重要組成部分就是三塊:事件、Promise和Fetch請求。OK,talk is cheap,show you the code。?

首先咱們看下app.js文件:告訴瀏覽器註冊某個JavaScript文件爲service worker,檢查service worker API是否可用,若是可用就註冊service worker:

//使用 ServiceWorkerContainer.register()方法首次註冊service worker。
if (navigator.serviceWorker) {
      navigator.serviceWorker.register('./sw.js', {scope: './'})
          .then(function (registration) {
              console.log(registration);
          })
          .catch(function (e) {
              console.error(e);
          });
} else {
      console.log('該瀏覽器不支持Service Worker');
}

再來看看具體做爲service worker的文件sw.js,例子以下:

const CACHE_VERSION = 'v1'; // 緩存文件的版本
const CACHE_FILES = [ // 須要緩存的文件
    './test.js',
    './app.js',
    'https://code.jquery.com/jquery-3.0.0.min.js'
];

self.addEventListener('install', function (event) { // 監聽worker的install事件
    event.waitUntil( // 延遲install事件直到緩存初始化完成
        caches.open(CACHE_VERSION)
        .then(function (cache) {
            console.log('緩存打開');
            return cache.addAll(CACHE_FILES);
        })
    );
});

self.addEventListener('activate', function(event) {// 監聽worker的activate事件
    event.waitUntil(// 延遲activate事件直到
        caches.keys().then(function(keys) {
            return Promise.all(keys.map(function(key, i){
                if(key !== CACHE_VERSION){
                    return caches.delete(keys[i]); // 清除舊版本緩存
                }
            }))
        })
    )
});

self.addEventListener('fetch', function(event) { // 截取頁面的資源請求
    event.respondWith(
        caches.match(event.request).then(function(res) { // 判斷緩存是否命中
            if (res) { // 返回緩存中的資源
                return res;
            }
            _request(event); // 執行請求備份操做
        })
    )
});

function _request(event) {
    var url = event.request.clone();
    return fetch(url).then(function(res) {// 使用fetch請求線上資源
        // 錯誤判斷
        if (!res || res.status !== 200 || res.type !== 'basic') {
            return res;
        }

        var response = res.clone(); // 建立了一個響應對象的克隆,儲藏在一個單獨的變量中

        caches.open(CACHE_VERSION).then(function(cache) {// 緩存從線上獲取的資源
            cache.put(event.request, response);
        });
        return res;
    })
}

清除一個Service Worker也很簡單:

if ('serviceWorker' in navigator) {
  navigator.serviceWorker.register('/sw.js', {scope: './'}).then(function(registration) {
    // registration worked
    console.log('Registration succeeded.');
    registration.unregister().then(function(boolean) {
      // if boolean = true, unregister is successful
    });
  }).catch(function(error) {
    // registration failed
    console.log('Registration failed with ' + error);
  });
};

相對AppCache來講,Service Worker的API增多了很多,用法也更復雜了些,但看得出Service Worker纔是將來,對於web app來講,更是如虎添翼。如今支持Service Worker的瀏覽器除了Chrome和Firefox,最近新添一個生力軍——Safari也支持Service Worker了。期待它在將來大放異彩吧。?

?模擬實現服務端決策

以下,使用node原生代碼簡單的模擬下服務器發送響應的過程,包括對於協商緩存的處理過程:

var http = require('http');
var fs = require('fs');
var url = require('url');

process.env.TZ = 'Europe/London';

let tag = '123456';

http.createServer( function (request, response) {  

   var pathname = url.parse(request.url).pathname;

       console.log("Request for " + pathname + " received.");
       const fileMap = {
       'js': 'application/javascript; charset=utf-8',
       'html': 'text/html',
       'png': 'image/png',
       'jpg': 'image/jpeg',
       'gif': 'image/gif',
       'ico': 'image/*',
       'appcache': 'text/cache-manifest'
       }
       fs.readFile(pathname.substr(1), function (err, data) {
        if (request.headers['if-none-match'] === tag) {
            response.writeHead(304, {
                'Content-Type': fileMap[pathname.substr(1).split('.')[1]],
                'Expires': new Date(Date.now() + 30000),
                'Cache-Control': 'max-age=10, public',
                'ETag': tag,
                'Last-Modified': new Date(Date.now() - 30000),
                'Vary': 'User-Agent'
            });
       } else {             
            response.writeHead(200, {
                'Content-Type': fileMap[pathname.substr(1).split('.')[1]],
                'Cache-Control': 'max-age=10, public',
                'Expires': new Date(Date.now() + 30000),
                'ETag': tag,
                'Last-Modified': new Date(Date.now() - 30000),
                'Vary': 'User-Agent'
            });
            response.write(fs.readFileSync(pathname.substr(1)));        
          }
          response.end();
       });   
}).listen(8081);

如上代碼。若是你沒使用過node,拷貝下代碼存爲file.js,安裝node,命令行輸入node file.js,能夠在同目錄下創建index.html文件,在html文件中引用一些圖片,CSS等文件,瀏覽器輸入localhost:8081/index.html進行模擬。?

?關於緩存的一些問答

1. 問題:請求被緩存,致使新代碼未生效

解決方案:
  • 服務端響應添加Cache-Control:no-cache,must-revalidate指令;
  • 修改請求頭If-modified-since:0If-none-match
  • 修改請求URL,請求URL後加隨機數,隨機數能夠是時間戳,哈希值,好比:http://damonare.cn?a=1234

2. 問題:服務端緩存致使本地代碼未更新

解決方案:
  • 合理設置Cache-Control:s-maxage指令;
  • 設置Cache-Control:private指令,防止代理服務器緩存資源;
  • CDN緩存可使用管理員設置的緩存刷新接口進行刷新;

3. 問題: Cache-Control: max-age=0 和 no-cache有什麼不一樣

回答:

max-age=0no-cache應該是從語氣上不一樣。max-age=0是告訴客戶端資源的緩存到期應該向服務器驗證緩存的有效性。而no-cache則告訴客戶端使用緩存前必須向服務器驗證緩存的有效性。

後記

參考文檔:

相關文章
相關標籤/搜索