(轉載)完全理解瀏覽器的緩存機制

完全理解瀏覽器的緩存機制

css

概述

瀏覽器的緩存機制也就是咱們說的HTTP緩存機制,其機制是根據HTTP報文的緩存標識進行的,因此在分析瀏覽器緩存機制以前,咱們先使用圖文簡單介紹一下HTTP報文,HTTP報文分爲兩種:git

  • HTTP請求(Request)報文,報文格式爲:請求行 – HTTP頭(通用信息頭,請求頭,實體頭) – 請求報文主體(只有POST纔有報文主體),以下圖
    Request
    Request
  • HTTP響應(Response)報文,報文格式爲:狀態行 – HTTP頭(通用信息頭,響應頭,實體頭) – 響應報文主體,以下圖
    Response
    Response

注:通用信息頭指的是請求和響應報文都支持的頭域,分別爲Cache-Control、Connection、Date、Pragma、Transfer-Encoding、Upgrade、Via;實體頭則是實體信息的實體頭域,分別爲Allow、Content-Base、Content-Encoding、Content-Language、Content-Length、Content-Location、Content-MD五、Content-Range、Content-Type、Etag、Expires、Last-Modified、extension-header。這裏只是爲了方便理解,將通用信息頭,響應頭/請求頭,實體頭都歸爲了HTTP頭。github

以上的概念在這裏咱們不作多講解,只簡單介紹,有興趣的童鞋能夠自行研究。瀏覽器

 

緩存過程分析

瀏覽器與服務器通訊的方式爲應答模式,便是:瀏覽器發起HTTP請求 – 服務器響應該請求。那麼瀏覽器第一次向服務器發起該請求後拿到請求結果,會根據響應報文中HTTP頭的緩存標識,決定是否緩存結果,是則將請求結果和緩存標識存入瀏覽器緩存中,簡單的過程以下圖:
cache緩存

由上圖咱們能夠知道:服務器

  • 瀏覽器每次發起請求,都會先在瀏覽器緩存中查找該請求的結果以及緩存標識post

  • 瀏覽器每次拿到返回的請求結果都會將該結果和緩存標識存入瀏覽器緩存中spa

以上兩點結論就是瀏覽器緩存機制的關鍵,他確保了每一個請求的緩存存入與讀取,只要咱們再理解瀏覽器緩存的使用規則,那麼全部的問題就迎刃而解了,本文也將圍繞着這點進行詳細分析。爲了方便你們理解,這裏咱們根據是否須要向服務器從新發起HTTP請求將緩存過程分爲兩個部分,分別是強制緩存協商緩存 3d

 

強制緩存

強制緩存就是向瀏覽器緩存查找該請求結果,並根據該結果的緩存規則來決定是否使用該緩存結果的過程,強制緩存的狀況主要有三種(暫不分析協商緩存過程),以下:代理

  • 不存在該緩存結果和緩存標識,強制緩存失效,則直接向服務器發起請求(跟第一次發起請求一致),以下圖:
    cache

  • 存在該緩存結果和緩存標識,但該結果已失效,強制緩存失效,則使用協商緩存(暫不分析),以下圖
    cache

  • 存在該緩存結果和緩存標識,且該結果還沒有失效,強制緩存生效,直接返回該結果,以下圖
    cache

那麼強制緩存的緩存規則是什麼?

當瀏覽器向服務器發起請求時,服務器會將緩存規則放入HTTP響應報文的HTTP頭中和請求結果一塊兒返回給瀏覽器,控制強制緩存的字段分別是ExpiresCache-Control,其中Cache-Control優先級比Expires高。

 

Expires

Expires是HTTP/1.0控制網頁緩存的字段,其值爲服務器返回該請求結果緩存的到期時間,即再次發起該請求時,若是客戶端的時間小於Expires的值時,直接使用緩存結果。

Expires是HTTP/1.0的字段,可是如今瀏覽器默認使用的是HTTP/1.1,那麼在HTTP/1.1中網頁緩存仍是否由Expires控制?

到了HTTP/1.1,Expire已經被Cache-Control替代,緣由在於Expires控制緩存的原理是使用客戶端的時間與服務端返回的時間作對比,那麼若是客戶端與服務端的時間由於某些緣由(例如時區不一樣;客戶端和服務端有一方的時間不許確)發生偏差,那麼強制緩存則會直接失效,這樣的話強制緩存的存在則毫無心義,那麼Cache-Control又是如何控制的呢?

 

Cache-Control

在HTTP/1.1中,Cache-Control是最重要的規則,主要用於控制網頁緩存,主要取值爲:

  • public:全部內容都將被緩存(客戶端和代理服務器均可緩存)

  • private:全部內容只有客戶端能夠緩存,Cache-Control的默認取值

  • no-cache:客戶端緩存內容,可是是否使用緩存則須要通過協商緩存來驗證決定

  • no-store:全部內容都不會被緩存,即不使用強制緩存,也不使用協商緩存

  • max-age=xxx (xxx is numeric):緩存內容將在xxx秒後失效

接下來,咱們直接看一個例子,以下:
example

由上面的例子咱們能夠知道:

  • HTTP響應報文中expires的時間值,是一個絕對值

  • HTTP響應報文中Cache-Control爲max-age=600,是相對值

因爲Cache-Control的優先級比expires,那麼直接根據Cache-Control的值進行緩存,意思就是說在600秒內再次發起該請求,則會直接使用緩存結果,強制緩存生效。

注:在沒法肯定客戶端的時間是否與服務端的時間同步的狀況下,Cache-Control相比於expires是更好的選擇,因此同時存在時,只有Cache-Control生效。

瞭解強制緩存的過程後,咱們拓展性的思考一下:

瀏覽器的緩存存放在哪裏,如何在瀏覽器中判斷強制緩存是否生效?

disk
這裏咱們以博客的請求爲例,狀態碼爲灰色的請求則表明使用了強制緩存,請求對應的Size值則表明該緩存存放的位置,分別爲from memory cache 和 from disk cache

那麼from memory cache 和 from disk cache又分別表明的是什麼呢?何時會使用from disk cache,何時會使用from memory cache呢?

from memory cache表明使用內存中的緩存,from disk cache則表明使用的是硬盤中的緩存,瀏覽器讀取緩存的順序爲memory –> disk。

雖然我已經直接把結論說出來了,可是相信有很多人對此不能理解,那麼接下來咱們一塊兒詳細分析一下緩存讀取問題,這裏仍讓以個人博客爲例進行分析:
訪問https://heyingye.github.io/ –> 200 –> 關閉博客的標籤頁 –> 從新打開https://heyingye.github.io/ –> 200(from disk cache) –> 刷新 –> 200(from memory cache)

過程以下:

看到這裏可能有人小夥伴問了,最後一個步驟刷新的時候,不是同時存在着from disk cache和from memory cache嗎?

對於這個問題,咱們須要瞭解內存緩存(from memory cache)和硬盤緩存(from disk cache),以下:

  • 內存緩存(from memory cache):內存緩存具備兩個特色,分別是快速讀取時效性

    • 快速讀取:內存緩存會將編譯解析後的文件,直接存入該進程的內存中,佔據該進程必定的內存資源,以方便下次運行使用時的快速讀取。

    • 時效性:一旦該進程關閉,則該進程的內存則會清空。

  • 硬盤緩存(from disk cache):硬盤緩存則是直接將緩存寫入硬盤文件中,讀取緩存須要對該緩存存放的硬盤文件進行I/O操做,而後從新解析該緩存內容,讀取複雜,速度比內存緩存慢。

在瀏覽器中,瀏覽器會在js和圖片等文件解析執行後直接存入內存緩存中,那麼當刷新頁面時只需直接從內存緩存中讀取(from memory cache);而css文件則會存入硬盤文件中,因此每次渲染頁面都須要從硬盤讀取緩存(from disk cache)。

 

協商緩存

協商緩存就是強制緩存失效後,瀏覽器攜帶緩存標識向服務器發起請求,由服務器根據緩存標識決定是否使用緩存的過程,主要有如下兩種狀況:

  • 協商緩存生效,返回304,以下
    304

  • 協商緩存失效,返回200和請求結果結果,以下
    200

一樣,協商緩存的標識也是在響應報文的HTTP頭中和請求結果一塊兒返回給瀏覽器的,控制協商緩存的字段分別有:Last-Modified / If-Modified-Since和Etag / If-None-Match,其中Etag / If-None-Match的優先級比Last-Modified / If-Modified-Since高。

 

Last-Modified / If-Modified-Since

  • Last-Modified是服務器響應請求時,返回該資源文件在服務器最後被修改的時間,以下。
    last-modify

  • If-Modified-Since則是客戶端再次發起該請求時,攜帶上次請求返回的Last-Modified值,經過此字段值告訴服務器該資源上次請求返回的最後被修改時間。服務器收到該請求,發現請求頭含有If-Modified-Since字段,則會根據If-Modified-Since的字段值與該資源在服務器的最後被修改時間作對比,若服務器的資源最後被修改時間大於If-Modified-Since的字段值,則從新返回資源,狀態碼爲200;不然則返回304,表明資源無更新,可繼續使用緩存文件,以下。
    since

 

Etag / If-None-Match

  • Etag是服務器響應請求時,返回當前資源文件的一個惟一標識(由服務器生成),以下。
    Etag

  • If-None-Match是客戶端再次發起該請求時,攜帶上次請求返回的惟一標識Etag值,經過此字段值告訴服務器該資源上次請求返回的惟一標識值。服務器收到該請求後,發現該請求頭中含有If-None-Match,則會根據If-None-Match的字段值與該資源在服務器的Etag值作對比,一致則返回304,表明資源無更新,繼續使用緩存文件;不一致則從新返回資源文件,狀態碼爲200,以下。
    Etag-match

注:Etag / If-None-Match優先級高於Last-Modified / If-Modified-Since,同時存在則只有Etag / If-None-Match生效。

 

總結

強制緩存優先於協商緩存進行,若強制緩存(Expires和Cache-Control)生效則直接使用緩存,若不生效則進行協商緩存(Last-Modified / If-Modified-Since和Etag / If-None-Match),協商緩存由服務器決定是否使用緩存,若協商緩存失效,那麼表明該請求的緩存失效,從新獲取請求結果,再存入瀏覽器緩存中;生效則返回304,繼續使用緩存,主要過程以下:
all

轉自[完全理解瀏覽器的緩存機制](https://heyingye.github.io/2018/04/16/%E5%BD%BB%E5%BA%95%E7%90%86%E8%A7%A3%E6%B5%8F%E8%A7%88%E5%99%A8%E7%9A%84%E7%BC%93%E5%AD%98%E6%9C%BA%E5%88%B6/)

相關文章
相關標籤/搜索