細說HTTP緩存

時間 2019-11-10

標籤細說 http 緩存欄目 HTTP/TCP 简体版

原文原文鏈接

爲何要使用緩存？

緩存是能夠自動保存爲常見文檔副本的 HTTP 設備，當 web 請求抵達緩存時。若是本地有已緩存了的副本，就能夠從本地存儲設備上直接提取這個文檔，而不用去服務器中提取。css

緩存能夠幫助咱們：html

緩解服務器壓力，提升了網站性能
加快了網頁加載速度，提高了用戶的使用體驗
減小了冗餘的數據傳輸，幫助網絡運營減小了流量

HTTP 緩存處理流程

第一步：接收請求並解析

緩存從網絡中讀取抵達的請求報文，而後將請求報文解析成片斷，將首部的各個部分放入易於操做的數據結構中，這樣緩存就更容易處理首部字段並修改它們了web

第二步：查找緩存副本

緩存獲取 URL，查找本地副本。本地副本存儲在內存、本地磁盤等地方，緩存會確認本地緩存中是否有這個對象，查找會有如下兩種結果：瀏覽器

第一種結果：未找到可用副本

到達緩存的請求由於沒有查找到可用的副本，會將請求轉發給原始服務器去獲取資源（緩存未命中），並將該資源緩存在本地緩存

第二種結果：已找到可用副本

到達緩存的請求查找到了可用副本，在向客戶端提供該文檔以前，HTTP 會對此文檔進行新鮮度檢測。安全

HTTP 經過緩存將服務器文檔的副本保留一段時間，這段時間內（默認一小時或一天）都認爲文檔是新鮮的，緩存能夠在不聯繫服務器的狀況下直接提供向客戶提供該文檔（緩存命中，200 OK）。服務器

一旦已緩存副本停留的時間過長，超過了文檔的新鮮度限值，就會認爲該對象不新鮮，這種狀況下緩存會向服務器發送一個再驗證請求來進行確認，以便查看文檔是否發生了變化，再驗證可能的結果以下：網絡

再驗證命中

若是內容沒有變化，服務器會向客戶端發送一個HTTP 304 Not Modified 的響應，緩存知道副本仍然有效了，就會對該緩存文檔新鮮度進行更新，而後將緩存文檔返回給客戶端。數據結構

再驗證未命中

若是服務器的內容有變化，就從服務器上從新獲取該資源，並更新本地的緩存數據（200 OK）性能

對象被刪除

若是內容被刪除，服務器返回一個404 Not Found，緩存也會將其副本刪除掉。

新鮮度檢測流程：

瀏覽器第一次向服務器發起請求：
服務端在響應頭返回協商緩存的頭屬性：ETag、Last-Modified；

瀏覽器第二次向服務器發發起請求：
在請求頭中帶上與 ETag 對應的 If-Not-Match（值爲上次請求時返回響應頭的 ETag 值）和與 Last-Modified 對應的 If-Modified-Since。

服務器接收到這兩個參數後會做比較，看看資源有沒有失效或者有更改。若是返回的是 304 狀態碼，則表示資源沒有任何修改，緩存會標記副本爲新鮮並把資源返回給客戶端，不然服務器會返回200 狀態碼，直接返回一份新的資源。

第三步：建立響應

緩存將副本返回給客戶端的時候，會將已緩存的服務器響應首部做爲響應首部的起點，而後在這基礎上對首部進行了修改和擴充，以便於客戶端的要求相匹配，並且還會插入新鮮度的值信息（Cache-control、Age、Expires首部）及一個Via首部來講明該請求來自代理緩存。

第四步：發送相應給客戶端

響應首部準備完畢後，緩存會將該響應返回給客戶端。

HTTP 緩存的分類

HTTP 可分爲強緩存和協商緩存，二者的本質區別就在因而否要和服務器進行交互，詳細以下：

第一類：強緩存

在緩存未失效的狀況下，可直接由緩存提供資源給客戶端使用（狀態碼 200），而不用去請求服務端。緩存命中就屬於強緩存。

和強緩存有關屬性有（優先級由高到低）：Pragma、Cache-Control、Expires

Pragma

html<meta http-equiv='Pragma' content='no-cache'/>

若是 html 的 meta 標籤若是這樣的話，它的意思是能夠告訴瀏覽器當前頁面不被緩存，每次訪問都須要去服務器拉取。這種方法使用上很簡單，但只有部分瀏覽器能夠支持，並且全部緩存代理服務器都不支持，由於代理不解析HTML內容自己。

上述代碼的做用是告訴瀏覽器當前頁面不被緩存，每次訪問都須要去服務器拉取。這種方法使用上很簡單，但只有部分瀏覽器能夠支持，並且全部緩存代理服務器都不支持，由於代理不解析HTML內容自己。

Expire

http/1.0 提出，一個表示資源過時時間的 header，描述的是一個絕對時間，由服務器返回，值是用 GMT 格式的字符串表示，如：Expires:Thu, 31 Dec 2016 23:55:55 GMT

讀取緩存數據條件：緩存過時時間（服務器的）< 當前時間（客戶端的）

缺點：它是服務器返回的一個絕對時間，所以若是客戶端和服務端時間不匹配的話，就容易出現偏差，所以 http/1.1版本開始使用 Cache-Control 來代替它

Cache-Control

它描述的是一個相對時間，在進行緩存命中的時候，都是利用客戶端時間來判斷的，因此想比較 Expire 來講，Cache-Control 更有效更安全一些，它的可選屬性以下：

no-cache：不使用強緩存，使用協商緩存
no-store：不適用緩存，每次都是請求新的下載資源
max-age：緩存時長（秒）
public/private：緩存共有或私有
must-revalidate：每次訪問須要緩存校驗

第二類：協商緩存

已緩存副本停留時間過長，被認爲不新鮮的時候，緩存要和服務器進行交互，向服務器發送再驗證請求。緩存再驗證命中（狀態碼 304）和緩存再驗證未命中（狀態碼 200）就屬於協商緩存。

和協商緩存有關的屬性有（優先級由高到低）：ETag/If-Not-Match、Last-Modified/If-Modified-Since：

ETag：hash值，能精確的判斷資源有沒有被修改，可識別一秒內的修改次數
Last-Modified：GMT格式的最後修改時間，只要資源有修改，不管內容是否變化都會將資源返回客戶端，以時刻做爲表示，沒法獲取一秒內的修改變化

如何設置 HTTP 緩存？

緩存通常狀況下都是在服務器上配置的，可是若是咱們想在無需 web 服務器的配置文件進行交互的狀況下控制緩存，能夠經過HTML 的 meta 標籤來配置，以下：

html 頁面配置緩存

<meta http-equiv='Cache-Control' content='max-age=7200'/>
<meta http-qeuiv='Expires' content='Mon, 20 Aug 2018 23:00:00 GMT'/>

html 頁面禁用緩存配置

<meta http-equiv='Pragma' content='no-cache'/>
<meta http-equiv='Cache-Control' content='no-cache'/>
<meta http-equiv='Expires' content='0'/>

以上這些配置方法，web 服務器會爲 html 解析 html <meta http-equiv>標籤，並將規定首部插入 HTTP 響應中，部首名稱從 HTTP-EQUIV 屬性中獲取，部首值從 CONTENT 屬性中獲取。

可是支持這個可選特性會增長服務器額外負載，這些值也只是靜態的，而且只支持 html，不支持其餘文件類型，因此不多有 web 服務器和代理支持此特性。

並且，這種方式的效果也不是很好，大多數軟件都會忽略 HTTP-EQUIV 標籤，即便支持 HTTP-EQUIV 標籤的 html 瀏覽器使用的 Cache-Control 規則可能也會與攔截代理緩存所用的規則不一樣，這樣會使緩存的過時處理行爲發生混亂。

所以，由通過正確配置的服務器發送的 HTTP 首部來交流對文檔的緩存控制請求是惟一可靠的辦法。

實際應用

咱們在項目中，若是很好的應用緩存呢？

通常狀況下，咱們會對css、js、logo、圖片等這些不太常常變更的資源應用緩存，一些設計到業務的比較敏感的文件不適合應用緩存。

資料

🍃 說說web緩存-強緩存、協商緩存

🍃 一文讀懂http緩存（超詳細）

🍃 《HTTP 權威指南》

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。