最近在項目中遇到了IE瀏覽器因緩存問題未能成功向後端發送GET
類型請求的bug,而後順藤摸瓜順便看了看緩存的知識,以爲有必要總結一下。php
在前端開發中,性能一直都是被你們所重視的一點,然而判斷一個網站的性能最直觀的就是看網頁打開的速度。其中提升網頁反應速度的一個方式就是使用緩存。一個優秀的緩存策略能夠縮短網頁請求資源的距離,減小延遲,而且因爲緩存文件能夠重複利用,還能夠減小帶寬,下降網絡負荷。css
web緩存是指一個web資源(如html頁面,圖片,js,數據等)存在於web服務器和客戶端(瀏覽器)之間的副本。html
緩存會根據進來的請求保存輸出內容的副本;當下一個請求來到的時候,若是是相同的URL,緩存會根據緩存機制決定是直接使用副本響應訪問請求,仍是向源服務器再次發送請求。比較常見的就是瀏覽器會緩存訪問過網站的網頁,當再次訪問這個URL地址的時候,若是網頁沒有更新,就不會再次下載網頁,而是直接使用本地緩存的網頁。只有當網站明確標識資源已經更新,瀏覽器纔會再次下載網頁。至於瀏覽器和網站服務器是如何標識網站頁面是否更新的機制,將在後面介紹。前端
web緩存的做用顯而易見:web
web緩存大體能夠分爲如下幾種類型:數據庫
瀏覽器經過代理服務器向源服務器發起請求的原理以下圖:後端
瀏覽器先向代理服務器發起web請求,再將請求轉發到源服務器。它屬於共享緩存,因此不少地方均可以使用其緩存資源,所以對於節省流量有很大做用。瀏覽器
瀏覽器緩存是將文件保存在客戶端,在同一個會話過程當中會檢查緩存的副本是否足夠新,在後退網頁時,訪問過的資源能夠從瀏覽器緩存中拿出使用。經過減小服務器處理請求的數量,用戶將得到更快的體驗緩存
下面着重關注一下瀏覽器緩存。安全
全部的緩存都是基於一套規則來幫助他們決定何時使用緩存中的副本提供服務(假設有副本可用的狀況下,未被銷燬回收或者未被刪除修改)。這些規則有的在協議中有定義(如HTTP協議1.0和1.1),有的則是由緩存的管理員設置(如DBA、瀏覽器的用戶、代理服務器管理員或者應用開發者)。
對於瀏覽器端的緩存來說,這些規則是在HTTP協議頭和HTML頁面的Meta
標籤中定義的。他們分別從新鮮度和校驗值兩個維度來規定瀏覽器是直接使用緩存中的副本,仍是須要去源服務器獲取更新的版本。
新鮮度(過時機制):也就是緩存副本有效期。一個緩存副本必須知足如下任一條件,瀏覽器會認爲它是有效的,足夠新的,而直接從緩存中獲取副本並渲染:
Meta
標籤<META HTTP-EQUIV="Pragma" CONTENT="no-cache">
上述代碼的做用是告訴瀏覽器當前頁面不被緩存,每次訪問都須要去服務器拉取。使用上很簡單,但只有部分瀏覽器能夠支持,並且全部緩存代理服務器都不支持,由於代理不解析HTML內容自己。
能夠經過這個頁面測試你的瀏覽器是否支持:Pragma No-Cache Test。
一個URI的完整HTTP協議交互過程是由HTTP請求和HTTP響應組成的。有關HTTP詳細內容可參考《Hypertext Transfer Protocol — HTTP/1.1》、《HTTP協議詳解》等。
在HTTP請求和響應的消息報頭中,常見的與緩存有關的消息報頭有:
Cache-Control
cache-control的種類這麼多,然而怎麼使用它們呢:
max-age(單位爲s)指定設置緩存最大的有效時間,定義的是時間長短。當瀏覽器向服務器發送請求後,在max-age這段時間裏瀏覽器就不會再向服務器發送請求了。
咱們來找個資源看下。好比QQ推廣上的css資源,max-age=3600,也就是說緩存有效期爲3600秒(也就是1h)。因而在1小時內都會使用這個版本的資源,即便服務器上的資源發生了變化,瀏覽器也不會獲得通知。max-age會覆蓋掉Expires,後面會有討論。
Cache-Control
與Expires
的做用一致,都是指明當前資源的有效期,控制瀏覽器是否直接從瀏覽器緩存取數據仍是從新發請求到服務器取數據。只不過Cache-Control
的選擇更多,設置更細緻,若是同時設置的話,其優先級高於Expires
。Last-Modified與ETag
Etag是服務器自動生成或者由開發者生成的對應資源在服務器端的惟一標識符,可以更加準確的控制緩存。Last-Modified與ETag是能夠一塊兒使用的,服務器會優先驗證ETag,一致的狀況下,纔會繼續比對Last-Modified,最後才決定是否返回304。
你可能會以爲使用Last-Modified
已經足以讓瀏覽器知道本地的緩存副本是否足夠新,爲何還須要Etag
(實體標識)呢?HTTP1.1中Etag的出現主要是爲了解決幾個Last-Modified比較難解決的問題:
Last-Modified/ETag
的狀況下,瀏覽器再次訪問統一URI的資源,仍是會發送請求到服務器詢問文件是否已經修改,若是沒有,服務器會只發送一個304回給瀏覽器,告訴瀏覽器直接從本身本地的緩存取數據;若是修改過那就整個數據從新發給瀏覽器;Cache-Control/Expires
則不一樣,若是檢測到本地的緩存仍是有效的時間範圍內,瀏覽器直接使用本地副本,不會發送任何請求。二者一塊兒使用時,Cache-Control/Expires
的優先級要高,即當本地副本根據Cache-Control/Expires
發現還在有效期內時,則不會再次發送請求去服務器詢問修改時間Last-Modified
或實體標識Etag
了。Last-Modified/ETag
將可以很好利用304,從而減小響應開銷。沒法被瀏覽器緩存的請求:
一個用戶發起一個靜態資源請求的時候,瀏覽器會經過如下幾步來獲取並展現資源:
緩存行爲主要由緩存策略決定,而緩存策略由內容擁有者設置。這些策略主要經過特定的HTTP頭部來清晰地表達。
以上過程也能夠被歸納爲三個階段:
用戶在使用瀏覽器的時候,會有各類操做,好比輸入地址後回車,按F5刷新等,這些行爲會對緩存有什麼影響呢?
經過上表咱們能夠看到,當用戶在按F5
進行刷新的時候,會忽略Expires/Cache-Control的設置,會再次發送請求去服務器請求,而Last-Modified/Etag仍是有效的,服務器會根據狀況判斷返回304仍是200;
而當用戶使用Ctrl+F5
進行強制刷新的時候,只是全部的緩存機制都將失效,從新從服務器拉去資源。
網上的帖子大多深淺不一,甚至有些先後矛盾,在下的文章都是學習過程當中的總結,若是發現錯誤,歡迎留言指出~
參考:
Web緩存機制系列
淺談web緩存
Web先後端緩存技術
瀏覽器緩存機制:不一樣瀏覽器對用戶操做行爲處理比較
PS:歡迎你們關注個人公衆號【前端下午茶】,一塊兒加油吧~
另外能夠加入「前端下午茶交流羣」微信羣,長按識別下面二維碼便可加我好友,備註加羣,我拉你入羣~