HTML5離線存儲原理

前言:

使用HTML5,經過建立cache manifest文件,可輕鬆建立web應用的離線版本。
HTML5引入了應用程序緩存,這意味着web應用可進行緩存,並可在沒有網絡時進行訪問。
應用程序緩存爲應用帶來三個優點:javascript

  • 離線瀏覽--用戶可在離線時使用它們。css

  • 速度--已經緩存的資源加載得更快。html

  • 減小服務器負載--瀏覽器將只從服務器下載更改過的資源。html5

原理和環境

如上面提到的HTML5的離線存儲是基於一個新建的.appcache文件的,經過這個文件上的解析清單離線存儲資源,這些資源就會像cookie同樣被存儲了下來。以後當網絡在處於離線狀態下時,瀏覽器會經過被離線存儲的數據進行頁面展現。java

就像cookie同樣,html5的離線存儲也須要服務器環境。web

解析清單

在開始以前要先了解下manifest(即.appcache文件),上面的解析清單要怎麼寫。瀏覽器

manifest 文件是簡單的文本文件,它告知瀏覽器被緩存的內容(以及不緩存的內容)。
manifest 文件可分爲三個部分:緩存

  • CACHE MANIFEST - 在此標題下列出的文件將在首次下載後進行緩存服務器

  • NETWORK - 在此標題下列出的文件須要與服務器的鏈接,且不會被緩存cookie

  • FALLBACK - 在此標題下列出的文件規定當頁面沒法訪問時的回退頁面(好比 404 頁面)
    在線的狀況下,用戶代理每次訪問頁面,都會去讀一次manifest.若是發現其改變, 則從新加載所有清單中的資源。

CACHE MANIFEST

第一行,CACHE MANIFEST,是必需的:

1 CACHE MANIFEST /theme.css /logo.gif /main.js

上面的 manifest 文件列出了三個資源:一個 CSS 文件,一個 GIF 圖像,以及一個 JavaScript 文件。當 manifest 文件加載後,瀏覽器會從網站的根目錄下載這三個文件。而後,不管用戶什麼時候與因特網斷開鏈接,這些資源依然是可用的。

NETWORK

白名單,使用通配符」*」. 則會進入白名單的open狀態. 這種狀態下.全部不在相關Cache區域出現的url都默認使用HTTP相關緩存頭策略.

下面的 NETWORK 小節規定文件 「login.asp」 永遠不會被緩存,且離線時是不可用的:

NETWORK: login.asp

可使用*來指示全部其餘資源/文件都須要因特網鏈接:

NETWORK: *

FALLBACK

下面的 FALLBACK 小節規定若是沒法創建因特網鏈接,則用 「offline.html」 替代 /html5/ 目錄中的全部文件:

ALLBACK:/html5/ /404.html

註釋:第一個 URI 是資源,第二個是替補。

更新緩存

一旦應用被緩存,它就會保持緩存直到發生下列狀況:

  • 用戶清空瀏覽器緩存

  • manifest 文件被修改

  • 由程序來更新應用緩存

Demo

|-- index.html 
|-- demo.appcache 
|-- image 
    |-- 01.jpg 
    |-- 02.jpg

index.html

<!DOCTYPE html> 
<html lang="en" manifest="demo.appcache"> 
<head> 
    <meta charset="UTF-8"> 
    <title>HTML5離線存儲</title>
</head> 
<body> 
    <img src="image/01.jpg" alt=""> 
    <img src="image/02.jpg" alt=""> 
</body> 
</html>

demo.appcache

CACHE MANIFEST #v01 image/01.jpg
NETWORK: *
FALLBACK: /

image文件夾下存儲着

01.jpg

01.jpg

02.jpg

02.jpg

當服務器開啓時

當服務器關閉時(是關閉,暫停看不出效果)

能夠看見圖片1成功被離線展現出來了,圖片2像正常狀況同樣顯示不出來。

如今我想把圖片2圖片1的位置換一下呢.

<body> 
    <img src="image/02.jpg" alt=""> 
    <img src="image/01.jpg" alt=""> 
</body>

這時候發現問題來了,html明明修改了爲何圖片沒有置換過來呢,我不是在demo.appcache文件的NETWORK寫了星號嗎?除了CACHE MANIFEST文件其它都採用在線模式。查資料得知:引入manifest的頁面,即便沒有被列入緩存清單中,仍然會被用戶代理緩存。
好吧,那我把.appcache文件更新下,因而乎把頭部的版本號修改一下#v02。刷新下頁面仍是沒反應!再刷新,有了!爲何?

對於瀏覽器來講,manifest的加載是要晚於其餘資源的. 這就致使check manifest的過程是滯後的.發現manifest改變.全部瀏覽器的實現都是緊隨這作靜默更新資源.以保證下次pv,應用到更新.

經過控制檯咱們可以窺探一二:

第一次刷新,應用程序緩存更新準備事件

第二次刷新纔會看到效果。

緩存當即執行

咱們的產品已經更新了用戶卻要第二次進來纔可以看到,這樣用戶體驗也太差了吧,有什麼方式可以解決呢?好在html5給javascript提供了相關的API。

API篇幅太多自行查看把,這裏我曬下我測試成功的code:

/*code1,簡單粗暴的*/
applicationCache.onupdateready = function(){
    applicationCache.swapCache();
    location.reload();
};
/*code2,緩存公用方法*/
var EventUtil = {
    addHandler: function(element, type, handler) {
        if (element.addEventListener) {
            element.addEventListener(type, handler, false);
        } else if (element.attachEvent) {
            element.attachEvent(「on」 + type, handler);
        } else {
            element["on" + type] = handler;
        }
    }
};
EventUtil.addHandler(applicationCache, 「updateready」, function() { 
    //緩存更新並已下載,要在下次進入頁面生效
    //檢查緩存manifest文件是否更新,ps:頁面加載默認檢查一次。
    applicationCache.update(); 
    //交換到新的緩存項中,交換了要下次進入頁面才生效
    applicationCache.swapCache(); 
    
    location.reload(); //從新載入頁面
});

code1通常用在頁面加載時直接觸發,而code2的方式可後期檢查更新。

注意事項

  • 站點離線存儲的容量限制是5M

  • 若是manifest文件,或者內部列舉的某一個文件不能正常下載,整個更新過程將視爲失敗,瀏覽器繼續所有使用老的緩存

  • 引用manifest的html必須與manifest文件同源,在同一個域下

  • 在manifest中使用的相對路徑,相對參照物爲manifest文件

  • CACHE MANIFEST字符串應在第一行,且必不可少

  • 系統會自動緩存引用清單文件的 HTML 文件

  • manifest文件中CACHE則與NETWORK,FALLBACK的位置順序沒有關係,若是是隱式聲明須要在最前面

  • FALLBACK中的資源必須和manifest文件同源

  • 當一個資源被緩存後,該瀏覽器直接請求這個絕對路徑也會訪問緩存中的資源。

  • 站點中的其餘頁面即便沒有設置manifest屬性,請求的資源若是在緩存中也從緩存中訪問

  • 當manifest文件發生改變時,資源請求自己也會觸發更新

轉載自:http://www.codeceo.com

相關文章
相關標籤/搜索