NodeJS 中的 LRU 緩存（CLOCK-2-hand）實現

時間 2021-05-01

標籤前端 vue web 算法後端緩存服務器網絡 app 框架欄目 HTML 简体版

原文原文鏈接

轉載請註明出處：葡萄城官網，葡萄城爲開發者提供專業的開發工具、解決方案和服務，賦能開發者。

在文章的開始咱們須要瞭解什麼是緩存？緩存是預先根據數據列表準備一些重要數據。前端

沒有緩存的話，系統的吞吐量就取決於存儲速度最慢的數據，所以保持應用程序高性能的一個重要優化就是緩存。vue

web應用程序中有兩項很重要的工做，分別是文件和視頻Blob的緩存和快速訪問頁面模板。而在NodeJS中，非異步功能操做的延遲會決定系統何時爲其餘客戶端提供服務，儘管操做系統有本身的文件緩存機制，可是同一個服務器中有多個web應用程序同時運行，且其中一個應用正在傳輸大量視頻數據的時候，其餘應用的緩存內容就可能會頻繁失效，此時程序效率會大幅下降。web

而針對應用程序資源的LRU算法能有效解決這個問題，使應用程序不被同一服務器中的其餘應用程序緩存所影響。考慮到存儲速度最慢數據決系統吞吐量的這一點，LRU緩存的存在能將系統性能提升2倍至100倍；同時，異步LRU會隱藏所有高速緩存未命中的延遲。算法

接下來咱們一塊兒來看具體實現的內容。後端

代碼展現

首先構建一個用來構造LRU對象模塊的文件：

'use strict';
let Lru = function(cacheSize,callbackBackingStoreLoad,elementLifeTimeMs=1000){
    let me = this;
    let maxWait = elementLifeTimeMs;
    let size = parseInt(cacheSize,10);
    let mapping = {};
    let mappingInFlightMiss = {};
    let buf = [];
    for(let i=0;i<size;i++)
    {
        let rnd = Math.random();
        mapping[rnd] = i;
        buf.push({data:"",visited:false, key:rnd, time:0, locked:false});
    }
    let ctr = 0;
    let ctrEvict = parseInt(cacheSize/2,10);
    let loadData = callbackBackingStoreLoad;
    this.get = function(key,callbackPrm){
       
        let callback = callbackPrm;
        if(key in mappingInFlightMiss)
        {
            setTimeout(function(){
                me.get(key,function(newData){
                    callback(newData);
                });
            },0);
            return;
        }

        if(key in mapping)
        {            
            // RAM speed data
            if((Date.now() - buf[mapping[key]].time) > maxWait)
            {                
                if(buf[mapping[key]].locked)
                {                                        
                    setTimeout(function(){
                        me.get(key,function(newData){
                            callback(newData);
                        });
                    },0);                    
                }
                else
                {
                    delete mapping[key];
                    
                    me.get(key,function(newData){
                        callback(newData);
                    });                    
                }                
            }
            else
            {
                buf[mapping[key]].visited=true;
                buf[mapping[key]].time = Date.now();
                callback(buf[mapping[key]].data);
            }
        }
        else
        {
            // datastore loading + cache eviction
            let ctrFound = -1;
            while(ctrFound===-1)
            {
                if(!buf[ctr].locked && buf[ctr].visited)
                {
                    buf[ctr].visited=false;
                }
                ctr++;
                if(ctr >= size)
                {
                    ctr=0;
                }

                if(!buf[ctrEvict].locked && !buf[ctrEvict].visited)
                {
                    // evict
                    buf[ctrEvict].locked = true;
                    ctrFound = ctrEvict;
                }

                ctrEvict++;
                if(ctrEvict >= size)
                {
                    ctrEvict=0;
                }
            }
            
            mappingInFlightMiss[key]=true;
            let f = function(res){
                delete mapping[buf[ctrFound].key];
                buf[ctrFound] = 
                {data: res, visited:false, key:key, time:Date.now(), locked:false};
                mapping[key] = ctrFound;
                callback(buf[ctrFound].data);
                delete mappingInFlightMiss[key];        
            };
            loadData(key,f);
        }
    };
};

exports.Lru = Lru;

文件緩存示例：

let Lru = require("./lrucache.js").Lru;
let fs = require("fs");
let path = require("path");

let fileCache = new Lru(500, async function(key,callback){
  // cache-miss data-load algorithm
    fs.readFile(path.join(__dirname,key),function(err,data){
      if(err) {                                 
        callback({stat:404, data:JSON.stringify(err)});
      }
      else
      {                                
        callback({stat:200, data:data});
      }                                                        
    });
},1000 /* cache element lifetime */);

使用LRU構造函數獲取參數（高速緩存大小、高速緩存未命中的關鍵字和回調、高速緩存要素生命週期）來構造CLOCK高速緩存。緩存

異步緩存未命中回調的工做方式以下：
1.一些get()在緩存中找不到密鑰
2.算法找到對應插槽
3.運行此回調：
在回調中，重要計算異步完成
回調結束時，將回調函數的回調返回到LRU緩存中
再次訪問同一密鑰的數據來自RAM
該依賴的惟一實現方法get()：

fileCache.get("./test.js",function(dat){
     httpResponse.writeHead(dat.stat);
     httpResponse.end(dat.data);
});

結果數據還有另外一個回調，所以能夠異步運行服務器

工做原理

如今大多LRU的工做過程始終存在從鍵到緩存槽的「映射」對象，就緩存槽的數量而言實現O（1）鍵搜索時間複雜度。可是用JavaScript就簡單多了：
映射對象：

let mapping = {};

在映射中找到一個（字符串/整數）鍵：網絡

if(key in mapping)
{
   // key found, get data from RAM
}

高效且簡單app

只要映射對應一個緩存插槽，就能夠直接從其中獲取數據：

buf[mapping[key]].visited=true; 
buf[mapping[key]].time = Date.now(); 
callback(buf[mapping[key]].data);

visited用來通知CLOCK指針（ctr和ctrEvict）保存該插槽，避免它被驅逐。time字段用來管理插槽的生命週期。只要訪問到高速緩存命中都會更新time字段，把它保留在高速緩存中。框架

用戶使用callback函數給get()函數提供用於檢索高速緩存插槽的數據。

想要直接從映射插槽獲取數據以前，須要先查看它的生命週期，若是生命週期已經結束，須要刪除映射並用相同鍵重試使高速緩存丟失：

if((Date.now() - buf[mapping[key]].time) > maxWait)
{
    delete mapping[key];
    me.get(key,function(newData){
        callback(newData);
    });
}

刪除映射後其餘異步訪問不會再影響其內部狀態

若是在映射對象中沒找到密鑰，就運行LRU逐出邏輯尋找目標：

let ctrFound = -1;
while(ctrFound===-1)
{
    if(!buf[ctr].locked && buf[ctr].visited)
    {
        buf[ctr].visited=false;
    }
    ctr++;
    if(ctr >= size)
    {
        ctr=0;
    }

    if(!buf[ctrEvict].locked && !buf[ctrEvict].visited)
    {
        // evict
        buf[ctrEvict].locked = true;
        ctrFound = ctrEvict;
    }

    ctrEvict++;
    if(ctrEvict >= size)
    {
        ctrEvict=0;
    }
}

第一個「 if」塊檢查「第二次機會」指針（ctr）指向的插槽狀態，若是是未鎖定並已訪問會將其標記爲未訪問，而不是驅逐它。

第三「If」塊檢查由ctrEvict指針指向的插槽狀態，若是是未鎖定且未被訪問，則將該插槽標記爲「 locked」，防止異步訪問get() 方法，並找到逐出插槽，而後循環結束。

對比能夠發現ctr和ctrEvict的初始相位差爲50％：

let ctr = 0;
let ctrEvict = parseInt(cacheSize/2,10);

而且在「 while」循環中兩者均等遞增。這意味着，這兩者循環跟隨另外一方，互相檢查。高速緩存插槽越多，對目標插槽搜索越有利。對每一個鍵而言，每一個鍵至少停留超過N / 2個時針運動才從從逐出中保存。

找到目標插槽後，刪除映射防止異步衝突的發生，並在加載數據存儲區後從新建立映射：

mappingInFlightMiss[key]=true; 
let f = function(res){ 
    delete mapping[buf[ctrFound].key]; 
    buf[ctrFound] = {data: res, visited:false, key:key, time:Date.now(), locked:false}; 
    mapping[key] = ctrFound; 
    callback(buf[ctrFound].data); 
    delete mappingInFlightMiss[key]; 
}; 

loadData(key,f);

因爲用戶提供的緩存缺失數據存儲加載功能（loadData）能夠異步進行，因此該緩存在運行中最多能夠包含N個緩存缺失，最多能夠隱藏N個緩存未命中延遲。隱藏延遲是影響吞吐量高低的重要因素，這一點在web應用中尤其明顯。一旦應用中出現了超過N個異步緩存未命中/訪問就會致使死鎖，所以具備100個插槽的緩存能夠異步服務多達100個用戶，甚至能夠將其限制爲比N更低的值（M），並在屢次（K）遍中進行計算（其中M x K =總訪問次數）。

咱們都知道高速緩存命中就是RAM的速度，但由於高速緩存未命中能夠隱藏，因此對於命中和未命中而言，整體性能看起來的時間複雜度都是O（1）。當插槽不多時，每一個訪問可能有多個時鐘指針迭代，但若是增長插槽數時，它接近O（1）。

在此loadData回調中，將新插槽數據的locked字段設置爲false，可使該插槽用於其餘異步訪問。

若是存在命中，而且找到的插槽生命週期結束且已鎖定，則訪問操做setTimeout將0 time參數延遲到JavaScript消息隊列的末尾。鎖定操做（cache-miss）在setTimeout以前結束的機率爲100％，就時間複雜度而言，仍算做具備較大的延遲的O（1），但它隱藏在鎖定操做延遲的延遲的以後。

if(buf[mapping[key]].locked) 
{ 
    setTimeout(function(){ 
        me.get(key,function(newData){ 
            callback(newData); 
        }); 
    },0); 
}

最後，若是某個鍵處於進行中的高速緩存未命中映射中，則經過setTimeout將其推遲到消息隊列的末尾：

if(key in mappingInFlightMiss)
{

  setTimeout(function(){
     me.get(key,function(newData){
              callback(newData);
     });
  },0);
  return;
}

這樣，就能夠避免數據的重複。

標杆管理

異步高速緩存未命中基準

"use strict";
// number of asynchronous accessors(1000 here) need to be equal to or less than 
// cache size(1000 here) or it makes dead-lock
let Lru = require("./lrucache.js").Lru;

let cache = new Lru(1000, async function(key,callback){
    // cache-miss data-load algorithm
    setTimeout(function(){
        callback(key+" processed");
    },1000);
},1000 /* cache element lifetime */);

let ctr = 0;
let t1 = Date.now();
for(let i=0;i<1000;i++)
{
    cache.get(i,function(data){
        console.log("data:"+data+" key:"+i);
        if(i.toString()+" processed" !== data)
        {
            console.log("error: wrong key-data mapping.");
        }
        if(++ctr === 1000)
        {
            console.log("benchmark: "+(Date.now()-t1)+" miliseconds");
        }
    });
}

爲了不死鎖的出現，能夠將LRU大小選擇爲1000，或者for只容許循環迭代1000次。

輸出：

benchmark: 1127 miliseconds

因爲每一個高速緩存未命中都有1000毫秒的延遲，所以同步加載1000個元素將花費15分鐘，可是重疊的高速緩存未命中會更快。這在I / O繁重的工做負載（例如來自HDD或網絡的流數據）中特別有用。

緩存命中率基準

10％的命中率：
密鑰生成：隨機，可能有10000個不一樣的值
1000個插槽

"use strict";
// number of asynchronous accessors(1000 here) need to be equal to or less than 
// cache size(1000 here) or it makes dead-lock
let Lru = require("./lrucache.js").Lru;

let cacheMiss = 0;
let cache = new Lru(1000, async function(key,callback){
    cacheMiss++;
    // cache-miss data-load algorithm
    setTimeout(function(){
        callback(key+" processed");
    },100);
},100000000 /* cache element lifetime */);

let ctr = 0;
let t1 = Date.now();
let asynchronity = 500;
let benchRepeat = 100;
let access = 0;

function test()
{
    ctr = 0;
    for(let i=0;i<asynchronity;i++)
    {
        let key = parseInt(Math.random()*10000,10); // 10% hit ratio
        cache.get(key.toString(),function(data){     
            access++;
            if(key.toString()+" processed" !== data)
            {
                console.log("error: wrong key-data mapping.");
            }
            if(++ctr === asynchronity)
            {
                console.log("benchmark: "+(Date.now()-t1)+" miliseconds");
                console.log("cache hit: "+(access - cacheMiss));
                console.log("cache miss: "+(cacheMiss));
                console.log("cache hit ratio: "+((access - cacheMiss)/access));
                if(benchRepeat>0)
                {
                    benchRepeat--;
                    test();
                }
            }
        });
    }
}

test();

結果：

benchmark: 10498 miliseconds
cache hit: 6151
cache miss: 44349
cache hit ratio: 0.1218019801980198

因爲基準測試是按100個步驟進行的，每一個緩存丟失的延遲時間爲100毫秒，所以產生了10秒的時間（接近100 x 100毫秒）。命中率接近預期值10％。

50％命中率測試

let key = parseInt(Math.random()*2000,10); // 50% hit ratio

Result:

benchmark: 10418 miliseconds
cache hit: 27541
cache miss: 22959
cache hit ratio: 0.5453663366336634

命中率測試

let key = parseInt(Math.random()*1010,10); // 99% hit ratio

Result:

benchmark: 10199 miliseconds
cache hit: 49156
cache miss: 1344
cache hit ratio: 0.9733861386138614

結果產生了0.9733比率的鍵的隨機性

％命中率測試

let key = parseInt(Math.random()*999,10); // 100% hit ratio

結果：

benchmark: 1463 miliseconds
cache hit: 49501
cache miss: 999
cache hit ratio: 0.9802178217821782

基準測試的第一步（沒法逃避緩存未命中）以後，全部內容都來自RAM，並大大減小了總延遲。

總結：

文本詳細介紹了NodeJS中LRU算法緩存的實現，但願能夠爲你們提供新的思路，更好的在開發中提高系統性能。

拓展閱讀：

Vue 是一套用於構建用戶界面的漸進式框架，與其它 JS 框架不一樣，Vue 被設計爲能夠自底向上逐層應用，因爲其核心庫只關注視圖層，所以 Vue 更易上手，且很容易與第三方庫或既有項目整合，當其與現代化的工具鏈或各類支持類庫相結合時，Vue 也能爲複雜的單頁應用提供驅動。
SpreadJS 是一款基於 HTML5 的純前端表格控件，能夠以原生的方式嵌入各種應用，並與先後端技術框架相結合。將 SpreadJS 與 Vue 集成，可在 Vue 框架中實現相似 Excel 的電子表格功能，包括對 450 多種計算公式的支持、在線導入導出 Excel 文檔、數據透視表和可視化分析，使應用程序具有極高的處理性能和響應速度。
閱讀了解Vue框架下的SpreadJS集成。

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。