Linux高併發系統之限流技術

                                             

在開發高併發系統時有三把利器用來保護系統:緩存、降級和限流。緩存的目的是提高系統訪問速度和增大系統能處理的容量,可謂是抗高併發流量的銀彈;而降級是當服務出問題或者影響到核心流程的性能則須要暫時屏蔽掉,待高峯或者問題解決後再打開;而有些場景並不能用緩存和降級來解決,好比稀缺資源(秒殺、搶購)、寫服務(如評論、下單)、頻繁的複雜查詢(評論的最後幾頁),所以需有一種手段來限制這些場景的併發/請求量,即限流。html

 

限流的目的是經過對併發訪問/請求進行限速或者一個時間窗口內的的請求進行限速來保護系統,一旦達到限制速率則能夠拒絕服務(定向到錯誤頁或告知資源沒有了)、排隊或等待(好比秒殺、評論、下單)、降級(返回兜底數據或默認數據,如商品詳情頁庫存默認有貨)。node

 

通常開發高併發系統常見的限流有:限制總併發數(好比數據庫鏈接池、線程池)、限制瞬時併發數(如nginx的limit_conn模塊,用來限制瞬時併發鏈接數)、限制時間窗口內的平均速率(如Guava的RateLimiter、nginx的limit_req模塊,限制每秒的平均速率);其餘還有如限制遠程接口調用速率、限制MQ的消費速率。另外還能夠根據網絡鏈接數、網絡流量、CPU或內存負載等來限流。nginx

 

先有緩存這個銀彈,後有限流來應對61八、雙十一高併發流量,在處理高併發問題上能夠說是如虎添翼,不用擔憂瞬間流量致使系統掛掉或雪崩,最終作到有損服務而不是不服務;限流須要評估好,不可亂用,不然會正常流量出現一些奇怪的問題而致使用戶抱怨。git

 

在實際應用時也不要太糾結算法問題,由於一些限流算法實現是同樣的只是描述不同;具體使用哪一種限流技術仍是要根據實際場景來選擇,不要一味去找最佳模式,白貓黑貓能解決問題的就是好貓。github

 

因在實際工做中遇到過許多人來問如何進行限流,所以本文會詳細介紹各類限流手段。那麼接下來咱們從限流算法、應用級限流、分佈式限流、接入層限流來詳細學習下限流技術手段。redis

 

限流算法

常見的限流算法有:令牌桶、漏桶。計數器也能夠進行粗暴限流實現。算法

 

令牌桶算法sql

令牌桶算法是一個存放固定容量令牌的桶,按照固定速率往桶裏添加令牌。令牌桶算法的描述以下:數據庫

  • 假設限制2r/s,則按照500毫秒的固定速率往桶中添加令牌;編程

  • 桶中最多存放b個令牌,當桶滿時,新添加的令牌被丟棄或拒絕;

  • 當一個n個字節大小的數據包到達,將從桶中刪除n個令牌,接着數據包被髮送到網絡上;

  • 若是桶中的令牌不足n個,則不會刪除令牌,且該數據包將被限流(要麼丟棄,要麼緩衝區等待)。

 


2dbaabf5-d766-3a98-8583-ed829b876815.png
 

漏桶算法

漏桶做爲計量工具(The Leaky Bucket Algorithm as a Meter)時,能夠用於流量×××(Traffic Shaping)和流量控制(TrafficPolicing),漏桶算法的描述以下:

  • 一個固定容量的漏桶,按照常量固定速率流出水滴;

  • 若是桶是空的,則不需流出水滴;

  • 能夠以任意速率流入水滴到漏桶;

  • 若是流入水滴超出了桶的容量,則流入的水滴溢出了(被丟棄),而漏桶容量是不變的。


a47da2f7-a1a7-312f-9555-72352f2c788a.png
 

令牌桶和漏桶對比:

  • 令牌桶是按照固定速率往桶中添加令牌,請求是否被處理須要看桶中令牌是否足夠,當令牌數減爲零時則拒絕新的請求;

  • 漏桶則是按照常量固定速率流出請求,流入請求速率任意,當流入的請求數累積到漏桶容量時,則新流入的請求被拒絕;

  • 令牌桶限制的是平均流入速率(容許突發請求,只要有令牌就能夠處理,支持一次拿3個令牌,4個令牌),並容許必定程度突發流量;

  • 漏桶限制的是常量流出速率(即流出速率是一個固定常量值,好比都是1的速率流出,而不能一次是1,下次又是2),從而平滑突發流入速率;

  • 令牌桶容許必定程度的突發,而漏桶主要目的是平滑流入速率;

  • 兩個算法實現能夠同樣,可是方向是相反的,對於相同的參數獲得的限流效果是同樣的。

 

另外有時候咱們還使用計數器來進行限流,主要用來限制總併發數,好比數據庫鏈接池、線程池、秒殺的併發數;只要全局總請求數或者必定時間段的總請求數設定的閥值則進行限流,是簡單粗暴的總數量限流,而不是平均速率限流。

 

到此基本的算法就介紹完了,接下來咱們首先看看應用級限流。

 

 

應用級限流

 

限流總併發/鏈接/請求數

對於一個應用系統來講必定會有極限併發/請求數,即總有一個TPS/QPS閥值,若是超了閥值則系統就會不響應用戶請求或響應的很是慢,所以咱們最好進行過載保護,防止大量請求涌入擊垮系統。

若是你使用過Tomcat,其Connector 其中一種配置有以下幾個參數:

acceptCount:若是Tomcat的線程都忙於響應,新來的鏈接會進入隊列排隊,若是超出排隊大小,則拒絕鏈接;

maxConnections: 瞬時最大鏈接數,超出的會排隊等待;

maxThreads:Tomcat能啓動用來處理請求的最大線程數,若是請求處理量一直遠遠大於最大線程數則可能會僵死。

詳細的配置請參考官方文檔。另外如Mysql(如max_connections)、Redis(如tcp-backlog)都會有相似的限制鏈接數的配置。

 

限流總資源數

若是有的資源是稀缺資源(如數據庫鏈接、線程),並且可能有多個系統都會去使用它,那麼須要限制應用;可使用池化技術來限制總資源數:鏈接池、線程池。好比分配給每一個應用的數據庫鏈接是100,那麼本應用最多可使用100個資源,超出了能夠等待或者拋異常。

 

限流某個接口的總併發/請求數

若是接口可能會有突發訪問狀況,但又擔憂訪問量太大形成崩潰,如搶購業務;這個時候就須要限制這個接口的總併發/請求數總請求數了;由於粒度比較細,能夠爲每一個接口都設置相應的閥值。可使用Java中的AtomicLong進行限流:

{
(atomic.incrementAndGet() > 限流數) {
}
} {
    atomic.decrementAndGet();
}

適合對業務無損的服務或者須要過載保護的服務進行限流,如搶購業務,超出了大小要麼讓用戶排隊,要麼告訴用戶沒貨了,對用戶來講是能夠接受的。而一些開放平臺也會限制用戶調用某個接口的試用請求量,也能夠用這種計數器方式實現。這種方式也是簡單粗暴的限流,沒有平滑處理,須要根據實際狀況選擇使用;

 

限流某個接口的時間窗請求數

即一個時間窗口內的請求數,如想限制某個接口/服務每秒/每分鐘/天天的請求數/調用量。如一些基礎服務會被不少其餘系統調用,好比商品詳情頁服務會調用基礎商品服務調用,可是怕由於更新量比較大將基礎服務打掛,這時咱們要對每秒/每分鐘的調用量進行限速;一種實現方式以下所示:

LoadingCache<Long, AtomicLong> counter =
        CacheBuilder.()
                .expireAfterWrite(, TimeUnit.)
                .build(CacheLoader<Long, AtomicLong>() {
                    AtomicLong load(Long seconds) Exception {
                        AtomicLong();
                    }
                });
limit = ;
() {
    currentSeconds = System.() / ;
    (counter.get(currentSeconds).incrementAndGet() > limit) {
        System..println(+ currentSeconds);
        ;
    }
    
}

 咱們使用Guava的Cache來存儲計數器,過時時間設置爲2秒(保證1秒內的計數器是有的),而後咱們獲取當前時間戳而後取秒數來做爲KEY進行計數統計和限流,這種方式也是簡單粗暴,剛纔說的場景夠用了。

 

平滑限流某個接口的請求數

以前的限流方式都不能很好地應對突發請求,即瞬間請求可能都被容許從而致使一些問題;所以在一些場景中須要對突發請求進行×××,×××爲平均速率請求處理(好比5r/s,則每隔200毫秒處理一個請求,平滑了速率)。這個時候有兩種算法知足咱們的場景:令牌桶和漏桶算法。Guava框架提供了令牌桶算法實現,可直接拿來使用。

Guava RateLimiter提供了令牌桶算法實現:平滑突發限流(SmoothBursty)和平滑預熱限流(SmoothWarmingUp)實現。

 

SmoothBursty

RateLimiter limiter = RateLimiter.();
System..println(limiter.acquire());
System..println(limiter.acquire());
System..println(limiter.acquire());
System..println(limiter.acquire());
System..println(limiter.acquire());
System..println(limiter.acquire());

   將獲得相似以下的輸出:

  0.0

  0.198239

  0.196083

  0.200609

  0.199599

  0.19961

一、RateLimiter.create(5) 表示桶容量爲5且每秒新增5個令牌,即每隔200毫秒新增一個令牌;

二、limiter.acquire()表示消費一個令牌,若是當前桶中有足夠令牌則成功(返回值爲0),若是桶中沒有令牌則暫停一段時間,好比發令牌間隔是200毫秒,則等待200毫秒後再去消費令牌(如上測試用例返回的爲0.198239,差很少等待了200毫秒桶中才有令牌可用),這種實現將突發請求速率平均爲了固定請求速率。

 

再看一個突發示例:

RateLimiter limiter = RateLimiter.create(5);
System.out.println(limiter.acquire(5));
System.out.println(limiter.acquire(1));
System.out.println(limiter.acquire(1));

將獲得相似以下的輸出:

0.0

0.98745

0.183553

0.199909

limiter.acquire(5)表示桶的容量爲5且每秒新增5個令牌,令牌桶算法容許必定程度的突發,因此能夠一次性消費5個令牌,但接下來的limiter.acquire(1)將等待差很少1秒桶中才能有令牌,且接下來的請求也×××爲固定速率了。

RateLimiter limiter = RateLimiter.create(5);
System.out.println(limiter.acquire(10));
System.out.println(limiter.acquire(1));
System.out.println(limiter.acquire(1));

將獲得相似以下的輸出:

0.0

1.997428

0.192273

0.200616

同上邊的例子相似,第一秒突發了10個請求,令牌桶算法也容許了這種突發(容許消費將來的令牌),但接下來的limiter.acquire(1)將等待差很少2秒桶中才能有令牌,且接下來的請求也×××爲固定速率了。


接下來再看一個突發的例子:

RateLimiter limiter = RateLimiter.create(2);
System.out.println(limiter.acquire());
Thread.sleep(2000L);
System.out.println(limiter.acquire());
System.out.println(limiter.acquire());
System.out.println(limiter.acquire());
System.out.println(limiter.acquire());
System.out.println(limiter.acquire());

將獲得相似以下的輸出:

0.0

0.0

0.0

0.0

0.499876

0.495799

一、建立了一個桶容量爲2且每秒新增2個令牌;

二、首先調用limiter.acquire()消費一個令牌,此時令牌桶能夠知足(返回值爲0);

三、而後線程暫停2秒,接下來的兩個limiter.acquire()都能消費到令牌,第三個limiter.acquire()也一樣消費到了令牌,到第四個時就須要等待500毫秒了。

此處能夠看到咱們設置的桶容量爲2(即容許的突發量),這是由於SmoothBursty中有一個參數:最大突發秒數(maxBurstSeconds)默認值是1s,突發量/桶容量=速率*maxBurstSeconds,因此本示例桶容量/突發量爲2,例子中前兩個是消費了以前積攢的突發量,而第三個開始就是正常計算的了。令牌桶算法容許將一段時間內沒有消費的令牌暫存到令牌桶中,留待將來使用,並容許將來請求的這種突發。

 

SmoothBursty經過平均速率和最後一次新增令牌的時間計算出下次新增令牌的時間的,另外須要一個桶暫存一段時間內沒有使用的令牌(便可以突發的令牌數)。另外RateLimiter還提供了tryAcquire方法來進行無阻塞或可超時的令牌消費。

 

由於SmoothBursty容許必定程度的突發,會有人擔憂若是容許這種突發,假設忽然間來了很大的流量,那麼系統極可能扛不住這種突發。所以須要一種平滑速率的限流工具,從而系統冷啓動後慢慢的趨於平均固定速率(即剛開始速率小一些,而後慢慢趨於咱們設置的固定速率)。Guava也提供了SmoothWarmingUp來實現這種需求,其能夠認爲是漏桶算法,可是在某些特殊場景又不太同樣。

 

SmoothWarmingUp建立方式:RateLimiter.create(doublepermitsPerSecond, long warmupPeriod, TimeUnit unit)

permitsPerSecond表示每秒新增的令牌數,warmupPeriod表示在從冷啓動速率過渡到平均速率的時間間隔。

 

示例以下:

RateLimiter limiter = RateLimiter.create(5, 1000, TimeUnit.MILLISECONDS);
for(int i = 1; i < 5;i++) {
    System.out.println(limiter.acquire());
}
Thread.sleep(1000L);
for(int i = 1; i < 5;i++) {
    System.out.println(limiter.acquire());
}

將獲得相似以下的輸出:

0.0

0.51767

0.357814

0.21×××

0.199984

0.0

0.360826

0.220166

0.199723

0.199555

速率是梯形上升速率的,也就是說冷啓動時會以一個比較大的速率慢慢到平均速率;而後趨於平均速率(梯形降低到平均速率)。能夠經過調節warmupPeriod參數實現一開始就是平滑固定速率。

 

到此應用級限流的一些方法就介紹完了。假設將應用部署到多臺機器,應用級限流方式只是單應用內的請求限流,不能進行全侷限流。所以咱們須要分佈式限流和接入層限流來解決這個問題。

 

分佈式限流

分佈式限流最關鍵的是要將限流服務作成原子化,而解決方案可使使用redis+lua或者nginx+lua技術進行實現,經過這兩種技術能夠實現的高併發和高性能。

首先咱們來使用redis+lua實現時間窗內某個接口的請求數限流,實現了該功能後能夠改造爲限流總併發/請求數和限制總資源數。Lua自己就是一種編程語言,也可使用它實現複雜的令牌桶或漏桶算法。

 

redis+lua實現中的lua腳本:

local key = KEYS[1] --限流KEY(一秒一個)
local limit = tonumber(ARGV[1]) --限流大小
local current = tonumber(redis.call("INCRBY", key, "1")) --請求數+1
if current > limit then --若是超出限流大小
    return 0
elseif current == 1 then --只有第一次訪問須要設置2秒的過時時間
    redis.call("expire", key,"2")
end
return 1

如上操做因是在一個lua腳本中,又因Redis是單線程模型,所以是線程安全的。如上方式有一個缺點就是當達到限流大小後仍是會遞增的,能夠改形成以下方式實現:

local key = KEYS[1] --限流KEY(一秒一個)
local limit = tonumber(ARGV[1]) --限流大小
local current = tonumber(redis.call('get', key) or "0")
if current + 1 > limit then --若是超出限流大小
    return 0
else --請求數+1,並設置2秒過時
    redis.call("INCRBY", key,"1")
    redis.call("expire", key,"2")
    return 1
end

以下是Java中判斷是否須要限流的代碼:

public static boolean acquire() throws Exception {
String luaScript = Files.toString(new File("limit.lua"), Charset.defaultCharset());
Jedis jedis = new Jedis("192.168.147.52", 6379);
String key = "ip:" + System.currentTimeMillis()/ 1000; //此處將當前時間戳取秒數
Stringlimit = "3"; //限流大小
return (Long)jedis.eval(luaScript,Lists.newArrayList(key), Lists.newArrayList(limit)) == 1;
}

由於Redis的限制(Lua中有寫操做不能使用帶隨機性質的讀操做,如TIME)不能在Redis Lua中使用TIME獲取時間戳,所以只好從應用獲取而後傳入,在某些極端狀況下(機器時鐘不許的狀況下),限流會存在一些小問題。

 

使用Nginx+Lua實現的Lua腳本:

local locks = require "resty.lock"
local function acquire()
    local lock =locks:new("locks")
    local elapsed, err =lock:lock("limit_key") --互斥鎖
    local limit_counter =ngx.shared.limit_counter --計數器
    local key = "ip:" ..os.time()
    local limit = 5 --限流大小
    local current =limit_counter:get(key)

    if current ~= nil and current + 1> limit then --若是超出限流大小
        lock:unlock()
        return 0
    end
    if current == nil then
        limit_counter:set(key, 1, 1) --第一次須要設置過時時間,設置key的值爲1,過時時間爲1秒
    else
        limit_counter:incr(key, 1) --第二次開始加1便可
    end
    lock:unlock()
    return 1
end
ngx.print(acquire())

實現中咱們須要使用lua-resty-lock互斥鎖模塊來解決原子性問題(在實際工程中使用時請考慮獲取鎖的超時問題),並使用ngx.shared.DICT共享字典來實現計數器。若是須要限流則返回0,不然返回1。使用時須要先定義兩個共享字典(分別用來存放鎖和計數器數據):

 

Java代碼  收藏代碼

  1. http {  

  2.     ……  

  3.     lua_shared_dict locks 10m;  

  4.     lua_shared_dict limit_counter 10m;  

  5. }  

有人會糾結若是應用併發量很是大那麼redis或者nginx是否是能抗得住;不過這個問題要從多方面考慮:你的流量是否是真的有這麼大,是否是能夠經過一致性哈希將分佈式限流進行分片,是否是能夠當併發量太大降級爲應用級限流;對策很是多,能夠根據實際狀況調節;像在京東使用Redis+Lua來限流搶購流量,通常流量是沒有問題的。

 

對於分佈式限流目前遇到的場景是業務上的限流,而不是流量入口的限流;流量入口限流應該在接入層完成,而接入層筆者通常使用Nginx。

 

接入層限流

接入層一般指請求流量的入口,該層的主要目的有:負載均衡、非法請求過濾、請求聚合、緩存、降級、限流、A/B測試、服務質量監控等等,能夠參考筆者寫的《使用Nginx+Lua(OpenResty)開發高性能Web應用》。

 

對於Nginx接入層限流可使用Nginx自帶了兩個模塊:鏈接數限流模塊ngx_http_limit_conn_module和漏桶算法實現的請求限流模塊ngx_http_limit_req_module。還可使用OpenResty提供的Lua限流模塊lua-resty-limit-traffic進行更復雜的限流場景。

 

limit_conn用來對某個KEY對應的總的網絡鏈接數進行限流,能夠按照如IP、域名維度進行限流。limit_req用來對某個KEY對應的請求的平均速率進行限流,並有兩種用法:平滑模式(delay)和容許突發模式(nodelay)。

 

ngx_http_limit_conn_module

limit_conn是對某個KEY對應的總的網絡鏈接數進行限流。能夠按照IP來限制IP維度的總鏈接數,或者按照服務域名來限制某個域名的總鏈接數。可是記住不是每個請求鏈接都會被計數器統計,只有那些被Nginx處理的且已經讀取了整個請求頭的請求鏈接纔會被計數器統計。

 

配置示例:

http {
    limit_conn_zone$binary_remote_addr zone=addr:10m; 
    limit_conn_log_level error; 
    limit_conn_status 503;
    ...
    server {
    ...
    location /limit {
        limit_conn addr 1;
    }

limit_conn:要配置存放KEY和計數器的共享內存區域和指定KEY的最大鏈接數;此處指定的最大鏈接數是1,表示Nginx最多同時併發處理1個鏈接;

limit_conn_zone:用來配置限流KEY、及存放KEY對應信息的共享內存區域大小;此處的KEY是「$binary_remote_addr」其表示IP地址,也可使用如$server_name做爲KEY來限制域名級別的最大鏈接數;

limit_conn_status:配置被限流後返回的狀態碼,默認返回503;

limit_conn_log_level:配置記錄被限流後的日誌級別,默認error級別。

 

limit_conn的主要執行過程以下所示:

一、請求進入後首先判斷當前limit_conn_zone中相應KEY的鏈接數是否超出了配置的最大鏈接數;

2.一、若是超過了配置的最大大小,則被限流,返回limit_conn_status定義的錯誤狀態碼;

2.二、不然相應KEY的鏈接數加1,並註冊請求處理完成的回調函數;

三、進行請求處理;

四、在結束請求階段會調用註冊的回調函數對相應KEY的鏈接數減1。

 

limt_conn能夠限流某個KEY的總併發/請求數,KEY能夠根據須要變化。

 

按照IP限制併發鏈接數配置示例:

首先定義IP維度的限流區域:

limit_conn_zone $binary_remote_addrzone=perip:10m;

 

接着在要限流的location中添加限流邏輯:

location /limit {
    limit_conn perip 2;
    echo "123";
}

即容許每一個IP最大併發鏈接數爲2。

 

使用AB測試工具進行測試,併發數爲5個,總的請求數爲5個:

ab -n 5 -c 5 http://localhost/limit

  

將獲得以下access.log輸出:

[08/Jun/2016:20:10:51+0800] [1465373451.802] 200

[08/Jun/2016:20:10:51+0800] [1465373451.803] 200

[08/Jun/2016:20:10:51 +0800][1465373451.803] 503

[08/Jun/2016:20:10:51 +0800][1465373451.803] 503

[08/Jun/2016:20:10:51 +0800][1465373451.803] 503

 

此處咱們把access log格式設置爲log_format main  '[$time_local] [$msec] $status';分別是「日期 日期秒/毫秒值 響應狀態碼」。

 

若是被限流了,則在error.log中會看到相似以下的內容:

2016/06/08 20:10:51 [error] 5662#0: *5limiting connections by zone "perip", client: 127.0.0.1, server: _,request: "GET /limit HTTP/1.0", host: "localhost"

 

按照域名限制併發鏈接數配置示例:

首先定義域名維度的限流區域:

limit_conn_zone $ server_name zone=perserver:10m;

 

接着在要限流的location中添加限流邏輯:

location /limit {
    limit_conn perserver 2;
    echo "123";
}

即容許每一個域名最大併發請求鏈接數爲2;這樣配置能夠實現服務器最大鏈接數限制。

 

ngx_http_limit_req_module

limit_req是漏桶算法實現,用於對指定KEY對應的請求進行限流,好比按照IP維度限制請求速率。

 

配置示例:

http {
    limit_req_zone $binary_remote_addr zone=one:10m rate=1r/s;
    limit_conn_log_level error;
    limit_conn_status 503;
    ...
    server {
    ...
    location /limit {
        limit_req zone=one burst=5 nodelay;
    }

limit_req:配置限流區域、桶容量(突發容量,默認0)、是否延遲模式(默認延遲);

limit_req_zone:配置限流KEY、及存放KEY對應信息的共享內存區域大小、固定請求速率;此處指定的KEY是「$binary_remote_addr」表示IP地址;固定請求速率使用rate參數配置,支持10r/s和60r/m,即每秒10個請求和每分鐘60個請求,不過最終都會轉換爲每秒的固定請求速率(10r/s爲每100毫秒處理一個請求;60r/m,即每1000毫秒處理一個請求)。

limit_conn_status:配置被限流後返回的狀態碼,默認返回503;

limit_conn_log_level:配置記錄被限流後的日誌級別,默認error級別。

 

limit_req的主要執行過程以下所示:

一、請求進入後首先判斷最後一次請求時間相對於當前時間(第一次是0)是否須要限流,若是須要限流則執行步驟2,不然執行步驟3;

2.一、若是沒有配置桶容量(burst),則桶容量爲0;按照固定速率處理請求;若是請求被限流,則直接返回相應的錯誤碼(默認503);

2.二、若是配置了桶容量(burst>0)且延遲模式(沒有配置nodelay);若是桶滿了,則新進入的請求被限流;若是沒有滿則請求會以固定平均速率被處理(按照固定速率並根據須要延遲處理請求,延遲使用休眠實現);

2.三、若是配置了桶容量(burst>0)且非延遲模式(配置了nodelay);不會按照固定速率處理請求,而是容許突發處理請求;若是桶滿了,則請求被限流,直接返回相應的錯誤碼;

三、若是沒有被限流,則正常處理請求;

四、Nginx會在相應時機進行選擇一些(3個節點)限流KEY進行過時處理,進行內存回收。

 

場景2.1測試

首先定義IP維度的限流區域:

limit_req_zone $binary_remote_addrzone=test:10m rate=500r/s;

限制爲每秒500個請求,固定平均速率爲2毫秒一個請求。

 

接着在要限流的location中添加限流邏輯:

location /limit {
    limit_req zone=test;
    echo "123";
}

即桶容量爲0(burst默認爲0),且延遲模式。

 

使用AB測試工具進行測試,併發數爲2個,總的請求數爲10個:

ab -n 10 -c 2 http://localhost/limit

                 

將獲得以下access.log輸出:

[08/Jun/2016:20:25:56+0800] [1465381556.410] 200

[08/Jun/2016:20:25:56 +0800][1465381556.410] 503

[08/Jun/2016:20:25:56 +0800][1465381556.411] 503

[08/Jun/2016:20:25:56+0800] [1465381556.411] 200

[08/Jun/2016:20:25:56 +0800][1465381556.412] 503

[08/Jun/2016:20:25:56 +0800][1465381556.412] 503

 

雖然每秒容許500個請求,可是由於桶容量爲0,因此流入的請求要麼被處理要麼被限流,沒法延遲處理;另外平均速率在2毫秒左右,好比1465381556.410和1465381556.411被處理了;有朋友會說這固定平均速率不是1毫秒嘛,其實這是由於實現算法沒那麼精準形成的。

 

若是被限流在error.log中會看到以下內容:

2016/06/08 20:25:56 [error] 6130#0: *1962limiting requests, excess: 1.000 by zone "test", client: 127.0.0.1,server: _, request: "GET /limit HTTP/1.0", host:"localhost"

 

若是被延遲了在error.log(日誌級別要INFO級別)中會看到以下內容:

2016/06/10 09:05:23 [warn] 9766#0: *97021delaying request, excess: 0.368, by zone "test", client: 127.0.0.1,server: _, request: "GET /limit HTTP/1.0", host:"localhost"

 

場景2.2測試

首先定義IP維度的限流區域:

limit_req_zone $binary_remote_addr zone=test:10m rate=2r/s;

爲了方便測試設置速率爲每秒2個請求,即固定平均速率是500毫秒一個請求。

 

接着在要限流的location中添加限流邏輯:

location /limit {
    limit_req zone=test burst=3;
    echo "123";
}

固定平均速率爲500毫秒一個請求,通容量爲3,若是桶滿了新的請求被限流,不然能夠進入桶中排隊並等待(實現延遲模式)。

 

爲了看出限流效果咱們寫了一個req.sh腳本:

ab -c 6 -n 6 http://localhost/limit
sleep 0.3
ab -c 6 -n 6 http://localhost/limit

首先進行6個併發請求6次URL,而後休眠300毫秒,而後再進行6個併發請求6次URL;中間休眠目的是爲了能跨越2秒看到效果,若是看不到以下的效果能夠調節休眠時間。

 

將獲得以下access.log輸出:

[09/Jun/2016:08:46:43+0800] [1465433203.959] 200

[09/Jun/2016:08:46:43 +0800][1465433203.959] 503

[09/Jun/2016:08:46:43 +0800][1465433203.960] 503

[09/Jun/2016:08:46:44+0800] [1465433204.450] 200

[09/Jun/2016:08:46:44+0800] [1465433204.950] 200

[09/Jun/2016:08:46:45 +0800][1465433205.453] 200

 

[09/Jun/2016:08:46:45 +0800][1465433205.766] 503

[09/Jun/2016:08:46:45 +0800][1465433205.766] 503

[09/Jun/2016:08:46:45 +0800][1465433205.767] 503

[09/Jun/2016:08:46:45+0800] [1465433205.950] 200

[09/Jun/2016:08:46:46+0800] [1465433206.451] 200

[09/Jun/2016:08:46:46+0800] [1465433206.952] 200


dcbeb64a-1662-39d7-bdbf-ea367c4de49b.png
 

桶容量爲3,即桶中在時間窗口內最多流入3個請求,且按照2r/s的固定速率處理請求(即每隔500毫秒處理一個請求);桶計算時間窗口(1.5秒)=速率(2r/s)/桶容量(3),也就是說在這個時間窗口內桶最多暫存3個請求。所以咱們要以當前時間往前推1.5秒和1秒來計算時間窗口內的總請求數;另外由於默認是延遲模式,因此時間窗內的請求要被暫存到桶中,並以固定平均速率處理請求:

第一輪:有4個請求處理成功了,按照漏桶桶容量應該最多3個纔對;這是由於計算算法的問題,第一次計算因沒有參考值,因此第一次計算後,後續的計算纔能有參考值,所以第一次成功能夠忽略;這個問題影響很小能夠忽略;並且按照固定500毫秒的速率處理請求。

第二輪:由於第一輪請求是突發來的,差很少都在1465433203.959時間點,只是由於漏桶將速率進行了平滑變成了固定平均速率(每500毫秒一個請求);而第二輪計算時間應基於1465433203.959;而第二輪突發請求差很少都在1465433205.766時間點,所以計算桶容量的時間窗口應基於1465433203.959和1465433205.766來計算,計算結果爲1465433205.766這個時間點漏桶爲空了,能夠流入桶中3個請求,其餘請求被拒絕;又由於第一輪最後一次處理時間是1465433205.453,因此第二輪第一個請求被延遲到了1465433205.950。這裏也要注意固定平均速率只是在配置的速率左右,存在計算精度問題,會有一些誤差。

 

若是桶容量改成1(burst=1),執行req.sh腳本能夠看到以下輸出:

09/Jun/2016:09:04:30+0800] [1465434270.362] 200

[09/Jun/2016:09:04:30 +0800][1465434270.371] 503

[09/Jun/2016:09:04:30 +0800] [1465434270.372]503

[09/Jun/2016:09:04:30 +0800][1465434270.372] 503

[09/Jun/2016:09:04:30 +0800][1465434270.372] 503

[09/Jun/2016:09:04:30+0800] [1465434270.864] 200

 

[09/Jun/2016:09:04:31 +0800][1465434271.178] 503

[09/Jun/2016:09:04:31 +0800][1465434271.178] 503

[09/Jun/2016:09:04:31 +0800][1465434271.178] 503

[09/Jun/2016:09:04:31 +0800][1465434271.178] 503

[09/Jun/2016:09:04:31 +0800][1465434271.179] 503

[09/Jun/2016:09:04:31+0800] [1465434271.366] 200

桶容量爲1,按照每1000毫秒一個請求的固定平均速率處理請求。

 

場景2.3測試

首先定義IP維度的限流區域:

limit_req_zone $binary_remote_addr zone=test:10m rate=2r/s;

爲了方便測試配置爲每秒2個請求,固定平均速率是500毫秒一個請求。

 

接着在要限流的location中添加限流邏輯:

location /limit {
    limit_req zone=test burst=3 nodelay;
    echo "123";
}

桶容量爲3,若是桶滿了直接拒絕新請求,且每秒2最多兩個請求,桶按照固定500毫秒的速率以nodelay模式處理請求。

 

爲了看到限流效果咱們寫了一個req.sh腳本:

ab -c 6 -n 6 http://localhost/limit
sleep 1
ab -c 6 -n 6 http://localhost/limit
sleep 0.3
ab -c 6 -n 6 http://localhost/limit
sleep 0.3
ab -c 6 -n 6 http://localhost/limit
sleep 0.3
ab -c 6 -n 6 http://localhost/limit
sleep 2
ab -c 6 -n 6 http://localhost/limit

 

將獲得相似以下access.log輸出:

[09/Jun/2016:14:30:11+0800] [1465453811.754] 200

[09/Jun/2016:14:30:11+0800] [1465453811.755] 200

[09/Jun/2016:14:30:11+0800] [1465453811.755] 200

[09/Jun/2016:14:30:11+0800] [1465453811.759] 200

[09/Jun/2016:14:30:11 +0800][1465453811.759] 503

[09/Jun/2016:14:30:11 +0800][1465453811.759] 503

 

[09/Jun/2016:14:30:12+0800] [1465453812.776] 200

[09/Jun/2016:14:30:12+0800] [1465453812.776] 200

[09/Jun/2016:14:30:12 +0800][1465453812.776] 503

[09/Jun/2016:14:30:12 +0800][1465453812.777] 503

[09/Jun/2016:14:30:12 +0800][1465453812.777] 503

[09/Jun/2016:14:30:12 +0800][1465453812.777] 503

 

[09/Jun/2016:14:30:13 +0800] [1465453813.095]503

[09/Jun/2016:14:30:13 +0800][1465453813.097] 503

[09/Jun/2016:14:30:13 +0800][1465453813.097] 503

[09/Jun/2016:14:30:13 +0800][1465453813.097] 503

[09/Jun/2016:14:30:13 +0800][1465453813.097] 503

[09/Jun/2016:14:30:13 +0800][1465453813.098] 503

 

[09/Jun/2016:14:30:13+0800] [1465453813.425] 200

[09/Jun/2016:14:30:13 +0800][1465453813.425] 503

[09/Jun/2016:14:30:13 +0800][1465453813.425] 503

[09/Jun/2016:14:30:13 +0800][1465453813.426] 503

[09/Jun/2016:14:30:13 +0800][1465453813.426] 503

[09/Jun/2016:14:30:13 +0800][1465453813.426] 503

 

[09/Jun/2016:14:30:13+0800] [1465453813.754] 200

[09/Jun/2016:14:30:13 +0800][1465453813.755] 503

[09/Jun/2016:14:30:13 +0800][1465453813.755] 503

[09/Jun/2016:14:30:13 +0800][1465453813.756] 503

[09/Jun/2016:14:30:13 +0800][1465453813.756] 503

[09/Jun/2016:14:30:13 +0800][1465453813.756] 503

 

[09/Jun/2016:14:30:15+0800] [1465453815.278] 200

[09/Jun/2016:14:30:15+0800] [1465453815.278] 200

[09/Jun/2016:14:30:15+0800] [1465453815.278] 200

[09/Jun/2016:14:30:15 +0800][1465453815.278] 503

[09/Jun/2016:14:30:15 +0800][1465453815.279] 503

[09/Jun/2016:14:30:15 +0800][1465453815.279] 503

 

[09/Jun/2016:14:30:17+0800] [1465453817.300] 200

[09/Jun/2016:14:30:17+0800] [1465453817.300] 200

[09/Jun/2016:14:30:17+0800] [1465453817.300] 200

[09/Jun/2016:14:30:17+0800] [1465453817.301] 200

[09/Jun/2016:14:30:17 +0800][1465453817.301] 503

[09/Jun/2016:14:30:17 +0800][1465453817.301] 503


606ccb82-fdd1-3375-90f3-823831595156.png
 

桶容量爲3(,即桶中在時間窗口內最多流入3個請求,且按照2r/s的固定速率處理請求(即每隔500毫秒處理一個請求);桶計算時間窗口(1.5秒)=速率(2r/s)/桶容量(3),也就是說在這個時間窗口內桶最多暫存3個請求。所以咱們要以當前時間往前推1.5秒和1秒來計算時間窗口內的總請求數;另外由於配置了nodelay,是非延遲模式,因此容許時間窗內突發請求的;另外從本示例會看出兩個問題:

第一輪和第七輪:有4個請求處理成功了;這是由於計算算法的問題,本示例是若是2秒內沒有請求,而後接着忽然來了不少請求,第一次計算的結果將是不正確的;這個問題影響很小能夠忽略;

第五輪:1.0秒計算出來是3個請求;此處也是因計算精度的問題,也就是說limit_req實現的算法不是很是精準的,假設此處當作相對於2.75的話,1.0秒內只有1次請求,因此仍是容許1次請求的。

 

若是限流出錯了,能夠配置錯誤頁面:

proxy_intercept_errors on;
recursive_error_pages on;
error_page 503 //www.jd.com/error.aspx;

limit_conn_zone/limit_req_zone定義的內存不足,則後續的請求將一直被限流,因此須要根據需求設置好相應的內存大小。

 

此處的限流都是單Nginx的,假設咱們接入層有多個nginx,此處就存在和應用級限流相同的問題;那如何處理呢?一種解決辦法:創建一個負載均衡層將按照限流KEY進行一致性哈希算法將請求哈希到接入層Nginx上,從而相同KEY的將打到同一臺接入層Nginx上;另外一種解決方案就是使用Nginx+Lua(OpenResty)調用分佈式限流邏輯實現。

 

lua-resty-limit-traffic

以前介紹的兩個模塊使用上比較簡單,指定KEY、指定限流速率等就能夠了,若是咱們想根據實際狀況變化KEY、變化速率、變化桶大小等這種動態特性,使用標準模塊就很難去實現了,所以咱們須要一種可編程來解決咱們問題;而OpenResty提供了lua限流模塊lua-resty-limit-traffic,經過它能夠按照更復雜的業務邏輯進行動態限流處理了。其提供了limit.conn和limit.req實現,算法與nginx limit_conn和limit_req是同樣的。

 

此處咱們來實現ngx_http_limit_req_module中的【場景2.2測試】,不要忘記下載lua-resty-limit-traffic模塊並添加到OpenResty的lualib中。

 

配置用來存放限流用的共享字典:

lua_shared_dict limit_req_store 100m;

 

如下是實現【場景2.2測試】的限流代碼limit_req.lua:

local limit_req = require "resty.limit.req"
local rate = 2 --固定平均速率 2r/s
local burst = 3 --桶容量
local error_status = 503
local nodelay = false --是否須要不延遲處理
local lim, err = limit_req.new("limit_req_store", rate, burst)
if not lim then --沒定義共享字典
    ngx.exit(error_status)
end
local key = ngx.var.binary_remote_addr --IP維度的限流
--流入請求,若是請求須要被延遲則delay > 0
local delay, err = lim:incoming(key, true)
if not delay and err == "rejected" then --超出桶大小了
    ngx.exit(error_status)
end
if delay > 0 then --根據須要決定是延遲或者不延遲處理
    if nodelay then
        --直接突發處理了
    else
        ngx.sleep(delay) --延遲處理
    end
end

即限流邏輯再nginx access階段被訪問,若是不被限流繼續後續流程;若是須要被限流要麼sleep一段時間繼續後續流程,要麼返回相應的狀態碼拒絕請求。

 

在分佈式限流中咱們使用了簡單的Nginx+Lua進行分佈式限流,有了這個模塊也可使用這個模塊來實現分佈式限流。

 

另外在使用Nginx+Lua時也能夠獲取ngx.var.connections_active進行過載保護,即若是當前活躍鏈接數超過閾值進行限流保護。

if tonumber(ngx.var.connections_active) >= tonumber(limit) then
    //限流
end

 

nginx也提供了limit_rate用來對流量限速,如limit_rate 50k,表示限制下載速度爲50k。

 

到此筆者在工做中涉及的限流用法就介紹完,這些算法中有些容許突發,有些會×××爲平滑,有些計算算法簡單粗暴;其中令牌桶算法和漏桶算法實現上是相似的,只是表述的方向不太同樣,對於業務來講沒必要刻意去區分它們;所以須要根據實際場景來決定如何限流,最好的算法不必定是最適用的。

 

參考資料

https://en.wikipedia.org/wiki/Token_bucket

https://en.wikipedia.org/wiki/Leaky_bucket

http://redis.io/commands/incr

http://nginx.org/en/docs/http/ngx_http_limit_req_module.html

http://nginx.org/en/docs/http/ngx_http_limit_conn_module.html

https://github.com/openresty/lua-resty-limit-traffic

http://nginx.org/en/docs/http/ngx_http_core_module.html#limit_rate

相關文章
相關標籤/搜索