分佈式鎖的那點事

在多線程併發的狀況下,要保證一個代碼塊在同一時間只能由一個線程訪問,能夠用鎖來保證,好比java的synchronized語法以及ReentrantLock類等等。這樣子能夠保證JVM進程內的多個線程同步執行。java

若是在分佈式的集羣環境中,如何保證不一樣節點的線程同步執行呢?redis

對於單進程的併發場景,可使用語言和類庫提供的鎖。對於分佈式場景,可使用分佈式鎖算法

分佈式鎖的實現有哪些?多線程

1.Memcached分佈式鎖併發

利用Memcached的add命令。此命令是原子性操做,只有在key不存在的狀況下,才能add成功,也就意味着線程獲得了鎖。分佈式

2.Redis分佈式鎖lua

和Memcached的方式相似,利用Redis的setnx命令。此命令一樣是原子性操做,只有在key不存在的狀況下,才能set成功。(setnx命令並不完善,後續會介紹替代方案)spa

3.Zookeeper分佈式鎖線程

利用Zookeeper的順序臨時節點,來實現分佈式鎖和等待隊列。Zookeeper設計的初衷,就是爲了實現分佈式鎖服務的。設計

4.Chubby

Google公司實現的粗粒度分佈式鎖服務,底層利用了Paxos一致性算法。

下面重點說說如何用redis實現分佈式鎖。

如何用Redis實現分佈式鎖?

Redis分佈式鎖的基本流程並不難理解,但要想寫得盡善盡美,也並非那麼容易。在這裏,須要先了解分佈式鎖實現的三個核心要素:

1.加鎖

最簡單的方法是使用setnx命令。key是鎖的惟一標識,按業務來決定命名。好比想要給一種商品的秒殺活動加鎖,能夠給key命名爲 「lock_sale_商品ID」 。而value設置成什麼呢?姑且設置成1。加鎖的僞代碼以下:    

setnx(key,1)

當一個線程執行setnx返回1,說明key本來不存在,該線程成功獲得了鎖;當一個線程執行setnx返回0,說明key已經存在,該線程搶鎖失敗。

2.解鎖

有加鎖就得有解鎖。當獲得鎖的線程執行完任務,須要釋放鎖,以便其餘線程能夠進入。釋放鎖的最簡單方式是執行del指令,僞代碼以下:

del(key)

釋放鎖以後,其餘線程就能夠繼續執行setnx命令來得到鎖。

3.鎖超時

鎖超時是什麼意思呢?若是一個獲得鎖的線程在執行任務的過程當中掛掉,來不及顯式地釋放鎖,這塊資源將會永遠被鎖住,別的線程再也別想進來。因此,setnx的key必須設置一個超時時間,以保證即便沒有被顯式釋放,這把鎖也要在必定時間後自動釋放。setnx不支持超時參數,因此須要額外的指令,僞代碼以下:

expire(key, 30)

綜合起來,分佈式鎖實現的初版僞代碼以下:

if(setnx(key,1) == 1){

    expire(key,30)

    try {

        do something ......

    } finally {

        del(key)

    }

}

上面的僞代碼中,存在着三個致命問題:

1. setnx和expire的非原子性

設想一個極端場景,當某線程執行setnx,成功獲得了鎖:

setnx剛執行成功,還將來得及執行expire指令,節點1就掛掉了。

這樣一來,這把鎖還沒來得及設置過時時間,就不會過時,別的線程再也沒法得到鎖了。

怎麼解決呢?setnx指令自己是不支持傳入超時時間的,幸虧Redis 2.6.12以上版本爲set指令增長了可選參數,僞代碼以下:

set(key,1,30,NX)

這樣就能夠取代setnx指令。

2. del 致使誤刪

又是一個極端場景,假如某線程成功獲得了鎖,而且設置的超時時間是30秒。

若是某些緣由致使線程A執行的很慢很慢,過了30秒都沒執行完,這時候鎖過時自動釋放,線程B獲得了鎖。

隨後,線程A執行完了任務,線程A接着執行del指令來釋放鎖。但這時候線程B還沒執行完,線程A實際上刪除的是線程B加的鎖

怎麼避免這種狀況呢?能夠在del釋放鎖以前作一個判斷,驗證當前的鎖是否是本身加的鎖。

至於具體的實現,能夠在加鎖的時候把當前的線程ID當作value,並在刪除以前驗證key對應的value是否是本身線程的ID。

加鎖:

String threadId = Thread.currentThread().getId()

set(key,threadId ,30,NX)

解鎖:

if(threadId .equals(redisClient.get(key))){

    del(key)

}

可是,這樣作又隱含了一個新的問題,判斷和釋放鎖是兩個獨立操做,不是原子性

這一塊用Lua腳原本實現:

String luaScript = "if redis.call('get', KEYS[1]) == ARGV[1] then returnredis.call('del', KEYS[1]) else return 0 end";

redisClient.eval(luaScript , Collections.singletonList(key), Collections.singletonList(threadId));

這樣一來,驗證和刪除過程就是原子操做了。

3. 出現併發的可能性

仍是剛纔第二點所描述的場景,雖然避免了線程A誤刪掉key的狀況,可是同一時間有A,B兩個線程在訪問代碼塊,仍然是不完美的。

怎麼辦呢?可讓得到鎖的線程開啓一個守護線程,用來給快要過時的鎖「續航」。

當過去了29秒,線程A還沒執行完,這時候守護線程會執行expire指令,爲這把鎖「續命」20秒。守護線程從第29秒開始執行,每20秒執行一次。

當線程A執行完任務,會顯式關掉守護線程。

另外一種狀況,若是節點1 突然斷電,因爲線程A和守護線程在同一個進程,守護線程也會停下。這把鎖到了超時的時候,沒人給它續命,也就自動釋放了。

相比較而言,Zookeeper的分佈式鎖實現起來要優雅的多,欲知詳情,下期再續。

相關文章
相關標籤/搜索