分佈式鎖的那點事

時間 2019-11-11

標籤分佈式那點欄目系統架構简体版

原文原文鏈接

在多線程併發的狀況下，要保證一個代碼塊在同一時間只能由一個線程訪問，能夠用鎖來保證，好比java的synchronized語法以及ReentrantLock類等等。這樣子能夠保證JVM進程內的多個線程同步執行。java

若是在分佈式的集羣環境中，如何保證不一樣節點的線程同步執行呢？redis

對於單進程的併發場景，可使用語言和類庫提供的鎖。對於分佈式場景，可使用分佈式鎖。算法

分佈式鎖的實現有哪些？多線程

1.Memcached分佈式鎖併發

利用Memcached的add命令。此命令是原子性操做，只有在key不存在的狀況下，才能add成功，也就意味着線程獲得了鎖。分佈式

2.Redis分佈式鎖lua

和Memcached的方式相似，利用Redis的setnx命令。此命令一樣是原子性操做，只有在key不存在的狀況下，才能set成功。（setnx命令並不完善，後續會介紹替代方案）spa

3.Zookeeper分佈式鎖線程

利用Zookeeper的順序臨時節點，來實現分佈式鎖和等待隊列。Zookeeper設計的初衷，就是爲了實現分佈式鎖服務的。設計

4.Chubby

Google公司實現的粗粒度分佈式鎖服務，底層利用了Paxos一致性算法。

下面重點說說如何用redis實現分佈式鎖。

如何用Redis實現分佈式鎖？

Redis分佈式鎖的基本流程並不難理解，但要想寫得盡善盡美，也並非那麼容易。在這裏，須要先了解分佈式鎖實現的三個核心要素：

1.加鎖

最簡單的方法是使用setnx命令。key是鎖的惟一標識，按業務來決定命名。好比想要給一種商品的秒殺活動加鎖，能夠給key命名爲「lock_sale_商品ID」。而value設置成什麼呢？姑且設置成1。加鎖的僞代碼以下：

setnx（key，1）

當一個線程執行setnx返回1，說明key本來不存在，該線程成功獲得了鎖；當一個線程執行setnx返回0，說明key已經存在，該線程搶鎖失敗。

2.解鎖

有加鎖就得有解鎖。當獲得鎖的線程執行完任務，須要釋放鎖，以便其餘線程能夠進入。釋放鎖的最簡單方式是執行del指令，僞代碼以下：

del（key）

釋放鎖以後，其餘線程就能夠繼續執行setnx命令來得到鎖。

3.鎖超時

鎖超時是什麼意思呢？若是一個獲得鎖的線程在執行任務的過程當中掛掉，來不及顯式地釋放鎖，這塊資源將會永遠被鎖住，別的線程再也別想進來。因此，setnx的key必須設置一個超時時間，以保證即便沒有被顯式釋放，這把鎖也要在必定時間後自動釋放。setnx不支持超時參數，因此須要額外的指令，僞代碼以下：

expire（key， 30）

綜合起來，分佈式鎖實現的初版僞代碼以下：

if（setnx（key，1） == 1）{

expire（key，30）

try {

do something ......

} finally {

del（key）

}

上面的僞代碼中，存在着三個致命問題：

1. setnx和expire的非原子性

設想一個極端場景，當某線程執行setnx，成功獲得了鎖：

setnx剛執行成功，還將來得及執行expire指令，節點1就掛掉了。

這樣一來，這把鎖還沒來得及設置過時時間，就不會過時，別的線程再也沒法得到鎖了。

怎麼解決呢？setnx指令自己是不支持傳入超時時間的，幸虧Redis 2.6.12以上版本爲set指令增長了可選參數，僞代碼以下：

set（key，1，30，NX）

這樣就能夠取代setnx指令。

2. del 致使誤刪

又是一個極端場景，假如某線程成功獲得了鎖，而且設置的超時時間是30秒。

若是某些緣由致使線程A執行的很慢很慢，過了30秒都沒執行完，這時候鎖過時自動釋放，線程B獲得了鎖。

隨後，線程A執行完了任務，線程A接着執行del指令來釋放鎖。但這時候線程B還沒執行完，線程A實際上刪除的是線程B加的鎖。

怎麼避免這種狀況呢？能夠在del釋放鎖以前作一個判斷，驗證當前的鎖是否是本身加的鎖。

至於具體的實現，能夠在加鎖的時候把當前的線程ID當作value，並在刪除以前驗證key對應的value是否是本身線程的ID。

加鎖：

String threadId = Thread.currentThread().getId()

set（key，threadId ，30，NX）

解鎖：

if（threadId .equals(redisClient.get(key))）{

del(key)

}

可是，這樣作又隱含了一個新的問題，判斷和釋放鎖是兩個獨立操做，不是原子性。

這一塊用Lua腳原本實現：

String luaScript = "if redis.call('get', KEYS[1]) == ARGV[1] then returnredis.call('del', KEYS[1]) else return 0 end";

redisClient.eval(luaScript , Collections.singletonList(key), Collections.singletonList(threadId));

這樣一來，驗證和刪除過程就是原子操做了。

3. 出現併發的可能性

仍是剛纔第二點所描述的場景，雖然避免了線程A誤刪掉key的狀況，可是同一時間有A，B兩個線程在訪問代碼塊，仍然是不完美的。

怎麼辦呢？可讓得到鎖的線程開啓一個守護線程，用來給快要過時的鎖「續航」。

當過去了29秒，線程A還沒執行完，這時候守護線程會執行expire指令，爲這把鎖「續命」20秒。守護線程從第29秒開始執行，每20秒執行一次。

當線程A執行完任務，會顯式關掉守護線程。

另外一種狀況，若是節點1 突然斷電，因爲線程A和守護線程在同一個進程，守護線程也會停下。這把鎖到了超時的時候，沒人給它續命，也就自動釋放了。

相比較而言，Zookeeper的分佈式鎖實現起來要優雅的多，欲知詳情，下期再續。

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。