分佈式經典結構

如圖所示的結構, 當前端接收到請求時, 經過計算key的哈希值, 將哈希值模3, 而後分佈到不一樣的後端服務器上前端

可是, 這樣的結構當添加或減小後端服務器時就暴露了問題, 每次添加或減小後端服務器, 放在服務器中的全部數據都要所有從新計算哈希, 將哈希值摸新的臺數, 從新添加. 如此, 數據遷移的成本過高了, 由此引出了一致性哈希後端

一致性哈希

前端服務端結構不變, 如下都是後端服務器.服務器

假設哈希函數計算出的值在 0-2^64 範圍內, 將其想一想成一個環, 以下:分佈式

將服務器打在這個環上, 那麼服務器也要有一個哈希值, 經過服務器惟一的標誌來計算(ip, mac, hostname等), 以下:函數

當請求到來時, 計算請求的哈希值, 哈希值定會打在這個環上, 而後將請求發給順時針找到的第一個服務器, 以下:spa

也就是找到比請求哈希值大的第一臺服務器.blog

實現這個結構後, 如果向服務器中添加一臺, 只要找到本來負責這個區域的服務器, 而後將應該負責區域的數據拿過來並從原服務器中刪除便可, 以下:ip

刪除一臺服務器也是一樣的道理class

如此一來, 數據的遷移成本確實減小了, 可是新的問題出現的, 數據的均衡性得不到保證, 由於哈希函數計算出的哈希值是隨機的, 因此極可能出現兩臺服務器分佈不均的狀況:請求

這時, 大部分數據都是S1負責, 而S2只負責少部分數據, 即便恰巧分佈均勻,S1和S2正好打在環的兩端, 可是新加一臺服務器也勢必會破壞均衡:

這樣確定是不行的, 那麼如何解決這個問題呢?

這個問題是什麼致使的呢? 是由於哈希函數所致使的, 哈希函數是當數據量大的時候, 能夠保證均勻的分佈, 可是當數據量小的時候並不能保證, 那就讓數據量大就行了.

咱們給每臺服務器分配1萬個虛擬節點, 令虛擬節點分佈到環上, 服務器負責的區域是這1萬個虛擬節點負責區域的總和, 這樣計算哈希的時候就保證了數據量, 即保證其哈希值會均勻分佈到環上, 問題解決.

以上, 就是一致性哈希的簡單介紹!!!