一致性 hash 算法( consistent hashing )

consistent hashing 算法早在 1997 年就在論文 Consistent hashing and random trees 中被提出,目前在 cache 系統中應用愈來愈普遍; java

1 基本場景

好比你有 N  cache 服務器(後面簡稱 cache ),那麼如何將一個對象 object 映射到 N  cache 上呢,你極可能會採用相似下面的通用方法計算 object  hash 值,而後均勻的映射到到 N  cache  node

hash(object)%N web

一切都運行正常,再考慮以下的兩種狀況; 算法

一個 cache 服務器 m down 掉了(在實際應用中必需要考慮這種狀況),這樣全部映射到 cache m 的對象都會失效,怎麼辦,須要把 cache m  cache 中移除,這時候 cache  N-1 臺,映射公式變成了 hash(object)%(N-1)  服務器

因爲訪問加劇,須要添加 cache ,這時候 cache  N+1 臺,映射公式變成了 hash(object)%(N+1)  dom

1  2 意味着什麼?這意味着忽然之間幾乎全部的 cache 都失效了。對於服務器而言,這是一場災難,洪水般的訪問都會直接衝向後臺服務器; 函數

再來考慮第三個問題,因爲硬件能力愈來愈強,你可能想讓後面添加的節點多作點活,顯然上面的 hash 算法也作不到。 spa

  有什麼方法能夠改變這個情況呢,這就是 consistent hashing... .net

2 hash 算法和單調性

   Hash 算法的一個衡量指標是單調性( Monotonicity ),定義以下: code

  單調性是指若是已經有一些內容經過哈希分派到了相應的緩衝中,又有新的緩衝加入到系統中。哈希的結果應可以保證原有已分配的內容能夠被映射到新的緩衝中去,而不會被映射到舊的緩衝集合中的其餘緩衝區。

容易看到,上面的簡單 hash 算法 hash(object)%N 難以知足單調性要求。

3 consistent hashing 算法的原理

consistent hashing 是一種 hash 算法,簡單的說,在移除 / 添加一個 cache 時,它可以儘量小的改變已存在 key 映射關係,儘量的知足單調性的要求。

下面就來按照 5 個步驟簡單講講 consistent hashing 算法的基本原理。

3.1 環形hash 空間

考慮一般的 hash 算法都是將 value 映射到一個 32 爲的 key 值,也便是 0~2^32-1 次方的數值空間;咱們能夠將這個空間想象成一個首( 0 )尾( 2^32-1 )相接的圓環,以下面圖 1 所示的那樣。

circle space

 1 環形 hash 空間

3.2 把對象映射到hash 空間

接下來考慮 4 個對象 object1~object4 ,經過 hash 函數計算出的 hash  key 在環上的分佈如圖 2 所示。

hash(object1) = key1;

… …

hash(object4) = key4;

object

 2 4 個對象的 key 值分佈

3.3 cache 映射到hash 空間

Consistent hashing 的基本思想就是將對象和 cache 都映射到同一個 hash 數值空間中,而且使用相同的hash 算法。

假設當前有 A,B  C  3  cache ,那麼其映射結果將如圖 3 所示,他們在 hash 空間中,以對應的 hash值排列。

hash(cache A) = key A;

… …

hash(cache C) = key C;

cache

 3 cache 和對象的 key 值分佈

 

說到這裏,順便提一下 cache  hash 計算,通常的方法可使用 cache 機器的 IP 地址或者機器名做爲hash 輸入。

3.4 把對象映射到cache

如今 cache 和對象都已經經過同一個 hash 算法映射到 hash 數值空間中了,接下來要考慮的就是如何將對象映射到 cache 上面了。

在這個環形空間中,若是沿着順時針方向從對象的 key 值出發,直到碰見一個 cache ,那麼就將該對象存儲在這個 cache 上,由於對象和 cache  hash 值是固定的,所以這個 cache 必然是惟一和肯定的。這樣不就找到了對象和 cache 的映射方法了嗎?!

依然繼續上面的例子(參見圖 3 ),那麼根據上面的方法,對象 object1 將被存儲到 cache A 上; object2 object3 對應到 cache C  object4 對應到 cache B 

3.5 考察cache 的變更

前面講過,經過 hash 而後求餘的方法帶來的最大問題就在於不能知足單調性,當 cache 有所變更時,cache 會失效,進而對後臺服務器形成巨大的衝擊,如今就來分析分析 consistent hashing 算法。

3.5.1 移除 cache

考慮假設 cache B 掛掉了,根據上面講到的映射方法,這時受影響的將僅是那些沿 cache B 逆時針遍歷直到下一個 cache  cache C )之間的對象,也便是原本映射到 cache B 上的那些對象。

所以這裏僅須要變更對象 object4 ,將其從新映射到 cache C 上便可;參見圖 4 

remove

 4 Cache B 被移除後的 cache 映射

3.5.2 添加 cache

再考慮添加一臺新的 cache D 的狀況,假設在這個環形 hash 空間中, cache D 被映射在對象 object2 object3 之間。這時受影響的將僅是那些沿 cache D 逆時針遍歷直到下一個 cache  cache B )之間的對象(它們是也原本映射到 cache C 上對象的一部分),將這些對象從新映射到 cache D 上便可。

 

所以這裏僅須要變更對象 object2 ,將其從新映射到 cache D 上;參見圖 5 

add

 添加 cache D 後的映射關係

虛擬節點

考量 Hash 算法的另外一個指標是平衡性 (Balance) ,定義以下:

平衡性

  平衡性是指哈希的結果可以儘量分佈到全部的緩衝中去,這樣可使得全部的緩衝空間都獲得利用。

hash 算法並非保證絕對的平衡,若是 cache 較少的話,對象並不能被均勻的映射到 cache 上,好比在上面的例子中,僅部署 cache A  cache C 的狀況下,在 4 個對象中, cache A 僅存儲了 object1 ,而 cache C 則存儲了 object2  object3  object4 ;分佈是很不均衡的。

爲了解決這種狀況, consistent hashing 引入了「虛擬節點」的概念,它能夠以下定義:

「虛擬節點」( virtual node )是實際節點在 hash 空間的複製品( replica ),一實際個節點對應了若干個「虛擬節點」,這個對應個數也成爲「複製個數」,「虛擬節點」在 hash 空間中以 hash 值排列。

仍以僅部署 cache A  cache C 的狀況爲例,在圖 4 中咱們已經看到, cache 分佈並不均勻。如今咱們引入虛擬節點,並設置「複製個數」爲 2 ,這就意味着一共會存在 4 個「虛擬節點」, cache A1, cache A2 表明了 cache A  cache C1, cache C2 表明了 cache C ;假設一種比較理想的狀況,參見圖 6 

virtual nodes

 引入「虛擬節點」後的映射關係

 

此時,對象到「虛擬節點」的映射關係爲:

objec1->cache A2  objec2->cache A1  objec3->cache C1  objec4->cache C2 

所以對象 object1  object2 都被映射到了 cache A 上,而 object3  object4 映射到了 cache C 上;平衡性有了很大提升。

引入「虛擬節點」後,映射關係就從 { 對象 -> 節點 } 轉換到了 { 對象 -> 虛擬節點 } 。查詢物體所在 cache時的映射關係如圖 7 所示。

map

 查詢對象所在 cache

 

「虛擬節點」的 hash 計算能夠採用對應節點的 IP 地址加數字後綴的方式。例如假設 cache A  IP 地址爲202.168.14.241 

引入「虛擬節點」前,計算 cache A  hash 值:

Hash(「202.168.14.241」);

引入「虛擬節點」後,計算「虛擬節」點 cache A1  cache A2  hash 值:

Hash(「202.168.14.241#1」);  // cache A1

Hash(「202.168.14.241#2」);  // cache A2

小結

Consistent hashing 的基本原理就是這些,具體的分佈性等理論分析應該是很複雜的,不過通常也用不到。

http://weblogs.java.net/blog/2007/11/27/consistent-hashing 上面有一個 java 版本的例子,能夠參考。

http://blog.csdn.net/mayongzhan/archive/2009/06/25/4298834.aspx 轉載了一個 PHP 版的實現代碼。

http://www.codeproject.com/KB/recipes/lib-conhash.aspx C語言版本

相關文章
相關標籤/搜索