VIP是虛擬的IP地址,並不對應於一個實際的物理網絡接口。經過爲一臺機器提供備用故障轉移選項,VIP可用於提供鏈接冗餘。node
如今經常使用keepalived來實現VIP,結構圖以下 bash
在master和backup沒法正常通行時(好比master和backup之間網絡出現問題),backup會認爲master已經掛掉,從而選舉本身成爲master,開始履行master的職責,對外廣播GARP和VRRP報文。這時舊的master依然在正常工做,那麼咱們在子網內將有兩個主機在同時告訴其餘主機:「我是192.168.1.2。」這就是「腦裂問題」。微信
通常採用兩個辦法來防止腦裂問題。網絡
VRRP是一種典型的2N冗餘,每每須要兩個或以上的實例來保證單個VIP的高可用。可是在實際工程中,多個VIP同時出問題可能性是比較低的,在這種狀況下,若是能用N+M(M<N)冗餘來達到效果無疑能達到節省成本的效果。運維
利用keepalived其實也能夠獲得部分N+M的效果,以下圖所示。這種方式須要注意配置文件的編寫,這無疑也意味着運維成本的增長。工具
本文會提出一種方法利用zookeeper來解決腦裂和成本問題,同時提供一些工具來幫助管理VIP。下面用ZVIP來指代這種方法。ui
總體設計比較簡單,以下圖所示: spa
如今探討這些不一樣的角色以及每一個角色須要執行的確切步驟。設計
假設要建立地址爲192.168.1.2和192.168.1.3的VIP,以下圖所示。其中192.168.1.4(node1),192.168.1.5(node2)和192.168.1.5(node3)爲實際的IP地址,在node1,node2和node3上運行agent。master運行在主機example.com上。3d
如今有了一個group,這個group裏有2個VIP和3個節點。這個group中有兩個角色
下面經過zkCli工具來演示工做的流程。
建立/groups, /nodes, /tasks這些znode。
[zk: localhost:2181(CONNECTED) 0] create /groups ""
Created /groups
[zk: localhost:2181(CONNECTED) 1] create /nodes ""
Created /nodes
[zk: localhost:2181(CONNECTED) 4] create /tasks ""
Created /tasks
[zk: localhost:2181(CONNECTED) 5] ls /
[groups, nodes, zookeeper, tasks]
複製代碼
當一個agent服務起來時,會在/nodes下注冊一個znode而且watch建立的znode。也會在/tasks下執行一樣的操做。
# For node1
[zk: localhost:2181(CONNECTED) 7] create /nodes/node-192-168-1-4 ""
Created /nodes/node-192-168-1-3
[zk: localhost:2181(CONNECTED) 9] ls /nodes/node-192-168-1-4 true
[]
# For node1
[zk: localhost:2181(CONNECTED) 7] create /tasks/node-192-168-1-4 ""
Created /nodes/node-192-168-1-4
[zk: localhost:2181(CONNECTED) 9] ls /tasks/node-192-168-1-4 true
[]
複製代碼
一個group老是被手動建立。建立者必定知道VIP的地址而且會知道真實機器的信息。建立者經過master來設置一個group(經過ui界面或者調用接口)。
master建立一個znode /groups/group1;而後在各個node下建立這個group。
# For master
[zk: localhost:2181(CONNECTED) 10] create /groups/group1 ""
Created /groups/group1
[zk: localhost:2181(CONNECTED) 11] create /groups/group1/vips ""
Created /groups/group1
[zk: localhost:2181(CONNECTED) 12] create /groups/group1/nodes ""
Created /groups/group1/nodes
[zk: localhost:2181(CONNECTED) 13] create /groups/group1/vips/vip-192-168-1-2 some-config
Created /groups/group1/vips/vip-192-168-1-2
[zk: localhost:2181(CONNECTED) 14] create /groups/group1/vips/vip-192-168-1-3 some-config
Created /groups/group1/vips/vip-192-168-1-3
[zk: localhost:2181(CONNECTED) 15] create /nodes/node-192-168-1-4/group1 some-config
Created /nodes/node-192-168-1-4/group1
[zk: localhost:2181(CONNECTED) 16] create /nodes/node-192-168-1-5/group1 some-config
Created /nodes/node-192-168-1-5/group1
[zk: localhost:2181(CONNECTED) 17] create /nodes/node-192-168-1-6/group1 some-config
Created /nodes/node-192-168-1-6/group1
複製代碼
node1由於以前監聽了*/nodes/node-192-168-1-4這個節點,因此會接受到zookeeper的通知,node1去讀取/nodes/node-192-168-1-4下面的znode,更新本身的配置。而後在/groups/group1/nodes*下去建立一個臨時znode。
# For node1
WATCHER::
WatchedEvent state:SyncConnected type:NodeChildrenChanged path:/nodes/node-192-168-1-4
[zk: localhost:2181(CONNECTED) 18] create -e -s /groups/group1/nodes/node-192-168-1-4 ""
Created /groups/group1/nodes/node-192-168-1-4
[zk: localhost:2181(CONNECTED) 19] ls /groups/group1/vips
[vip-192-168-1-2, vip-192-168-1-3]
[zk: localhost:2181(CONNECTED) 20] ls /groups/group1/vips/vip-192-168-1-2 true
[]
[zk: localhost:2181(CONNECTED) 21] ls /groups/group1/vips/vip-192-168-1-3 true
[]
複製代碼
當master爲*/groups/group1/vips*下面的節點增長子節點時,agent會獲得zookeeper的通知,經過獲取節點的內容,能夠知道本身是否是被master選中,從而選擇是否去執行VIP的職責。
如今master向node1發送命令,須要node1去執行。流程以下。 master在*/tasks/node-192-168-1-4*下建立znode,而且監聽其變化
# For master
[zk: localhost:2181(CONNECTED) 5] create -s /tasks/node-192-168-1-4/task- "job definition"
Created /tasks/node-192-168-1-4/task-0000000000
[zk: localhost:2181(CONNECTED) 6] ls /tasks/node-192-168-1-4/task-0000000000 true
[]
複製代碼
node1以前已經監聽過了*/tasks/node-192-168-1-4*,因此會獲得zookeeper的通知,這時node1會去讀取*/tasks/node-192-168-1-4下面的節點,拿到要執行的任務,在執行完成後,在/tasks//tasks/node-192-168-1-4/task-0000000000*中添加一個狀態znode
# For agent
[zk: localhost:2181(CONNECTED) 5] create /tasks/node-192-168-1-4/task-0000000000/status "done"
Created /tasks/node-192-168-1-4/task-0000000000/status
複製代碼
master由於監聽了/tasks/node-192-168-1-4/task-0000000000節點,因此會接到zookeeper的通知,知道任務已經完成。
VIP由master選擇,master會從*/groups/group1/nodes中獲取nodes列表,並選擇一個node,向其發送一個任務,告訴其讓來執行VIP的職責;node執行完成後通知上面的方式告知master任務完成,同時在/groups/group1/vips/vip-192-168-1-3下注冊一個臨時節點。master會監聽這個/groups/group1/vips/vip-192-168-1-3*這個節點,在node掛掉的時候master就能獲取通知。
要處理master掛掉的狀況,咱們須要有一個備份的master。當主master掛掉的時候,備份master會接管。
由於只有一個進程能成爲爲master,因此master進程必須經過某種方式不讓其餘master獲取master權限。
每一個master啓動時,會在/masters/下建立一個臨時節點。當節點建立成功,其餘嘗試建立同名znode的master會報錯,就此得知master這個角色已經被佔有的。其餘的master會監聽這個znode。也會和主master同樣監聽/groups和/tasks下面的節點。
# For master example.shopee.com
[zk: localhost:2181(CONNECTED) 11] create /masters/master-shopee-com:1212 ""
Created /masters/master-shopee-com:1212
複製代碼
master每次執行分配任務時,必須確認本身的master身份。
當一個agent掛掉時,好比node1掛掉時,/groups/group1/nodes/node-192-168-1-4這個臨時節點會被刪除,master會獲得zookeeper 的通知,從而開始選擇新的節點做爲VIP。
,歡迎你們關注個人微信公衆號《派森公園》。