Redis集羣

時間 2019-11-19

標籤 redis 集羣欄目 Redis 简体版

原文原文鏈接

RedisCluster是redis的分佈式解決方案，在3.0版本後推出的方案，有效地解決了Redis分佈式的需求，當遇到單機內存、併發等瓶頸時，可以使用此方案來解決這些問題node

分佈式數據庫概念：

1，分佈式數據庫把整個數據按分區規則映射到多個節點，即把數據劃分到多個節點上，每一個節點負責總體數據的一個子集,好比咱們庫有900條用戶數據，有3個redis節點，將900條分紅3份，分別存入到3個redis節點redis

2，分區規則：數據庫

常見的分區規則哈希分區和順序分區，redis集羣使用了哈希分區，順序分區暫用不到，不作具體說明；rediscluster採用了哈希分區的「虛擬槽分區」方式（哈希分區分節點取餘、一致性哈希分區和虛擬槽分區），其它兩種也不作介紹，有興趣能夠百度瞭解一下。ruby

3，虛擬槽分區(槽：slot)併發

RedisCluster採用此分區，全部的鍵根據哈希函數(CRC16[key]&16383)映射到0－16383槽內，共16384個槽位，每一個節點維護部分槽及槽所映射的鍵值數據,哈希函數: Hash()=CRC16[key]&16383 按位與分佈式

槽與節點的關係以下函數

redis用虛擬槽分區緣由：1，解耦數據與節點關係，節點自身維護槽映射關係，分佈式存儲工具

4，redisCluster的缺陷：ui

a，鍵的批量操做支持有限，好比mset, mget，若是多個鍵映射在不一樣的槽，就不支持了spa

b，鍵事務支持有限，當多個key分佈在不一樣節點時沒法使用事務，同一節點是支持事務

c，鍵是數據分區的最小粒度，不能將一個很大的鍵值對映射到不一樣的節點

d，不支持多數據庫，只有0，select 0

e，複製結構只支持單層結構，不支持樹型結構。

集羣環境搭建－手動篇：

1，在/usr/local/bin/clusterconf目錄,

6389爲6379的從節點，6390爲6380的從節點，6391爲6381的從節點

2，分別修改637九、 6380、 738一、 638九、 6390、 6391配置文件

port 6379 //節點端口

cluster-enabled yes //開啓集羣模式

cluster-node-timeout 15000 //節點超時時間（接收pong消息回覆的時間）

cluster-config-file /usrlocalbin/cluster/data/nodes-6379.conf 集羣內部配置文件

其它節點的配置和這個一致，改端口便可

3，配置完後，啓動6個redis服務

命令：cd /usr/local/bin/clusterconf/data

cat nodes-6379.conf //查看6379節點ID值

也能夠這樣查看 6379>cluster nodes

4，各節點啓動後，使用cluster meet ip port與各節點握手，是集羣通訊的第一步

5，握手成功後，使用cluster nodes能夠看到各節點均可以互相查詢到

6，節點握手成功後，此時集羣處理下線狀態，全部讀寫都被禁止

7，使用cluster info命令獲取集羣當前狀態

8，redis集羣有16384個哈希槽，要把全部數據映射到16384槽，須要批量設置槽

redis-cli -h 127.0.0.1 -p 6379 cluster addslots {0...5461}

但個人虛擬機按範圍分配有問題，同窗們回去試一下看有沒有問題

錯誤爲： (error) ERR Invalid or out of range slot

批量不行，單個是能夠的

redis-cli -h 127.0.0.1 -p 6379 cluster addslots 1 2 3 4

所以，我寫一個腳本/usr/local/bin/addSlots.sh, 詳情可見些腳本……

執行這個腳本可分配好槽位……

9，分配完槽後，可查看集羣狀態

10，而後再查看cluster nodes，查看每一個節點的ID

11，將6389，6390，6391與 6379,6380,6381作主從映射

127.0.0.1:6389> cluster replicate af2c99b58aa8a0a8fd82ba594654ce9264ffb9bc

127.0.0.1:6390> cluster replicate 2d6e6deb9512324336754b7b3fdf86032445c77c

127.0.0.1:6391> cluster replicate 61bd9fbbd3c154da318b502b86b1ee6516b82c17

12，注：這是手動模式，在生產環境咱們通常採用如下自動模式安裝

自動安裝模式：

1，在/usr/local新建目錄：ruby

下載連接：https://pan.baidu.com/s/1kWsf3Rh 密碼：n3pc

從這個連接下載 ruby-2.3.1.tar.gz 和 redis-3.3.0.gem

解壓 tar -zxvf ruby-2.3.1.tar.gz

a, cd ruby-2.3.1

b, ./configure -prefix=/usr/local/ruby

c, make && make install //過程會有點慢，大概5－10分鐘

d, 而後gem install -l redis-3.3.0.gem //沒有gem須要安裝yum install gem

e,準備好6個節點，（注意不要設置requirepass）,將/usr/local/bin/clusterconf/data的config-file刪除；依次啓動6個節點：./redis-server clusterconf/redis6379.conf

若是以前redis有數據存在，flushall清空；(坑:不須要cluster meet ..)

f, 進入cd /usr/local/bin, 執行如下：1表明從節點的個數

./redis-trib.rb create --replicas 1 192.168.1.111:6379 192.168.1.111:6380 192.168.1.111:6381 192.168.1.111:6389 192.168.1.111:6390 192.168.1.111:6391

主從分配，6379是6389的從節點

貌似只有主節點可讀寫，從節點不能夠

主節點死後，從節點變成主節點

集羣健康檢測

redis-trib.rb check 192.168.1.111:6379 (注：redis先去註釋掉requirepass，否則連不上)

如此出現了這個問題，6379的5798槽位號被打開了

解決以下：

6379，6380，6381的有部分槽位被打開了，分別進入這幾個節點，執行

6380:>cluster setslot 1180 stable

cluster setslot 2998 stable

cluster setslot 11212 stable

其它也同樣，分別執行修復完後：

此時修復後的健康正常；

當停掉6379後，過會6389變成主節點

注意：使用客戶端工具查詢時要加-c

./redis-cli -h 192.168.1.111 -p 6379 -c

mset aa bb cc dd,批設置對應在不一樣的solt上，缺點

集羣正常啓動後，在每一個redis.conf里加上

masterauth 「12345678」

requiredpass 「12345678」

當主節點下線時，從節點會變成主節點，用戶和密碼是頗有必要的，設置成一致

這上面是一主一從，那能不能一主多從呢？

./redis-trib.rb create --replicas 2

192.168.1.111:6379 192.168.1.111:6380 192.168.1.111:6381

192.168.1.111:6479 192.168.1.111:6480 192.168.1.111:6481

192.168.1.111:6579 192.168.1.111:6580 192.168.1.111:6581

節點之間的通訊

節點之間採用Gossip協議進行通訊，Gossip協議就是指節點彼此之間不斷通訊交換信息

當主從角色變化或新增節點，彼此經過ping/pong進行通訊知道所有節點的最新狀態並達到集羣同步

Gossip協議

Gossip協議的主要職責就是信息交換，信息交換的載體就是節點之間彼此發送的Gossip消息，經常使用的Gossip消息有ping消息、pong消息、meet消息、fail消息

meet消息：用於通知新節點加入，消息發送者通知接收者加入到當前集羣，meet消息通訊完後，接收節點會加入到集羣中，並進行週期性ping pong交換

ping消息：集羣內交換最頻繁的消息，集羣內每一個節點每秒向其它節點發ping消息，用於檢測節點是在在線和狀態信息，ping消息發送封裝自身節點和其餘節點的狀態數據；

pong消息，當接收到ping meet消息時，做爲響應消息返回給發送方，用來確認正常通訊，pong消息也封閉了自身狀態數據；

fail消息：當節點斷定集羣內的另外一節點下線時，會向集羣內廣播一個fail消息，後面會講到。……

消息解析流程

全部消息格式爲：消息頭、消息體，消息頭包含發送節點自身狀態數據（好比節點ID、槽映射、節點角色、是否下線等），接收節點根據消息頭能夠獲取到發送節點的相關數據。

選擇節點併發送ping消息：

Gossip協議信息的交換機制具備自然的分佈式特性，但ping pong發送的頻率很高，能夠實時獲得其它節點的狀態數據，但頻率高會加劇帶寬和計算能力，所以每次都會有目的性地選擇一些節點；可是節點選擇過少又會影響故障判斷的速度，redis集羣的Gossip協議兼顧了這二者的優缺點，看下圖：

不難看出：節點選擇的流程能夠看出消息交換成本主要體如今發送消息的節點數量和每一個消息攜帶的數據量

流程說明：

選擇發送消息的節點數量：集羣內每一個節點維護定時任務默認爲每秒執行10次，每秒會隨機選取5個節點，找出最久沒有通訊的節點發送ping消息，用來保證信息交換的隨機性，每100毫秒都會掃描本地節點列表，若是發現節點最近一次接受pong消息的時間大於cluster-node-timeout/2 則馬上發送ping消息，這樣作目的是防止該節點信息太長時間沒更新，當咱們寬帶資源緊張時，在可redis.conf將cluster-node-timeout 15000 改爲30秒，但不能過分加大
消息數據：節點自身信息和其餘節點信息