做者:五色花的博客
來源: https://www.cnblogs.com/luao/...
本文大綱html
1、複製過程redis
Step 1:從節點執行 slaveof 命令。segmentfault
Step 2:從節點只是保存了 slaveof 命令中主節點的信息,並無當即發起複製。緩存
Step 3:從節點內部的定時任務發現有主節點的信息,開始使用 socket 鏈接主節點。安全
Step 4:鏈接創建成功後,發送 ping 命令,但願獲得 pong 命令響應,不然會進行重連。網絡
Step 5:若是主節點設置了權限,那麼就須要進行權限驗證,若是驗證失敗,複製終止。異步
Step 6:權限驗證經過後,進行數據同步,這是耗時最長的操做,主節點將把全部的數據所有發送給從節點。socket
Step 7:當主節點把當前的數據同步給從節點後,便完成了複製的創建流程。接下來,主節點就會持續的把寫命令發送給從節點,保證主從數據一致性。大數據
2、數據間的同步優化
上面說的複製過程,其中有一個步驟是「同步數據集」,這個就是如今講的「數據間的同步」。
redis 同步有 2 個命令:sync 和 psync,前者是 redis 2.8 以前的同步命令,後者是 redis 2.8 爲了優化 sync 新設計的命令。咱們會重點關注 2.8 的 psync 命令。
一、psync命令須要3個組件支持
二、主從節點各自複製偏移量
三、主節點複製積壓緩衝區
四、主節點運行ID
五、若是在重啓時不改變運行ID呢?
六、psync命令的使用方式
七、psync執行流程
流程說明:
從節點發送 psync 命令給主節點,runId 就是目標主節點的 ID,若是沒有默認爲 -1,offset 是從節點保存的複製偏移量,若是是第一次複製則爲 -1.主節點會根據 runid 和 offset 決定返回結果:
到這裏,數據之間的同步就講的差很少了,篇幅仍是比較長的。主要是針對 psync 命令相關之間的介紹。
3、全量複製
全量複製是 Redis 最先支持的複製方式,也是主從第一次創建複製時必須經歷的的階段。觸發全量複製的命令是 sync 和 psync。以前說過,這兩個命令的分水嶺版本是 2.8,redis 2.8 以前使用 sync 只能執行全量不一樣,2.8 以後同時支持全量同步和部分同步。
流程以下:
Step 1:發送 psync 命令(spync ?-1)
Step 2:主節點根據命令返回 FULLRESYNC
Step 3:從節點記錄主節點 ID 和 offset
*Step 4:主節點 bgsave 並保存 RDB 到本地*
*Step 5:主節點發送 RBD 文件到從節點*
*Step 6:從節點收到 RDB 文件並加載到內存中*
Step 7:主節點在從節點接受數據的期間,將新數據保存到「複製客戶端緩衝區」,當從節點加載 RDB 完畢,再發送過去。(若是從節點花費時間過長,將致使緩衝區溢出,最後全量同步失敗)
*Step 8:從節點清空數據後加載 RDB 文件,若是 RDB 文件很大,這一步操做仍然耗時,若是此時客戶端訪問,將致使數據不一致,可使用配置slave-server-stale-data 關閉. *
*Step 9:從節點成功加載完 RBD 後,若是開啓了 AOF,會馬上作 bgrewriteaof。*
以上加粗的部分是整個全量同步耗時的地方。
注意:
4、部分複製
當從節點正在複製主節點時,若是出現網絡閃斷和其餘異常,從節點會讓主節點補發丟失的命令數據,主節點只須要將複製緩衝區的數據發送到從節點就可以保證數據的一致性,相比較全量複製,成本小不少。
5、心跳
主從節點在創建複製後,他們之間維護着長鏈接並彼此發送心跳命令。
心跳的關鍵機制以下:
注意:
爲了下降主從延遲,通常把 redis 主從節點部署在相同的機房/同城機房,避免網絡延遲帶來的網絡分區形成的心跳中斷等狀況。
6、異步複製
主節點不但負責數據讀寫,還負責把寫命令同步給從節點,寫命令的發送過程是異步完成,也就是說主節點處理完寫命令後當即返回客戶度,並不等待從節點複製完成。
異步複製的步驟很簡單,以下:
Step 1:主節點接受處理命令。
Step 2:主節點處理完後返回響應結果 。
Step 3:對於修改命令,異步發送給從節點,從節點在主線程中執行復制的命令。
7、總結
本文主要分析了 Redis 的複製原理,包括複製過程,數據之間的同步,全量複製的流程,部分複製的流程,心跳設計,異步複製流程。
其中,能夠看出,RDB 數據之間的同步很是耗時。
因此,Redis 在 2.8 版本退出了相似增量複製的 psync 命令,當 Redis 主從直接發生了網絡中斷,不會進行全量複製,而是將數據放到緩衝區(默認 1MB)裏,再經過主從之間各自維護複製 offset 來判斷緩存區的數據是否溢出。若是沒有溢出,只須要發送緩衝區數據便可,成本很小;反之,則要進行全量複製。所以控制緩衝區大小很是的重要。
若有錯誤或其它問題,歡迎小夥伴留言評論、指正。若有幫助,歡迎點贊+轉發分享。
歡迎你們關注民工哥的公衆號:民工哥技術之路