raft算法學習記錄

時間 2019-12-07

標籤 raft 算法學習記錄简体版

原文原文鏈接

分佈式系統中考慮得最多的一個問題：節點崩潰

raft算法中節點分三類： leader、follower、candidate。
其中最複雜的問題都和leader節點崩潰有關，follower和candidate簡單直觀。

如何比較兩個節點的日誌條目，哪一個節點的日誌更加新？

任期大者，更新
任期相同者，index大者更新

leader日誌完整性特性(Leader Completeness Prop-erty)

leader日誌完整性特性的意思解讀：leader能當選，必須擁有完整日誌。這一特性保證了raft算法是安全的，任何一致性算法必須保證這一點。否則，意味着算法存在丟數據的漏洞。java

論證過程的翻譯：在5.4.3章節

三個關鍵時間

廣播時間（broadcastTime） << 選舉超時時間（electionTimeout） << 平均故障間隔時間（MTBF）c++

廣播時間指的是一個服務器並行地發送 RPCs 給集羣中全部的其餘服務器並接收到響應的平均時間；
選舉超時時間就是在 5.2節中介紹的選舉超時時間；
平均故障間隔時間就是對於一臺服務器而言，兩次故障間隔時間的平均值。

廣播時間必須比選舉超時時間小一個量級，選舉超時時間須要比平均故障間隔時間小上幾個數量級.算法

集羣成員變動問題

當集羣配置變動時，以日誌的方式來處理配置變動以後的各節點的最終一致。配置變動但未最終一致期間，若是leader結點崩潰，一樣遵循日誌同步的規則。即擁有配置變動日誌的結點纔可能當選爲leader。安全

還有三個問題要解決：

新的服務器以沒有投票權身份加入到集羣中來（leader 也複製日誌給它們，可是考慮過半的時候不用考慮它們）。直到日誌完成同步到新的服務器。
第二個問題是，集羣的 leader 可能不是新配置中的一員。這是一個很是極端的狀況，發生在新配置剛提交，可是未複製到大多數結點時，leader就崩潰了。這個時間新leader是個舊配置結點，它能夠處理客戶端的請求，可是一旦新配置日誌提交，新leader就會變成follower,集羣將從新進行選舉。
第三個問題是，被移除的服務器會發起新選舉。這個好解決，執行下線的服務器程序上把rpc請求也關閉就ok了。

日誌量太大的問題引伸出日誌壓縮的需求

即 raft快照。服務器

帶着問題去學習raft

leader在什麼時機會將日誌提交給狀態機？
follower如何確認本身的日誌是完整的？
除了隨機超時時間，還有什麼方法能夠避免candidate瓜分選票的問題？
只有一個領導人，單結點和性能問題如何解決？
新舊leader交接時，舊leader的日誌未提交，如何保證日誌完整？
leader的日誌比follower還少，怎麼最終一致？
raft不保證每一個結點按相同的順序執行全部日誌，那如何保證全部結點的狀態最終一致？
投票者是否能夠重複投票？如可不行，如何處理的？

開源實現sofa-jraft(java) braft(c++) edc/raft(go)

相關文章

相關標籤/搜索

OpenCV學習記錄

RabbitMQ學習記錄

web學習記錄

算法學習記錄-排序題

PHP 7 新特性

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。

最新文章

本站公眾號

歡迎關注本站公眾號,獲取更多信息

相關文章

>>更多相關文章<<