SRE Google 運維解密 具體實踐二

十四、管理關鍵狀態:利用分佈式共識來提高可靠性 跨物理區域分佈式運行系統可以解決很多的系統災備問題,以保障在災難來臨時系統仍然能正常運行。但是卻帶來維護系統一致狀態視圖的需求,而這個問題的解決常常是複雜且難以實現的。 一組服務進程可能想要可靠地對以下問題產生共識: 哪個進程目前是該組織進行的leader? 本組中都包含哪些進程? 是否已經將某個消息成功地插入了某個分佈式隊列? 某個進程目前是否還持
相關文章
相關標籤/搜索