SRE Google 運維解密 具體實踐二

十4、管理關鍵狀態:利用分佈式共識來提升可靠性 跨物理區域分佈式運行系統能夠解決不少的系統災備問題,以保障在災難來臨時系統仍然能正常運行。可是卻帶來維護系統一致狀態視圖的需求,而這個問題的解決經常是複雜且難以實現的。 一組服務進程可能想要可靠地對如下問題產生共識: 哪一個進程目前是該組織進行的leader? 本組中都包含哪些進程? 是否已經將某個消息成功地插入了某個分佈式隊列? 某個進程目前是否還
相關文章
相關標籤/搜索