乾貨 | 通過不斷地失敗來避免失敗,攜程混沌工程實踐

作者簡介  Ctrip SRE,負責攜程網站系統可靠性保障,探索和落地高可用體系的運維架構,如多活容災、全鏈路壓測、混沌工程、AIOPS等。 混沌工程的核心思想是通過不斷地失敗來避免失敗,以主動製造故障的方法來宏觀地驗證業務的容災和恢復能力。本文討論了攜程在實踐混沌工程以來的想法和方案,希望能帶來一些參考和啓發。 我們對故障何時會發生一無所知,而故障也無可避免地一定會發生。   一、我們爲什麼要做
相關文章
相關標籤/搜索