依賴治理、灰度發佈、故障演練,阿里電商故障演練系統的設計與實戰經驗

作者|中亭 編輯|小智 2016 年,阿里巴巴研發了故障演練系統,把故障以場景化的方式沉澱到系統中,在線上主動回放故障,驗證監控報警、限流降級、故障遷移、容災策略、故障處理的有效性。本文將探討經典的故障類型,剖析故障成因,提出解決方案,介紹故障演練系統的設計和演進,提出故障演練的原則和經驗。 注:本文整理自阿里技術專家中亭在 QCon 北京 2017 上的演講,由阿里技術公衆號授權轉載。 寫在前面
相關文章
相關標籤/搜索