智能運維 | 我在百度對抗報警風暴(下)

在本系列上一篇文章《我在百度對抗報警風暴(上)》中,運小博介紹了報警風暴的起因及常規的報警合併策略。本篇文章中,將介紹基於報警策略關聯分析的報警合併策略、基於報警數據挖掘的機房故障分析、報警關注度分析、值班與逐級通告機制和報警回調等技術。 報警合併策略 01 關聯策略的報警合併 當某個模塊出現問題的時候,往往會引發上游或下游模塊也一併報警。假設模塊A調用了模塊B,當模塊B出現問題的時候,很顯然模塊
相關文章
相關標籤/搜索