第07期:故障排查-爲什麼發出的告警爲已解決?

本期作者:吳洋 愛可生上海研發中心成員,研發工程師。 現象 測試環境中出現了一個異常的告警現象:一條告警通過 Thanos Ruler 的 HTTP 接口觀察到持續處於 active 狀態,但是從 AlertManager 這邊看這條告警爲已解決狀態。按照 DMP 平臺的設計,告警已解決指的是告警上設置的結束時間已經過了當前時間。一條發送至 AlertManager 的告警爲已解決狀態有三種可能:
相關文章
相關標籤/搜索