一份來自滴滴運維工程師的監控系統建設心得

監控,是運維的眼睛,是穩定性建設中最重要的一環。 一般來講,基礎監控系統的主要功能就是發現問題。 故障發生前,通過監控的看圖巡檢,發現隱患;故障發生時,通過實時的告警,快速發現問題,定位問題所在;故障發生後,使用過去的歷史數據圖表,進行事後覆盤,避免下次發生。 本篇文章,我們不討論根因定位、故障自愈之類的高端主題,只跟大家聊一下筆者關於基礎監控系統的一些建設心得。 一、一般監控系統的功能 一般的基
相關文章
相關標籤/搜索