1.是整個運維環節,乃至整個產品生命週期中最重要的一環,事前及時預警發現故障,時候提供準確的數據追查定位問題,分析業務指標等。ios
2.本質是數據收集並處理(報警,繪圖,數據挖掘)的系統架構
3.常見的監控系統相關產品:Zabbix/Nagios/Cacti運維
- 如下說明是對Open-Falcon所支持項架構設計
1.模板支持繼承的同事支持覆蓋策略項設計
2.數據採集面配置,節省人力成本3d
3.較爲強大的數據模型blog
4.tag化描述告警策略each(metric=qps project=falcon module=judge)> 100繼承
5.水平擴展,多IDC支持生命週期
1.數據採集面配置:無需預約義,agent自動發現,支持plugin,支持主動push事件
2.容量水平擴展,生產環境每秒20多萬次數據收集,告警,存儲,繪圖
3.告警策略易於管理:支持策略模板,模板集成和覆蓋,報警接收人爲用戶組
4.報警事件自動化處理:觸發閾值以後支持callback,便於嵌入自動化邏輯
5.人性化告警設置:支持最大告警次數,告警級別,告警恢復通知,告警暫停,不一樣時段不一樣閾值,支持維護週期,支持報警合併
6.歷史數據高效查詢:秒級返回上百個指標一年的歷史數據
7.架構設計高可用:整個系統無核心單點,易運維,易部署