大多 IT 運營支撐同窗都有過深夜業務應用忽然故障的經歷,監控系統準確告警,可是白天筋疲力盡的運維同窗在熟睡中,常常會遺漏告警提醒;每每是接到主管電話(用戶投訴了)才處理。有什麼辦法解決該問題呢?大多人是這麼作的:html
創建7x24小時的一線值班團隊,搞一個監控室,值班人員隨時警備,負責告警響應和協調調度工做。一年至少花費:4人(2班)x15萬/年=60萬/年,也就土豪公司的能夠搞搞,中小型公司腫麼辦?api
咱們部分贊同該思路:微信
創建7x24小時的 on-call 機制,隨時響應解決,經過團隊協做的機制來進行保障。網絡
但在具體的方法和形式上,須要一個好的工具是能夠支撐起7x24小時的 on-call 團隊,重點之一是:運維
有效的告警通知,並且是通知必達(如主管電話)。jsp
##如何通知必達?工具
OneAlert 以前已經支持了微信、短信、郵件、移動APP、頁面級提醒,新版4.1.2.0新增電話通知,不再怕深夜故障啦。優化
此次優化包括2部分:htm
新增電話提醒,智能語音播報告警內容,即便是深夜,你也可以及時喚醒,第一時間處理故障。避免手機網絡不穩定引發的微信、郵件、移動 APP 不及時現象,基本上電話是不可抗拒的,除非關機。固然若是關機的話(7x24不容許關機),OneAlert 的升級分派策略會同時通知其餘同窗。事件
階梯式延遲提醒通知。告警事件過來後,多個渠道能夠延遲的方式通知。若是在這個過程當中有人響應該告警了,那麼就沒有必要進行後續的提醒通知了。例如同時通知給2名值班同窗 A 和 B,其中同窗 A 收到微信提醒後,確認(響應)該告警了,那麼同窗 B 就不會繼續收電話通知了。
##7x24 on-call
回到原先的話題,如何構建7x24 on-call 機制去及時響應故障。
中小企業運維支撐同窗就可構建一個 on-call 團隊,告警事件的處理會逐漸進入正軌,並有序處理。
##結束語
此次新版本發佈, OneAlert 已經實現兩個中國領先:通知渠道領先和接入監控平臺領先。
OneAlert 做爲中國領先的雲告警平臺,後續版本將在如下方面發展:
OneAlert 是北京藍海訊通科技有限公司旗下產品,中國第一個 SaaS 模式的雲告警平臺,集成國內外主流監控/支撐系統,實現一個平臺上集中處理全部IT事件,提高IT可靠性。想了解更多信息,請訪問 OneAlert 官網 。