固然不是指像上圖那樣一邊開着車聽着歌,握着男/女友的手,一邊查看告警郵件的時候要慢一點。緣由你們都懂的,我就不拆了(由於大家都是單身狗啊!單身狗啊!單身狗啊!)。這裏要說的是,若是大家選擇了用 OneAlert 來接收告警郵件,查看的時候可必定要慢一點,慢一點,再慢一點啊!爲啥呢?html
######在你尚未用 OneAlert 的時候……ios
咱們責任心爆棚的運維菌們,爲了讓用戶有更好的體驗,爲了系統不掛,爲了避免被領導罵,爲了升職加薪,爲了迎娶白富美……一般會使用各類各樣的監控工具來對系統性能進行全方位的監控,好比功能強大又免費的 Nagios,Zabbix。你想用它們來監測 CPU 使用率,磁盤利用率,網卡吞吐量等等。你設定好了閾值,想讓它們在故障發生時給你發封郵件通知一下。而後,噩夢開始了……服務器
鏡頭一:初入職場的運維菌小張負責維護公司裏的一臺服務器。小張對她呵護備至,第一天就配置好了 Nagios,但願能第一時間知道她哪不舒服了。某天半夜1點,她終於宕機了。告警郵件如約而至,然而早上7點起牀睜眼抓起手機的小張卻當場石化了。新郵件通知設置成了靜音的他一共收到了:1臺服務器x1條進程x1次/分鐘發出告警x6小時x60分鐘=360封郵件……小張草草掃了一眼,內容實在懶得看,快速點擊所有勾選,一頁一頁地直接所有刪除掉。然而這其中還夾雜着幾封關於磁盤已寫滿的告警以及老闆明天早上請喝茶的郵件……微信
鏡頭二:後來小張開始負責10臺服務器的維護,每臺服務器100條進程。某天機房停電了……看到第一封宕機告警郵件後小張當即打開 Nagios,關閉告警。然而接下來的十幾分鍾他並不孤單,由於他一共收到了:10臺服務器x100條進程x1次/分鐘發出告警x1分鐘=1000封郵件……手機、電腦「bibibi」響個不停,郵件一封封地往郵箱裏躥。十幾分鍾後終於「bibi」完了,世界終於安靜了下來。郵件量太大,小張仍是不看內容,直接快速點擊所有勾選,一頁一頁不停地刪除郵件……然而這其中仍舊夾雜着幾封其餘類型的告警以及重要的工做郵件。運維
鏡頭三:如今的小張手下已經有100臺服務器了,每臺服務器仍是100條進程。某天小張正在開會的時候,機房又停電了……收郵件的過程太過殘酷,就不詳述了。不過此次小張吸收了以前的教訓,決定翻翻看裏面有沒有其餘告警或者工做郵件。翻了幾十封后,小張呵呵噠了,決定仍是直接一頁一頁全都刪了吧。其餘的告警通知和重要的工做郵件也只好一塊拜拜了。機器學習
小張很苦惱,發現本身絕大部分精力都耗費在了這些告警噪音上不說,好多正事兒還都被耽誤了。但又不能因噎廢食,徹底把告警系統停用掉。小張該怎麼辦?工具
######發現問題了嗎?性能
監控工具自帶的告警系統其實並不實用,它只會按照你以前設置好的規則機械性地持續發出告警,不會考慮告警信息的重複性、關聯性,更不會考慮你當前是否方便查收郵件,是否是須要通知其餘同事。一系列過多,重複,冗餘的告警通知造成的告警風暴,不只會使咱們的運維人員產生告警疲勞,疲於應對成百上千封郵件,只想趕快把它們都刪除掉。還會所以漏掉一些重要的告警,致使故障不能及時解決。平常工做也會受到影響。學習
######若是你用了 OneAlert!人工智能
若是小張使用了「OneAlert 告警平臺」來對監控工具發出的告警進行處理,將會是怎樣的呢?
由於 OneAlert 會按照時間序列對告警進行壓縮,初入職場的小張會收到:1臺服務器x1條進程x1次/分鐘發出告警x6小時x60分鐘x1分鐘=1封告警郵件;
由於 OneAlert 會按照關聯關係對告警進行壓縮,後來的小張會收到:10臺服務器x100條進程x1次/分鐘發出告警x1分鐘=10封郵件;
由於 OneAlert 會按照時間序列和關聯關係對告警進行壓縮,如今的小張會收到:100臺服務器x100條進程x1次/分鐘發出告警x N分鐘x1分鐘=100封郵件。
看到沒,郵件量瞬間就少了99%!留下來的都是通過壓縮合並後的告警信息,每一條都很重要,因此查看的時候必定要慢一點哦~
(機器學習&人工智能壓縮模式正在開發 ing,敬請期待~)
可是小張又有疑問了:每一個故障你只通知我一次,感受很不靠譜呀,萬一我又恰好錯過了那一次,豈不是完蛋了?!
沒錯,監控工具自帶的告警系統一般只支持郵件通知,頂多再加個短信通知。可是 OneAlert 不一樣!郵件通知後沒反應?不要緊,兩分鐘後再經過微信推一次。仍是沒反應?網斷了?不要緊,兩分鐘後經過短信再推一次。還沒反應?不要緊,兩分鐘後再打電話通知一下。仍是沒反應?那你已經關機或是睡着了吧,這個時候恐怕再發100封郵件也叫不醒你了。。何況爲了能在第一時間解決故障,咱們也來不及等到你醒了再去處理了。趕忙推送給小李吧!四種方式挨個兒通知一遍,小李也睡了?接着推送給小王。如此升級,直到團隊內有人響應爲止。
經過多種方式的可靠通知以及告警信息的有序分發,及時響應故障的重擔再也不是徹底壓在一我的身上了,可以確保整個團隊能在第一時間內採起應對措施。如今你還認爲監控工具一封又一封沒完沒了的郵件是必要的嗎?
因此,用了 OneAlert 後,你收到的都將會是重要的,不重複的,須要幫助隊友解決的告警郵件。查看的時候必定不要草草了事,匆匆刪除,要慢一點,仔細看好了再處理呀!~
(PS:一想到這麼實用又免費的產品還有好多運維菌都還沒開始用呢,就好捉急啊!好想問問葉璇和郭富城他們的降頭是在哪團購的,我也好想買一個下給屏幕前的各位小張,讓大家一看到這兒就忍不住要當即猛戳無償使用體驗一把啊!)
無償使用←請猛戳它!
無償使用←請猛戳它!
無償使用←請猛戳它!