前兩天我被一篇「不是由於堅強而漂亮,而是由於漂亮而堅強」的文章震撼到了,一個醜女孩(原諒我,文中女孩未減肥前實在夠不上漂亮二字),成功瘦到只有原來的一半!由於身材變好,整我的徹底不同了,更自信更樂觀更堅強了!這就是顏值不夠身材湊的典型!瀏覽器
圖注:我大 GiGi 很美,由於身材炒雞棒更美!鄭重聲明照片費上文中提到的 MM。
固然今天小編並不是要分享本人的瘦身經歷,固然小編也沒有過減肥的經歷(小編近五年維持身高161cm,體重49kg,說不上瘦,但也夠不着胖),可是小編卻有過其餘方面的經歷能夠分享給你們,一樣是對沒法克服的缺陷另闢解決蹊徑。網絡
不管咱們是運用 24x7 小時網絡運行中心( NOC )和記錄詳盡的進程來實現傳統運營過程,仍是經過多功能團隊和高迭代式性方法來學習 DevOps 模式,咱們都面臨一個問題,那就是在監控系統、監控告警和咱們用來處理運營問題的過程之間溝通不順暢的狀況日益增多。咱們一般會在工單裏記錄下事件,可是處理工單的員工是否知曉潛在事件下的實時狀態?運維
對於重置密碼、更換硬盤或是修復用戶手機等幫助中心類任務,這個問題的意義不大。但現在環境複雜,監控系統層層堆棧,要想團隊與不斷變化的服務問題保持同步確實是不小的挑戰。工具
以咱們在運營中常見的典型工做流模式爲例。可能存在這樣的狀況:咱們收到的告警可能來自一封郵件、一條短信或者控制面板給出的指示。此時,咱們能夠經過已定義的流程或特定流程來處理這個事情,好比打開一個工單,直接對這個事件進行分析調查。咱們也能夠參照說明書、打開終端會話、查看某些圖表或是運行特定的診斷工具等任何當時咱們能想到的辦法。若是咱們本身沒法解決,能夠經過轉發功能或者設置的升級策略讓更適合的人處理故障。學習
可是潛在的故障問題會隨時爆發,並且咱們使用的監控系統各不相同,愈來愈多相同或者相似故障問題的告警塞爆了咱們的收件箱,或是讓咱們的手機響個不停。不止一個客戶反映:當故障已經被確認到解決該故障期間,仍然會不停收到相同告警內容的郵件和短信!這實際上是不合理的。spa
對此,OneAlert 給出了一個既簡單粗暴的解決方案。當告警出現時,咱們就已經把這些告警收集到一個級別更高的容器中,咱們稱之爲「事件」。一旦你着手解決手頭上的某個實際問題,咱們認爲,既然這些告警都與目前正在處理的問題相關,那就能夠把它們全都集中到一個實時的狀態頁面,做爲調查分析和解決過程當中最可靠的幫手。能夠直接在移動設備上打開,也能夠在桌面瀏覽器中打開。你在解決問題時,會發現告警狀態也在不斷變化。它可讓原先在分散各處的操做臺、控制面板、日誌查看軟件等資源變得有條理一些。不會再由於告警爲解決而不停收到相同告警郵件和短信而煩躁了,這都是變相的壓力呀!日誌
事件解決之後,OneAlert 最多能保留一年內發生的全部告警事件。如此龐大的分析功能,對事件分析提供了多大的便利!全部在中斷過程當中影響到系統的告警都逐個逐條、條理清晰地羅列出來。事件的發展所有呈如今一張大表裏面,包括各類不一樣的告警及其在整個過程當中的狀態變化。本來,過後爲了反思整個過程,須要從新組合排列全部郵件和其餘資源(告警事件越多,時間越久,所浪費的整理事件越長),如今徹底能夠省去這部分的人力和時間。code
全部人均可以在同一個雲告警平臺 OneAlert 操做,能夠看到整個處理過程,包括處理人、處理方式、處理內容、處理結果等,全部人的認知都隨時保持同步,徹底排除因溝通不順暢致使的故障沒法順利和按時解決的問題。blog
很是不錯吧?平常生活中,人與人之間的溝通必不可缺,可是對於運維,特別是須要處理很是環境龐雜的問題,有些流程上能 cut 溝通,若是可以經過同一個平臺簡單直觀的同步達成全體人員的共識,咱們何樂而不爲?更況且,這個平臺還能對你的告警進行事件聚合,免受告警風暴的影響,告訴我,你真的想錯過麼?進程
快點行動起來吧,仍是免費的喲!與 OneAlert 一塊兒攜手,從頭至尾改善你的事件管理吧!更多內容可參看OneAlert 官網 。
參考文獻:Get everyone on the same page... Literally
本文轉自 OneAPM 官方博客