夏洛克·福爾摩斯,一直以來柯南道爾筆下的福爾摩斯形象在人們的腦海中都栩栩如生。敏銳的觀察力,縝密的推理思路,豐富的專業知識,一切撲朔迷離的刑事案件在他手中都能迎刃而解,一切的競爭對手在他面前都如此的黯然失色。他有一雙可以看穿世界的眼睛,被他關注的人都好像身體上被安裝了監控,全部的行動他都瞭如指掌。在福爾摩斯的領域中,任何的異動都掌握在他的手中,而且這些異動信息會第一時間到達他的手中。福爾摩斯教會了咱們,善於使用工具,可以讓工做事半功倍。html
《血字的研究》一案中,一把直尺,一個放大鏡等等都成爲了破案的重要工具,一羣野孩子提供的信息的效率遠遠高於警方所能提供的信息。再加上福爾摩斯全面的專業知識,最終將謎題解開。ios
如何利用簡單實用的工具,再加上過硬的專業知識找到事實的真相呢?又如何成爲運維界的福爾摩斯呢?運維的基本工做就是保障公司網站服務的可用性,服務器運行的穩定性。那麼如何對網站可用性、對服務器的運行狀態瞭如指掌?出現問題如何可以接收到精準的告警消息呢?web
請 mark 下面三款工具:數據庫
Ct (Cloud Test) 主要是經過分佈在全國各地的服務器對網站進行持續的監控,Ct 產品的價值在於網站管理員能夠藉此在終端用戶或顧客發現問題以前發現問題,知道網站或 web 應用是否運行緩慢,甚至宕機。Ct 產品不涉及真實的網站流量,所以能夠實現 7x24 小時的監控,或在正式發佈 web 應用以前進行測試。經過 Ct 產品能夠實時的瞭解網站在各個地域,運營商的性能表現,結合真實用戶監控產品 Browser Insight,能深刻了解應用的健康情況。api
經過 Cloud Test,你能夠: 安全
單頁面監控:分佈全國的服務器對網頁性能進行實時監控,提供網頁可用性、響應時間、http 錯誤等具體信息,深刻代碼級瞭解錯誤詳情,可用於監控網頁、我的站點,實時監控網頁性能。服務器
Ping 監控:在運維人員的平常工做中,對物理服務器的監控十分重要。物理機的 CPU、內存、磁盤使用率,網卡流量,磁盤 IO 等都須要進行監控。經過 ICMP 協議的 ping 監控,能夠判斷物理服務器運行是否正常或者網站是否出現故障。網絡不穩定或者服務器宕機, ping 就產生報警,讓您在第一時間收到告警。這樣大大提高了運維人員的工做效率。微信
API 監控:對於商務運算來講一個比較穩定的趨勢在於對 API 日漸增加的依賴性,幾乎每個代碼級交互過程都會調用 API 來收集數據或觸發某些關鍵過程,這就帶來一個問題,開發者怎麼才能肯定開發者的應用是因爲開發者本身的問題仍是因爲第三方服務廠商的 API 問題,因此開發者須要API監控。網絡
DNS 監控:監控 DNS 系統,防止網站 DNS 劫持(域名劫持)、域名過時或已被中止、域名 DNS 服務器未解析、域名解析記錄爲空或不正確等 DNS 服務器錯誤。 運維
既然有了實時的網站可用性監控,那麼對服務器的基礎組件監控需求也是必不可少的。我推薦一些還在觀望 Zabbix 和 Nagios 的初創團隊,能夠試一試 Cloud Insight。
Ci(Cloud Insight) 集監控、管理、協做、計算、可視化於一身,減小在系統監控上的人力和時間成本投入,讓運維工做變得更加高效、簡單。使用 Cloud Insight 操做簡單,40s完成安裝,再配置上數據庫中間件監控便可,其它的就直接在 Web 上查看,操做。
經過 Cloud Insight,你能夠:
有了強大的監控工具還不夠,完善的報警通知體系也是相當重要的。OneAlert 做爲國內首家雲告警平臺,可以輕鬆集成 Ct,Ci 產品,提供更合理的告警方式(固然 zabbix,nagios,阿里雲等監控工具均可以集成)。
經過 OneAlert ,你能夠:
合理的通知體系:
不一樣的主機組告警消息發給特定的負責人,而且告警消息經過微信、短信、郵件、電話、App 的方式通知,通知必達。
不一樣類型的告警消息發到不一樣角色負責人手中,好比 MySQL 類型的告警消息咱們能夠選擇發給公司的 DBA 同事,而網絡相關的告警消息咱們能夠選擇發給網絡工程師等。
有效的告警升級機制可以保證告警不會被遺漏,告警在設置時間內不確認、不解決的時候,會升級到二線值班人員。
合適的時間選擇合適的通知方式:
健全的告警分析體系:
從 Ct 對網站可用性的實時監控,再到 Ci 對服務器基礎組件的實時監控,出現問題有 OneAlert 健全的報警機制,通知必達,網站服務有問題及時監控發現,告警消息多方式通知到位,服務器這點小事,你還怕什麼?總有一款適合你。
本文系國內 ITOM 管理平臺 OneAPM 工程師原創文章。咱們致力於幫助企業用戶提供全棧式的性能管理以及 IT 運維管理服務,經過一個探針就可以完成日誌分析、安全防禦、APM 基礎組件監控、集成報警以及大數據分析等功能。想閱讀更多技術文章,請訪問 OneAPM 官方技術博客
本文轉自 OneAPM 官方博客