Supervisor 管理進程,Cloud Insight 監控進程,完美!

Supervisor 是由 Python 語言編寫、基於 linux 操做系統的一款服務器管理工具,用於監控服務器的運行,發現問題能當即自動預警及自動重啓等。html

Cloud Insight 是一款次世代監控工具兼數據管理平臺。使用 StatsD 採集性能指標,在 HBase 存儲之上,使用 OpenTSDB 來對性能指標進行聚合、分組、過濾。python

使用 Supervisor 的緣由

  • 若是你有不少進程在跑,不時還須要 start/stop/restart 一下進程linux

  • 若是哪天因爲某種緣由,進程掛了,你須要重啓進程或定時執行腳本web

  • 若是有多個進程,有些是同一項目,儘可能能夠同時啓動/中止等服務器

若是你有以上任意一種狀況,那用 Supervisor 管理進程無疑再合適不過了,把你全部 *nix 進程都配置進 ini 文件中,這樣全部的進程就變成了 Supervisor 的子進程。對於子進程,Supervisor 能夠作到準確管理(有 web 界面),能夠進行分組,一組組的 或者受權非 root 用戶。運維

Supervisor 管理進程, Cloud Insight 監控進程

Supervisor 只能管理進程,對進程進行操做,但不能監控進程,雖然有 web 界面能夠顯示/管理的進程,但不具有通常意義上的監控。例如實時展現進程數據,出現問題有相應報警郵件。工具

Cloud Insight 能夠監控 Supervisor 管理的進程數量和運行狀況,也能夠單獨監控進程,也就是說進程不管是否被 Supervisor 管理,Cloud Insight 均可以監控。性能

Supervisor 管理進程,Cloud Insight 監控進程,完美!

像上面圖片這樣,監控全部進程的 IO 讀寫,內存,CPU,打開文件等等,也能夠配置單個某一個進程的上述指標,查看正常狀況下進程的資源消耗,若是出現異常郵件報警。例如假死等狀況發生的時候,進程也沒掛,但資源消耗會有異常,這些經過告警統統提早知道。spa

Cloud Insight 支持監控 Supervisor

Cloud Insight 不只能夠監控進程相關的數據,一樣支持監控 Supervisor。Supervisor 管理進程的啓動/中止/重啓,若是 Supervisor 自己出問題了,那前面那些進程操做也就執行不了,雖然 Supervisor 自己不會出現什麼問題,但這也不是萬無一失的,因此監控上仍是好的。操作系統

監控進程,設置告警

若是有一個進程掛了,或者假死,怎麼可以及時知道?

Supervisor 管理進程,Cloud Insight 監控進程,完美!

配置上圖這樣的報警策略:

  • 選擇性能指標:指標任意選一個 process 的指標,over 選定特定進程,例如 process:python 就是監控 Python 進程數據的。

  • 設置報警條件:設置一個閾值,達到閾值時會觸發報警;此外還能夠配置設置數據丟失(進程掛了天然也就不會再發送數據)時,直接發送報警郵件。

  • 再下面,就是命名報警和設置通知用戶。

總之,若是你關心你的應用進程狀況,或者在使用 Supervisor,不妨試試 Cloud Insight,永久免費版等你來用!

OneAPM Cloud Insight 集監控、管理、計算、協做、可視化於一身,幫助全部 IT 公司,減小在系統監控上的人力和時間成本投入,讓運維工做更加高效、簡單。想閱讀更多技術文章,請訪問 OneAPM 官方技術博客

本文轉自 OneAPM 官方博客

參考文檔:

相關文章
相關標籤/搜索