Nagios監控的原理及工做過程介紹

     Nagios是一款開源的免費網絡監視工具,能有效監控Windows、Linux和Unix的主機狀態,交換機路由器等網絡設置,打印機等。在系統或服務狀態異常時發出郵件或短信報警,第一時間通知網站運維人員,在狀態恢復後發出正常的郵件或短信通知。
     Nagios是一個監視系統運行狀態和網絡信息的監視系統。Nagios能監視所指定的本地或遠程主機以及服務,同時提供異常通知功能等。
     Nagios可運行在Linux/Unix平臺之上,同時提供一個可選的基於瀏覽器的WEB界面以方便系統管理人員查看網絡狀態,各類系統問題,以及日誌等等。

Nagios 能夠監控的功能有:
監控網絡服務(SMTP、POP三、HTTP、PING等);
監控主機資源(處理器負荷、磁盤利用率等);
簡單地插件設計使得用戶能夠方便地擴展本身服務的檢測方法;
當服務或主機問題產生與解決時將告警發送給聯繫人(經過EMail、短信、用戶定義方式);
能夠定義一些處理程序,使之可以在服務或者主機發生故障時起到預防做用;
自動的日誌滾動功能;
可選的WEB界面用於查看當前的網絡狀態、通知和故障歷史、日誌文件等;

插件:
     nagios-plugins是nagios官方提供的一套插件程序,nagios監控主機的功能其實都是經過執行插件程序來實現的。
     nagios自己並無監控的功能,全部的監控是由插件完成的,插件將監控的結果返回給nagios,nagios分析這些結果以web的方式展示給咱們,同時提供相應的報警功能(這個報警的功能也是由插件完成的)。
     全部的這些插件是一些實現特定功能的可執行程序,默認安裝的路徑是/usr/local/nagios/libexec,能夠本身查看。

使用NRPE監控LINUX上的」本地信息」

     對系統爲linux的主機進行以下監控:CPU負載、磁盤容量、登錄用戶數、總進程數、殭屍進程數、swap分區使用狀況。
     對於像磁盤容量,cpu負載這樣的」本地信息」,nagios只能監測本身所在的主機,而對其餘的機器則顯得有點無能爲力。畢竟沒獲得被控主機的適當權限是不可能獲得這些信息的。爲了解決這個問題,nagios有這樣一個附加組件----NRPE。用它就能夠完成對linux類型主機」本地信息」的監控。

NRPE總共由兩部分組成:
       -  check_nrpe 插件,位於在監控主機上
       – NRPE daemon,運行在遠程的linux主機上(一般就是被監控機)

當nagios須要監控某個遠程linux主機的服務或者資源狀況,通常過程:
1.nagios會運行check_nrpe這個插件,告訴它要檢查什麼;

2.check_nrpe插件會鏈接到遠程的NRPE daemon,所用的方式是SSL;

3.NRPE daemon會運行相應的nagios插件來執行檢查;

4.NRPE daemon將檢查的結果返回給check_nrpe插件,插件將其遞交給nagios作處理。

注意:NRPE daemon須要nagios插件安裝在遠程的linux主機上,不然,daemon不能作任何的監控.

經過NRPE的檢測分爲兩種:
       1).直接檢測:檢測的對象是運行NRPE的那臺linux主機的本地資源,原理以下圖
被監控機上安裝有nrpe,而且還有插件,最終的監控是由這些插件來進行的.當監控主機將監控請求發給nrpe後,nrpe調用插件來完成監控.

       2).間接檢測:當運行nagios的監控主機沒法訪問到某臺被監控機,可是運行NRPE的機器能夠訪問到時,NRPE就能夠充當一個代理,將監控請求發送到被監控機(必需要說明的是,一般被監控機與監控機在同一網絡內,因此這樣的狀況不多)

Nagios工做原理圖:

wKioL1MEH5qSofFfAAK_8dn_Vlc373.jpg
相關文章
相關標籤/搜索