1、Nagios簡介 linux
主要功能 ios
網絡服務監控(SMTP、POP三、HTTP、NNTP、ICMP、SNMP、FTP、SSH) web
主機資源監控(CPU load、disk usage、system logs),也包括Windows主機(使用NSClient++ plugin) 服務器
能夠指定本身編寫的Plugin經過網絡收集數據來監控任何狀況(溫度、警告……) 網絡
能夠經過配置Nagios遠程執行插件遠程執行腳本 併發
遠程監控支持SSH或SSL加通道方式進行監控 spa
簡單的plugin設計容許用戶很容易的開發本身須要的檢查服務,支持不少開發語言 .net
包含不少圖形化數據Plugins(Nagiosgraph、Nagiosgrapher、PNP4Nagios等) 插件
可並行服務檢查 設計
可以定義網絡主機的層次,容許逐級檢查,就是從父主機開始向下檢查
當服務或主機出現問題時發出通告,可經過email, pager, sms 或任意用戶自定義的plugin進行通知
可以自定義事件處理機制從新激活出問題的服務或主機
自動日誌循環
支持冗餘監控
包括Web界面能夠查看當前網絡狀態,通知,問題歷史,日誌文件等。
主要特色
監視網絡服務 (SMTP, POP3, HTTP, NNTP, PING等)
監視主機資源 (進程, 磁盤等)
簡單的插件設計能夠輕鬆擴展Nagios的監視功能
服務等監視的併發處理
2、Nagios工做原理
Nagios的功能是監控服務和主機,可是他自身並不包括這部分功能,全部的監控、檢測功能都是經過各類插件來完成的。啓動Nagios後,它會週期性的 自動調用插件去檢測服務器狀態,同時Nagios會維持一個隊列,全部插件返回來的狀態信息都進入隊列,Nagios每次都從隊首開始讀取信息,並進行處 理後,把狀態結果經過web顯示出來。
Nagios提供了許多插件,利用這些插件能夠方便的監控不少服務狀態。安裝完成後,在nagios主目錄下的/libexec裏放有nagios自帶的 可使用的全部插件,如,check_disk是檢查磁盤空間的插件,check_load是檢查CPU負載的。每個插件能夠經過運 行./check_xxx –h 來查看其使用方法和功能。
Nagios能夠識別4種狀態返回信息,即 0(OK)表示狀態正常/綠色、1(WARNING)表示出現警告/黃色、2(CRITICAL)表示出現很是嚴重的錯誤/紅色、3(UNKNOWN)表 示未知錯誤/深黃色。Nagios根據插件返回來的值,來判斷監控對象的狀態,並經過web顯示出來,以供管理員及時發現故障。
Nagios 經過週期性的運行它來得到遠端服務器的各類狀態信息。它們之間的關係以下圖所示:
Nagios 經過NRPE 來遠端管理服務:
1. Nagios 執行安裝在它裏面的check_nrpe 插件,並告訴check_nrpe 去檢測哪些服務。
2. 經過SSL,check_nrpe 鏈接遠端機子上的NRPE daemon
3. NRPE 運行本地的各類插件去檢測本地的服務和狀態(check_disk,..etc)
4. 最後,NRPE 把檢測的結果傳給主機端的check_nrpe,check_nrpe 再把結果送到Nagios狀態隊列中。
5. Nagios 依次讀取隊列中的信息,再把結果顯示出來。
NRPE是監控軟件nagios的一個擴展,它被用於被監控的服務器上,向nagios監控平臺提供該服務器的一些本地的狀況。例如,cpu負載、內存使用、硬盤使用等等。NRPE能夠稱爲nagios的for linux 客戶端。