Nagios是一款開源的IT監控軟件套件,被開發在Linux下使用,能有效監控Windows、Linux和Unix的主機狀態,交換機路由器等網絡設置,打印機等。在系統或服務狀態異常時發出郵件或短信報警第一時間通知網站運維人員,在狀態恢復後發出正常的郵件或短信通知。ios
Nagios產品主要有Nagios XI、Nagios Log Server、Nagios Network Analyzer、Nagios Fusion。Nagios項目主要包括Nagios Core核心部分、Nagios Core Plugins插件、Nagios Core Addons拓展插件、Nagios Core Frontends前臺應用四個部分。web
Nagios的功能是監控服務和主機,可是他自身並不包括這部分功能,全部的監控、檢測功能都是經過各類插件來完成的。數據庫
Nagios結構主要由Nagios core、Nagios-plugins和一些可選的Addon(NRPE,NSCA,NDOUtils等等)組成,實際生產中,Nagios core提供的監控功能遠不能知足需求,要想搭建一個完善的IT監控管理系統,須要在Nagios監控端與被監控端安裝相應功能的Addon,下載地址http://www.nagios.org/,也可根據實際需求編寫所需的插件。windows
通常狀況下,Nagios監控端部署於獨立的一臺服務器(Linux或Unix操做系統),包括至少Nagios core,Nagios Plugins以及可選的NRPE,NSCA等Addon。被監控端:Linux系統下,需安裝Nagios plugins與可選NRPE、NSCA等Addon;windows下,安裝NSClient++便可。服務器
幾個經常使用的Addon以下: 1.NRPE:容許在被監控的遠程Linux/UNIX主機上執行插件以實現對主機本地資源或屬性的監控; 2.NSCA:該插件將遠程Linux/Unix主機的被動檢查結果發送到在監控端運行的Nagios守護程序; 3.NSClient++:它是Windows系統的監視代理程序/守護程序,它是NSClient和NRPE_NT的替代品; 4.NDOUtils:實現將Nagios中的全部狀態信息存儲在MySQL數據庫中。網絡
Nagios能夠識別4種狀態返回信息,即 0(OK)表示狀態正常/綠色、1(WARNING)表示出現警告/×××、2(CRITICAL)表示出現很是嚴重的錯誤/紅色、3(UNKNOWN)表示未知錯誤/深×××。Nagios根據插件返回來的值,來判斷監控對象的狀態,並經過web顯示出來,以供管理員及時發現故障。
架構
啓動Nagios後,它會週期性的自動調用插件去檢測服務器狀態,同時Nagios會維持一個隊列,全部插件返回來的狀態信息都進入隊列,Nagios每次都從隊首開始讀取信息,並進行處理後,把狀態結果經過web顯示出來。
Nagios提供了許多插件,利用這些插件能夠方便的監控不少服務狀態。安裝完成後,在nagios主目錄下的/libexec裏放有nagios自帶的可使用的全部插件,如,check_disk是檢查磁盤空間的插件,check_load是檢查CPU負載的,等等。每個插件能夠經過運行./check_xxx –h 來查看其使用方法和功能。 運維