上篇博文學習了cacti優秀的檢測與圖形分析功能,此次來着重介紹下nagios這款監控軟件的安裝配置方面ios
在使用nagios以前先來介紹下它的原理,nagios能監控服務和主機,可是它自己並不能實現這個功能,這個功能是由插件來完成的,nagios定義了4種監控狀態代碼爲OK表明正常,代碼爲WARNING表明警報,代碼爲CRITICAL表明爲嚴重錯誤,代碼爲UNKNOWN表明未知錯誤apache
實現監控服務主機須要的軟件網絡
nagios,nagios-plugins,這兩個個包均可以在nagios 的官方網站下載到具體怎麼下載就不用說了ide
實驗的效果是經過軟件來遠程監控主機的服務狀態 這裏我定義一臺機器,安裝httpd服務,讓nagios來監控服務的狀態學習
實驗拓撲圖以下網站
在監控機要安裝nagios因爲nagios和cacti已經集成到這個系統就不須要再安裝nagios了,要實現經過插件監控遠程機服務狀態運行狀況,插件
實驗步驟3d
1 在被監控機中安裝所需服務(apache)rest
2 定義監控內容blog
1)定義監控時間
vi /usr/local/nagios/etc/timeperiods.cfg
這裏系統都給咱們定義好了接下來設置監控所用的命令
vi /usr/local/nagios/etc/checkcommands.cfg
看到有一條是check-host-alive的定義命令 咱們準備用這個命令來作出實驗效果,檢查apache這個機器是否還活着
那麼怎麼定義監控誰呢 在hosts.cfg中定義要監控的機器和監控用到的命令
上述意思是監控主機的名字和別名 監控主機的地址 監控命令 監控選項 d爲down狀態發送通知 u爲unreachable狀態發送通知r爲recovery恢復通知 間隔時間 重試次數 聯繫組 監控時間…
check_command 要根據checkcommand裏的命令來寫不可寫錯,contact_groups要從contactgroups.cfg裏定義的組來寫不可寫錯 不然nagios會啓動不起來報錯
定義了監控誰以後就要作監控以後發生狀況要通知誰啦在文件夾目錄下有contacts.cfg文件默認定義了監控事件的通知,稍微修改或者不修改均可以的
這裏默認是郵件發向localhost的root
重啓nagios服務 /etc/init.d/nagios restart
這時就能夠看到www.test.com這臺主機 也就是192.168.1.4這臺主機的監控信息了
這時我把這臺主機的網絡鏈接斷掉 兩分鐘後查看下 以下圖
顯示主機已經down掉,這時咱們再從新鏈接網絡
能夠看到主機已經恢復
nagios不只能夠監控主機狀態還能夠監控遠程主機服務狀態
vi /usr/local/nagios/etc/services.cfg
在這裏通知選項裏多了個c 這個c是critical 嚴重錯誤的意思 重啓nagios後等兩分鐘
我把被監控機apache服務關閉以後在看
apache的狀態變成了critical 嚴重錯誤狀態
啓動apache以後處於OK狀態了
以上這種監控只能監控遠程主機的連通性和服務狀態 若是我須要監控每一臺遠程機器的內部信息就須要另一種方法了