Zabbix企業應用之服務器硬件信息監控

以前介紹的Zabbix監控都是屬於監控服務方面,如今介紹一下Zabbix監控服務器硬件信息的。php

因爲我公司服務器都是使用Dell(我公司是手遊方面,服務器所有是Dell),服務器型號有r4十、r420、r7十、r720,系統有Centos 5.x、Centos 6.x 、Redhat 5.x、Redhat 6.x、Ubuntu 12.0四、Ubuntu 12.04.4等版本,對於硬件監控,我測試過Ipmi、Megacli、Smart等,但這些監控軟件的監控內容都比較少,沒有通用的那種,最後找到了Dell專門的Omsa,知足了個人需求,下面就介紹一下使用Omsa來監控Dell服務器的硬件信息。linux

目前我監控如下的硬件信息:ios

一、cpu處理器狀態web

二、cpu省電模式狀態(若是開啓了省電模式,在壓力大的時候,會很卡的)bootstrap

三、raid狀態(好比作了哪一個raid模式,raid狀態是否正常)ubuntu

四、內存狀態(能夠查看當前服務器最大支持多少內存,當前多少內存,若是內存有問題,能夠顯示哪一個位置內存故障)centos

五、機器溫度狀態(監控機器的溫度是否超過閥值)bash

六、物理硬盤狀態(監控物理硬盤是否有故障)服務器

七、電源狀態(是單電仍是雙電,是否有故障)ide

八、系統面板CMOS電池(cmos電池是否有故障)

九、網卡狀態(當前的網卡數量,以及網卡是否有問題)

十、風扇(當前的風扇數量,以及是否有故障)

默認是cpu省電模式監控關閉報警,其餘的監控都是15分鐘監控一次,若是連續2次都有問題則報警通知。

下面是監控圖

一、硬件正常的服務器監控截圖

wKioL1NdxYuAFlirAAQxcbtC95U846.jpg

二、部分硬件不正常的監控圖

wKiom1NdxmOSUNQSAARq-q-aIyU215.jpg

能夠看到此服務器的cpu開啓了省電模式,而且內存條有問題

通過命令行查看,發現有問題的內存條是第一個插槽

wKioL1NdxmbyfKYWAADg1vjYLso218.jpg

下面是安裝方法:

1、客戶端

A.在redhat或者centos系統裏安裝

一、安裝dell的yum源


wget -q -O - http://linux.dell.com/repo/hardware/latest/bootstrap.cgi | bash


二、安裝omsa


yum install srvadmin-all


三、作軟鏈接


ln -s /opt/dell/srvadmin/sbin/omreport /usr/bin/omreport ln -s /opt/dell/srvadmin/sbin/omconfig /usr/bin/omconfig


四、關閉web模式(僅容許運行cli)


echo "/usr/bin/omconfig system webserver action=stop" >>/opt/dell/srvadmin/sbin/srvadmin-services.sh


五、啓動omsa


/opt/dell/srvadmin/sbin/srvadmin-services.sh start


六、把omsa加入到開機啓動裏


echo "/opt/dell/srvadmin/sbin/srvadmin-services.sh start">>/etc/rc.local


以上是在centos或者redhat系統裏安裝omsa。

B.下面是在ubuntu下的安裝

一、增長源


echo 'deb http://linux.dell.com/repo/community/ubuntu precise openmanage' | sudo tee -a /etc/apt/sources.list.d/linux.dell.com.sources.list


二、檢測與增長key

gpg --keyserver pool.sks-keyservers.net --recv-key 1285491434D8786F gpg -a --export 1285491434D8786F | sudo apt-key add -


 


三、更新源


apt-get update -y


四、安裝omsa


apt-get install srvadmin-all -y


五、作軟鏈接


ln -s /opt/dell/srvadmin/sbin/omreport /usr/bin/omreport ln -s /opt/dell/srvadmin/sbin/omconfig /usr/bin/omconfig


六、啓動cli模式omsa


service dataeng start


C.zabbix客戶端的配置

一、下面是在zabbix_agentd.conf裏配置

#follow is monitor hardware 
UserParameter=hardware_battery,omreport chassis batteries|awk'/^Status/{if($NF=="Ok") {print 1} else {print 0}}' 
UserParameter=hardware_cpu_model,awk-vhardware_cpu_crontol=`sudoomreport chassis biossetup|awk'/C State/{if($NF=="Enabled") {print 0} else {print 1}}'` -vhardware_cpu_c1=`sudoomreport chassis biossetup|awk'/C1[-|E]/{if($NF=="Enabled") {print 0} else {print 1}}'` 'BEGIN{if(hardware_cpu_crontol==0 && hardware_cpu_c1==0) {print 0} else {print 1}}' 
UserParameter=hardware_fan_health,awk-vhardware_fan_number=`omreport chassis fans|grep-c "^Index"` -vhardware_fan=`omreport chassis fans|awk'/^Status/{if($NF=="Ok") count+=1}END{print count}'` 'BEGIN{if(hardware_fan_number==hardware_fan) {print 1} else {print 0}}' 
UserParameter=hardware_memory_health,awk-vhardware_memory=`omreport chassis memory|awk'/^Health/{print $NF}'` 'BEGIN{if(hardware_memory=="Ok") {print 1} else {print 0}}' 
UserParameter=hardware_nic_health,awk-vhardware_nic_number=`omreport chassis nics |grep-c "Interface Name"` -vhardware_nic=`omreport chassis nics |awk'/^Connection Status/{print $NF}'|wc-l` 'BEGIN{if(hardware_nic_number==hardware_nic) {print 1} else {print 0}}' 
UserParameter=hardware_cpu,omreport chassis processors|awk'/^Health/{if($NF=="Ok") {print 1} else {print 0}}' 
UserParameter=hardware_power_health,awk-vhardware_power_number=`omreport chassis pwrsupplies|grep-c "Index"` -vhardware_power=`omreport chassis pwrsupplies|awk'/^Status/{if($NF=="Ok") count+=1}END{print count}'` 'BEGIN{if(hardware_power_number==hardware_power) {print 1} else {print 0}}' 
UserParameter=hardware_temp,omreport chassis temps|awk'/^Status/{if($NF=="Ok") {print 1} else {print 0}}'|head-n 1 
UserParameter=hardware_physics_health,awk-vhardware_physics_disk_number=`omreport storage pdisk controller=0|grep-c "^ID"` -vhardware_physics_disk=`omreport storage pdisk controller=0|awk'/^Status/{if($NF=="Ok") count+=1}END{print count}'` 'BEGIN{if(hardware_physics_disk_number==hardware_physics_disk) {print 1} else {print 0}}' 
UserParameter=hardware_virtual_health,awk-vhardware_virtual_disk_number=`omreport storage vdisk controller=0|grep-c "^ID"` -vhardware_virtual_disk=`omreport storage vdisk controller=0|awk'/^Status/{if($NF=="Ok") count+=1}END{print count}'` 'BEGIN{if(hardware_virtual_disk_number==hardware_virtual_disk) {print 1} else {print 0}}'


二、重啓zabbix_agentd服務


ps-ef|grepzabbix|grep-vgrep|awk'{print $2}'|xargskill-9 /usr/local/zabbix/sbin/zabbix_agentd-c /usr/local/zabbix/conf/zabbix_agentd.conf


若是須要在其餘系統裏安裝,請參看官方wiki,地址是http://linux.dell.com/wiki/index.php/Repository/hardware

2、服務端

一、模板導入

把Template Hardware Monitor導入到zabbix裏(模板在附件),具體操做不介紹。

二、主機關聯模板

把須要監控的硬件服務器關聯此模板便可

相關文章
相關標籤/搜索