前一週上架服務器,原本準備把針對服務器的硬件監控這一部分總結下成文,結果過個端午給過忘了。。。今天就又整理了下,在這裏分享給51博友,也算是對本身前段工做的一個總結。linux
在對服務器的硬件監控上,目前業界主要基於以下兩種:ios
一、服務器自帶的工具,好比HP的hpacucli,DELL的OMSA等web
二、智能平臺管理接口 (IPMI,全稱Intelligent Platform Management Interface)apache
基於以上兩種,經過nagios、zabbix或自研運維平臺等包裹,進行預警操做。bootstrap
因爲博主公司使用的服務器所有爲DELL PowerEdge系列的,所以博主這裏將以如何對DELL PowerEdge系列服務器硬件進行監控這一實際案例爲主。api
1、OMSA 介紹瀏覽器
DELL OMSA的全稱爲Dell Openmanage Server Administrator,它是戴爾公司基於自主研發力量開發的IT系統管理解決方案,經過與業內領先的系統管理解決方案供應商密切配合,在深刻了解用戶對系統管理需求的基礎上,OMSA系統管理方案能夠全面解決系統管理人員最關心的系統部署、系統監控和系統變動三大系統管理問題。它經過提供如下兩種方式來對本地和遠程的服務器進行管理和監控。tomcat
一、基於Web瀏覽器的集成圖形用戶界面(GUI)bash
二、操做系統的命令行界面(CLI)工具服務器
你們可能對DELL的IDRAC更熟悉一點,OMSA其實就是 IDRAC企業版的開源社區版。這裏列出IDRAC和OMSA的web界面,二者看着很是類似,功能上也是很是類似。
IDRAC:
OMSA:
2、OMSA 部署
下面介紹如何安裝使用OMSA。因爲咱們公司主要使用的是紅帽系列的產品,所以這裏列舉RHEL6和CentOS6部署方式。
RHEL 6.X 平臺安裝 OMSA:
在RHEL6上部署OMSA,因爲DELL售後那邊發給我過資料,這裏我就不在重複寫了,貼上DELL售後的資料,很是的詳盡。
最新版本的OMSA 8.1下載連接:http://downloads.dell.com/FOLDER02876154M/1/OM-SrvAdmin-Dell-Web-LX-8.1.0-1518.RHEL6.x86_64_A00.tar.gz
安裝連接:http://zh.community.dell.com/techcenter/systems-management/w/wiki/561.omsalinux
CentOS 6.X 平臺安裝 OMSA:
CentOS 6.x系列的,其實也可使用和RHEL6同樣的方式安裝,只不過須要修改腳本里面的一些東西。咱們可使用dell官方提供的yum源,直接使用yum來在CentOS上安裝OMSA。
下面附上安裝步驟:
一、安裝dell的yum源
[root@kvm-phy04-jz ~]# wget -q -O - http://linux.dell.com/repo/hardware/latest/bootstrap.cgi | bash
二、安裝必要的2個包
[root@kvm-phy04-jz ~]# yum -y install OpenIPMI srvadmin-all
三、啓動服務
[root@kvm-phy04-jz ~]# /opt/dell/srvadmin/sbin/srvadmin-services.sh start
四、設置開機自啓動
[root@kvm-phy04-jz ~]# /opt/dell/srvadmin/sbin/srvadmin-services.sh enable racsvc 0:off 1:off 2:on 3:on 4:on 5:on 6:off dataeng 0:off 1:off 2:on 3:on 4:on 5:on 6:off dsm_om_shrsvc 0:off 1:off 2:on 3:on 4:on 5:on 6:off dsm_om_connsvc 0:off 1:off 2:off 3:on 4:off 5:on 6:off ipmi 0:off 1:off 2:on 3:on 4:on 5:on 6:off
五、經過web訪問OMSA界面
使用瀏覽器訪問https://ip_address:1311打開OMSA的web頁面。這裏注意,必定要使用https去訪問,不然頁面會打不開。
注意 : 這裏的用戶名和密碼使用的是系統的用戶名密碼,這地方和IDRAC是不同的。
這樣子,OMSA就安裝好了,web管理頁面也可使用了。
精簡OMSA組件:
雖然 OMSA 的web端功能很強大,可是在工做當中,咱們的主要目的並不是是使用它的web端,更多時間只是想使用它提供的一些命令行工具來獲取服務器主要組件的相關信息,好比CPU、內存、硬盤、陳列和主板溫度之類的健康情況。所以,咱們沒有必要安裝OMSA的web端。
下面就是卸載OMSA的web端相關的包:
[root@kvm-phy04-jz ~]# yum remove -y srvadmin-tomcat srvadmin-jre srvadmin-smweb
刪除相關的無用內容:
[root@kvm-phy04-jz ~]# rm -rf /opt/dell/srvadmin/lib64/openmanage/apache-tomcat
上述操做執行完畢以後,OMSA的web端也就基本清理乾淨了,這裏列出系統中安裝的和OMSA相關的包:
[root@kvm-phy04-jz ~]# rpm -qa|grep srvadmin srvadmin-omcommon-8.1.0-4.92.1.el6.x86_64 srvadmin-xmlsup-8.1.0-4.91.1.el6.x86_64 srvadmin-storelib-8.1.0-4.139.1.el6.x86_64 srvadmin-storage-cli-8.1.0-4.138.2.el6.x86_64 srvadmin-racdrsc-8.1.0-4.4.7.el6.x86_64 srvadmin-storage-snmp-8.1.0-4.138.2.el6.x86_64 srvadmin-storageservices-cli-8.1.0-4.3.1.el6.x86_64 srvadmin-oslog-8.1.0-4.85.1.el6.x86_64 srvadmin-isvc-snmp-8.1.0-4.38.1.el6.x86_64 srvadmin-rac4-8.1.0-4.1.127.el6.x86_64 srvadmin-server-cli-8.1.0-4.3.1.el6.x86_64 srvadmin-omilcore-8.1.0-4.85.1.el6.x86_64 srvadmin-racadm4-8.1.0-4.1.127.el6.x86_64 srvadmin-deng-8.1.0-4.8.1.el6.x86_64 srvadmin-hapi-8.1.0-4.10.2.el6.x86_64 srvadmin-ominst-8.1.0-4.94.3.el6.x86_64 srvadmin-omacore-8.1.0-4.94.3.el6.x86_64 srvadmin-storelib-sysfs-8.1.0-4.1.1.el6.x86_64 srvadmin-nvme-8.1.0-4.139.1.el6.x86_64 srvadmin-storage-8.1.0-4.138.2.el6.x86_64 srvadmin-sysfsutils-8.1.0-4.1.1.el6.x86_64 srvadmin-deng-snmp-8.1.0-4.8.1.el6.x86_64 srvadmin-racadm5-8.1.0-4.1.128.el6.x86_64 srvadmin-idracadm-8.1.0-4.4.7.el6.x86_64 srvadmin-racsvc-8.1.0-4.1.127.el6.x86_64 srvadmin-idrac-ivmcli-8.1.0-4.6.3.el6.x86_64 srvadmin-idrac-8.1.0-4.4.7.el6.x86_64 srvadmin-storageservices-snmp-8.1.0-4.3.1.el6.x86_64 srvadmin-rac4-populator-8.1.0-4.1.127.el6.x86_64 srvadmin-cm-8.1.0-4.1.249.el6.x86_64 srvadmin-server-snmp-8.1.0-4.3.1.el6.x86_64 srvadmin-itunnelprovider-8.1.0-4.27.1.el6.x86_64 srvadmin-omacs-8.1.0-4.92.1.el6.x86_64 srvadmin-isvc-8.1.0-4.38.1.el6.x86_64 srvadmin-smcommon-8.1.0-4.138.2.el6.x86_64 srvadmin-realssd-8.1.0-4.139.1.el6.x86_64 srvadmin-rac-components-8.1.0-4.4.7.el6.x86_64 srvadmin-argtable2-8.1.0-4.5.1.el6.x86_64 srvadmin-rac5-8.1.0-4.1.128.el6.x86_64 srvadmin-idrac-snmp-8.1.0-4.4.7.el6.x86_64 srvadmin-idrac-vmcli-8.1.0-4.5.1.el6.x86_64 srvadmin-storageservices-8.1.0-4.3.1.el6.x86_64 srvadmin-base-8.1.0-4.3.1.el6.x86_64 srvadmin-standardAgent-8.1.0-4.3.1.el6.x86_64
3、OMSA 使用指南
因爲 OMSA 的 web 端已經被咱們卸載掉了。所以咱們目前想要看到服務器的相關硬件信息就須要使用命令行的方式獲取了。那麼,這裏就介紹如何使用命令獲取服務器硬件信息。
OMSA自帶了一些工具來提供給咱們命令行的查詢和設置接口,這裏主要介紹兩個,一個是omreport,另外一個是omconfig。omreport是用來查詢服務器各類硬件狀態,omconfig是用來設置硬件的一些屬性的。
我在這裏僅列出這兩個命令的經常使用幾個命令,更多的命令詳情你們能夠去以下兩個網站查詢:
一、http://www.sxszjzx.com/~t096/manual/sc/Dosa/CLI/report.htm 二、http://topics-cdn.dell.com/pdf/dell-opnmang-srvr-admin-v8.1_User's%20Guide_en-us.pdf
命令指南:
/opt/dell/srvadmin/bin/omreport chassis # 顯示全部主要組件的常規狀態 /opt/dell/srvadmin/bin/omreport chassis memory # 顯示內存信息 /opt/dell/srvadmin/sbin/omreport chassis temps # 顯示系統主要組件的溫度 /opt/dell/srvadmin/bin/omreport storage adisk controller=0 # 查看磁盤陳列中的硬盤狀態 /opt/dell/srvadmin/bin/omreport storage pdisk controller=0 # 查看物理磁盤信息 /opt/dell/srvadmin/bin/omreport storage vdisk controller=0 # 查看虛擬硬盤的狀態 /opt/dell/srvadmin/bin/omreport storage controller # 查看控制器(即RAID卡)的屬性 /opt/dell/srvadmin/bin/omreport storage channel controller=0 # 查看通道的屬性 /opt/dell/srvadmin/bin/omreport storage enclosure controller=0 # 查看enclosure的屬性 /opt/dell/srvadmin/bin/omreport storage battery # 查看電池屬性 /opt/dell/srvadmin/bin/omconfig storage controller action=setrebuildrate controller=0 rate=100 # 調整rebuild的速度 /opt/dell/srvadmin/bin/omconfig storage vdisk action=changepolicy controller=0 vdisk=0 readpolicy=ara # 修改raid的讀策略 /opt/dell/srvadmin/bin/omconfig storage vdisk action=changepolicy controller=0 vdisk=0 writepolicy=fwb # 修改raid的寫策略
命令範例:
一、查看系統主要組件的溫度
[root@kvm-phy04-jz ~]# /opt/dell/srvadmin/bin/omreport chassis temps Temperature Probes Information ------------------------------------ Main System Chassis Temperatures: Ok ------------------------------------ Index : 0 Status : Ok Probe Name : System Board Inlet Temp Reading : 26.0 C Minimum Warning Threshold : 3.0 C Maximum Warning Threshold : 42.0 C Minimum Failure Threshold : -7.0 C Maximum Failure Threshold : 47.0 C Index : 1 Status : Ok Probe Name : System Board Exhaust Temp Reading : 31.0 C Minimum Warning Threshold : 8.0 C Maximum Warning Threshold : 70.0 C Minimum Failure Threshold : 3.0 C Maximum Failure Threshold : 75.0 C Index : 2 Status : Ok Probe Name : CPU1 Temp Reading : 36.0 C Minimum Warning Threshold : 8.0 C Maximum Warning Threshold : 79.0 C Minimum Failure Threshold : 3.0 C Maximum Failure Threshold : 84.0 C Index : 3 Status : Ok Probe Name : CPU2 Temp Reading : 30.0 C Minimum Warning Threshold : 8.0 C Maximum Warning Threshold : 79.0 C Minimum Failure Threshold : 3.0 C Maximum Failure Threshold : 84.0 C
二、查看虛擬硬盤的狀態
[root@kvm-phy04-jz ~]# /opt/dell/srvadmin/bin/omreport storage vdisk controller=0 List of Virtual Disks on Controller PERC H310 Mini (Embedded) Controller PERC H310 Mini (Embedded) ID : 0 Status : Ok Name : cislunar_space State : Ready Hot Spare Policy violated : Not Assigned Encrypted : Not Applicable Layout : RAID-10 Size : 836.63 GB (898319253504 bytes) T10 Protection Information Status : No Associated Fluid Cache State : Not Applicable Device Name : /dev/sda Bus Protocol : SAS Media : HDD Read Policy : No Read Ahead Write Policy : Write Through Cache Policy : Not Applicable Stripe Element Size : 64 KB Disk Cache Policy : Disabled
三、查看控制器(即RAID卡)的屬性
[root@kvm-phy04-jz ~]# /opt/dell/srvadmin/bin/omreport storage controller Controller PERC H310 Mini(Embedded) Controller ID : 0 Status : Non-Critical Name : PERC H310 Mini Slot ID : Embedded State : Degraded Firmware Version : 20.12.1-0002 Minimum Required Firmware Version : 20.13.1-0001 Driver Version : 06.700.06.00-rh1 Minimum Required Driver Version : Not Applicable Storport Driver Version : Not Applicable Minimum Required Storport Driver Version : Not Applicable Number of Connectors : 2 Rebuild Rate : 30% BGI Rate : 30% Check Consistency Rate : 30% Reconstruct Rate : 30% Alarm State : Not Applicable Cluster Mode : Not Applicable SCSI Initiator ID : Not Applicable Cache Memory Size : 0 MB Patrol Read Mode : Auto Patrol Read State : Stopped Patrol Read Rate : 30% Patrol Read Iterations : 0 Abort Check Consistency on Error : Disabled Allow Revertible Hot Spare and Replace Member : Enabled Load Balance : Not Applicable Auto Replace Member on Predictive Failure : Disabled Redundant Path view : Not Applicable CacheCade Capable : Not Applicable Persistent Hot Spare : Disabled Encryption Capable : Not Applicable Encryption Key Present : Not Applicable Encryption Mode : Not Applicable Preserved Cache : Not Applicable Spin Down Unconfigured Drives : Disabled Spin Down Hot Spares : Disabled Spin Down Configured Drives : Not Applicable Automatic Disk Power Saving (Idle C) : Not Applicable T10 Protection Information Capable : No
OK,本篇博文就到此,但願能對你們有所幫助!
劇透:
除了OMSA自帶的工具,還有一個便捷查詢的第三方工具 check_openmanage。不過因爲check_openmanage內容蠻多的,我就又拆出來一篇博文,避免本篇文章太長,使讀者沒有看下去的興致了。