一個能監控系統資源的shell腳本

剛寫了個監控系統資源的腳本,就是一個拋磚引玉的效果。你們能夠研究下。
前邊的數值能夠改下,改爲本身想監控的大小,
監控腳本執行內容以前的變量是設置監控信息的,按需求修改。
[root@AR log]# cat monitor
#!/bin/bash
#System Monitoring Script
while [ 1 ]
do
#本機需開啓postfix或sendmail服務。
#報警郵件地址設置
MAILFROM=monitor@zhaoyun.com
MAILTO=zhaoyun006@163.com
#設置腳本運行間隔時間。單位(秒)。
RUNTIME=1
#內存使用率監控設置,單位 (%)
MEMTHRE=90
#流量監控設置
#要監控的網卡
ETHX=eth0
#填寫大於多少MB的時候發送警報,單位(MB)
INFLOWTHREMB=50
OUTFLOWTHREMB=50
#填寫大於多少KB的時候發送警報,單位(KB)
INFLOWTHREKB=500
OUTFLOWTHREKB=500
#TCP鏈接狀態數量監控設置
#填寫最大鏈接的個數
TIME_WAIT=10
FIN_WAIT1=20
FIN_WAIT2=20
ESTABLISHED=20
SYN_RECV=10
CLOSE_WAIT=10
CLOSING=10
LAST_ACK=10
#CPU使用率監控設置
#填寫cpu使用率大於多少發送報警,單位(%)
CPUTHRE=5
#硬盤使用大小設置
#填寫硬盤佔用率,單位(%)
ROOT=80
VAR=100
USR=100
BOOT=80
#調試模式開關。(YES/NO)
DBUG=NO
#                 監 控 腳 本 執 行 內 容     
################################################################################
time=`date +"%Y-%m-%d %H:%M:%S"`
#內存監控部分
NULL=/dev/null
MEM=`free -m |grep Mem |awk '{print $3/$2*100}'`
MEMB=`free -m |grep Mem |awk '{print $2,$4+$6+$7}'|awk '{print $1,$1-$2}'| awk '{print $2/$1*100}'`
#echo $MEM
#echo $MEMB
MA=`expr $MEM \> $MEMTHRE `
if [ $MA -eq 1 ] ; then
sendmail -t <<EOF
from: $MAILFROM
to:$MAILTO
subject: warning
 
$time MEM內存警告,當前內存佔用率爲$MEM %,大於$MEMTHRE %.
EOF
    fi
MB=`expr $MEMB \> $MEMTHRE`
if [ $MB -eq 1 ] ; then
sendmail -t <<EOF
from: $MAILFROM
to:$MAILTO
subject: warning
 
$time MEMB內存警告,當前內存佔用率爲$MEMB %,大於$MEMTHRE %
EOF
    fi

#流量監控部分
FLOWA=/tmp/.flow
ifconfig $ETHX |grep "RX byte" |awk '{print $2"    "$6}' |awk -Fbytes: '{print "INPUT  "$2"OUTPUT  "$3}'\ > $FLOWA
INPUTA=`cat $FLOWA |awk '{print $2}'`
OUTPUTA=`cat $FLOWA |awk '{print $4}'`
sleep 1
ifconfig $ETHX |grep "RX byte" |awk '{print $2"    "$6}' |awk -Fbytes: '{print "INPUT  "$2"OUTPUT  "$3}'\ > $FLOWA
INPUTB=`cat $FLOWA |awk '{print $2}'`
OUTPUTB=`cat $FLOWA |awk '{print $4}'`
INPUTC=`echo "$INPUTB-$INPUTA" | bc`
OUTPUTC=`echo "$OUTPUTB-$OUTPUTA"| bc`
INPUTMBA=`echo "$INPUTC/1024"|bc`
OUTPUTMBA=`echo "$OUTPUTC/1024"|bc`
INMBF=/tmp/.inputMB
OUTMBF=/tmp/.outputMB
echo `echo "scale=4;$INPUTMBA/1024"|bc`MB > $INMBF
echo `echo "scale=4;$OUTPUTMBA/1024"|bc`MB > $OUTMBF
INMB=`cat $INMBF |awk '{print $1}'`
OUTMB=`cat $OUTMBF |awk '{print $1}'`
  if [ $INPUTMBA -gt 1024 ] ; then
              if [ $INMB -gt $INFLOWTHREMB ] ;then
sendmail -t <<EOF
from: $MAILFROM
to:$MAILTO
subject: warning
$time 流量警告,當前流量異常,請登陸服務器查看。當前速率$INMB MB/秒,大於$INFLOWTHREMB MB/秒。
EOF
              fi
    if [ $OUTMB -gt $OUTFLOWTHREMB ] ;then
sendmail -t <<EOF
from: $MAILFROM
to:$MAILTO
subject: warning
$time 流量警告,當前流量異常,請登陸服務器查看。當前速率$OUTMB MB/秒 大於$OUTFLOWTHREMB MB/秒。
EOF
    fi
else
INKBF=/tmp/.inputKB
OUTKBF=/tmp/.outputKB
echo $INPUTMBA KB > $INKBF
echo $OUTPUTMBA KB > $OUTKBF
INKB=`cat $INKBF |awk '{print $1}'`
OUTKB=`cat $OUTKBF |awk '{print $1}'`
              if [ $INKB -gt $INFLOWTHREKB ] ; then
sendmail -t <<EOF
from: $MAILFROM
to:$MAILTO
subject: warning
$time 流量警告,當前流量異常,請登陸服務器查看。$INKB KB/秒 大於$INFLOWTHREKB KB/秒。
EOF
              fi
    if [ $OUTKB -gt $OUTFLOWTHREKB ] ;then
sendmail -t <<EOF
from: $MAILFROM
to:$MAILTO
subject: warning
$time 流量警告,當前流量異常,請登陸服務器查看。當前速率$OUTKB KB/秒大於$INFLOWTHREKB KB/秒。
EOF
    fi
fi
#鏈接數
tcpfile=/tmp/.tcp
netstat -n | awk '/^tcp/ {++S[$NF]} END {for(a in S) print a, S[a]}' >$tcpfile
grep TIME_WAIT $tcpfile > $NULL
if [ $? -eq 1 ] ; then
echo "TIME_WAIT 0 " >> $tcpfile
fi
grep FIN_WAIT1 $tcpfile > $NULL
if [ $? -eq 1 ] ; then
echo "FIN_WAIT1 0 " >> $tcpfile
fi
grep FIN_WAIT2 $tcpfile  > $NULL
if [ $? -eq 1 ] ; then
echo "FIN_WAIT2 0 " >> $tcpfile
fi
grep CLOSE_WAIT $tcpfile  > $NULL
if [ $? -eq 1 ] ; then
echo "CLOSE_WAIT 0 " >> $tcpfile
fi
grep LAST_ACK $tcpfile  > $NULL
if [ $? -eq 1 ] ; then
echo "LAST_ACK 0 " >> $tcpfile
fi
grep SYN_RECV $tcpfile  > $NULL
if [ $? -eq 1 ] ; then
echo "SYN_RECV 0 " >> $tcpfile
fi
grep CLOSING $tcpfile  > $NULL
if [ $? -eq 1 ] ; then
echo "CLOSING 0 " >> $tcpfile
fi
grep ESTABLISHED $tcpfile  > $NULL
if [ $? -eq 1 ] ; then
echo "ESTABLISHED 0 " >> $tcpfile
fi
 
TIME_WAITV=`grep TIME_WAIT $tcpfile | awk '{print $2}'`
FIN_WAIT1V=`grep FIN_WAIT1 $tcpfile | awk '{print $2}'`
FIN_WAIT2V=`grep FIN_WAIT2 $tcpfile | awk '{print $2}'`
ESTABLISHEDV=`grep ESTABLISHED $tcpfile | awk '{print $2}'`
SYN_RECVV=`grep SYN_RECV $tcpfile | awk '{print $2}'`
CLOSINGV=`grep CLOSING $tcpfile | awk '{print $2}'`
CLOSE_WAITV=`grep CLOSE_WAIT $tcpfile | awk '{print $2}'`
LAST_ACKV=`grep LAST_ACK $tcpfile | awk '{print $2}'`
  if [ $ESTABLISHEDV -gt $ESTABLISHED ] ; then
sendmail -t <<EOF
from: $MAILFROM
to:$MAILTO
subject: warning
$time 鏈接數警告,當前ESTABLISHED鏈接數異常,請登陸服務器查看。當前鏈接數爲$ESTABLISHEDV個,大於$ESTABLISHED個
EOF
  fi
  if [ $SYN_RECVV -gt $SYN_RECV ] ; then
sendmail -t <<EOF
from: $MAILFROM
to:$MAILTO
subject: warning
$time 鏈接數警告,當前SYN_RECV鏈接數異常,請登陸服務器查看。當前鏈接數爲$SYN_RECVV個,大於$SYN_REC個。
EOF
  fi
 if [ $CLOSE_WAITV -gt $CLOSE_WAIT ] ; then
sendmail -t <<EOF
from: $MAILFROM
to:$MAILTO
subject: warning
$time 鏈接數警告,當前CLOSE_WAIT鏈接數異常,請登陸服務器查看。當前鏈接數爲$CLOSE_WAITV個,大於$CLOSE_WAIT個。
EOF
  fi
  if [ $CLOSINGV -gt $CLOSING ] ; then
sendmail -t <<EOF
from: $MAILFROM
to:$MAILTO
subject: warning
$time 鏈接數警告,當前CLOSING鏈接數異常,請登陸服務器查看。當前鏈接數爲$CLOSINGV個,大於$CLOSING個。
EOF
  fi
  if [ $LAST_ACKV -gt $LAST_ACK ] ; then
sendmail -t <<EOF
from: $MAILFROM
to:$MAILTO
subject: warning
$time 鏈接數警告,當前LAST_ACK鏈接數異常,請登陸服務器查看。當前鏈接數爲$LAST_ACKV個,大於$LAST_ACK個。    
EOF
  fi
if [ $TIME_WAITV -gt $TIME_WAIT ] ; then
sendmail -t <<EOF
from: $MAILFROM
to:$MAILTO
subject: warning
$time 鏈接數警告,當前TIME_WAIT鏈接數異常,請登陸服務器查看。當前鏈接數爲$TIME_WAITV個,大於$TIME_WAIT個。    
EOF
  fi
if [ $FIN_WAIT1V -gt $FIN_WAIT1 ] ; then
sendmail -t <<EOF
from: $MAILFROM
to:$MAILTO
subject: warning
$time 鏈接數警告,當前FIN_WAIT1鏈接數異常,請登陸服務器查看。當前鏈接數爲$FIN_WAIT1V個,大於$FIN_WAIT1個。  
EOF
  fi
if [ $FIN_WAIT2V -gt $FIN_WAIT2 ] ; then
sendmail -t <<EOF
from: $MAILFROM
to:$MAILTO
subject: warning
$time 鏈接數警告,當前FIN_WAIT2鏈接數異常,請登陸服務器查看。當前鏈接數爲$FIN_WAIT2V個,大於$FIN_WAIT2個。
EOF
  fi
DISKF=/tmp/.disk
df -h > $DISKF
grep var $DISKF > $NULL
if [ $? -eq 1 ] ; then
echo "/dev/sda1 20G  1.6G   17G   0% /var" >> $DISKF
fi
grep usr $DISKF > $NULL
if [ $? -eq 1 ] ; then
echo "/dev/sda1 20G  1.6G   17G   0% /usr" >> $DISKF
fi
grep boot $DISKF > $NULL
if [ $? -eq 1 ] ; then
echo "/dev/sda1 20G  1.6G   17G   0% /boot" >> $DISKF
fi
BOOTV=`cat $DISKF | grep boot  | awk '{print $5}'|awk -F% '{print $1}'`
VARV=`cat  $DISKF  | grep var  | awk '{print $5}'|awk -F% '{print $1}'`
USRV=`cat  $DISKF  | grep usr  | awk '{print $5}'|awk -F% '{print $1}'`
grep VolGroup $DISKF > $NULL
if [ $? -eq 0 ] ;then
ROOTV=`cat $DISKF | sed -n '3p' |awk '{print $4}'|awk -F% '{print $1}'`
else
ROOTV=`cat $DISKF | sed -n '2p'|awk '{print $5}'|awk -F% '{print $1}'`
fi
if [ $ROOTV -gt $ROOT ] ; then
sendmail -t <<EOF
from: $MAILFROM
to:$MAILTO
subject: warning
$time 磁盤使用警告,您監控的 /  分區已經大於你設置的數值$ROOT %,詳情登錄系統查看,目前使用率爲$ROOTV %.
EOF
fi
if [ $VARV -gt $VAR ] ; then
sendmail -t <<EOF
from: $MAILFROM
to:$MAILTO
subject: warning
$time 磁盤使用警告,您監控的 /var 分區已經大於你設置的數值$VAR %,詳情登錄系統查看,目前使用率爲$VARV %.
EOF
fi
if [ $BOOTV -gt $BOOT ] ; then
sendmail -t <<EOF
from: $MAILFROM
to:$MAILTO
subject: warning
$time 磁盤使用警告,您監控的 /boot  分區已經大於你設置的數值 $BOOT %,詳情登錄系統查看,目前使用率爲$BOOTV %.
EOF
fi
if [ $USRV -gt $USR ] ; then
sendmail -t <<EOF
from: $MAILFROM
to:$MAILTO
subject: warning
$time 磁盤使用警告,您監控的 /usr  分區已經大於你設置的數值$USR %,詳情登錄系統查看,目前使用率爲$USRV %.
EOF
fi
#CPU
TotalA=`cat /proc/stat | sed -n '1p' | awk '{print $2+$3+$4+$5+$6+$7+$8}'`
IDLEA=`cat /proc/stat |sed -n '1p' |awk '{print $5}'`
sleep 2
TotalB=`cat /proc/stat | sed -n '1p' | awk '{print $2+$3+$4+$5+$6+$7+$8}'`
IDLEB=`cat /proc/stat |sed -n '1p' |awk '{print $5}'`
Total=`echo "$TotalB-$TotalA" |bc`
Idle=`echo "$IDLEB-$IDLEA" |bc`
USAGE=`echo "$Idle/$Total*100"|bc -l`
RATE=`echo "100-$USAGE "|bc -l`
USERATE=`echo "scale=2;$RATE/1"|bc`%
CA=`expr $USERATE \> $CPUTHRE`
if [ $CA -eq 1 ] ; then
sendmail -t <<EOF
from: $MAILFROM
to:$MAILTO
subject: warning
$time CPU使用警告,您監控的CPU使用率,已經超過您設置的限額$CPUTHRE % ,當前CPU使用率爲$USERATE .
EOF
fi
CPURATE=`top -b -n 1 |grep Cpu | awk '{print $5}' |awk -F%id '{print 100-$1}'`
CB=`expr $CPURATE \> $CPUTHRE`
if [ $CB -eq 1  ] ; then
sendmail -t <<EOF
from: $MAILFROM
to:$MAILTO
subject: warning
$time CPU使用警告,您監控的CPU使用率,已經超過您設置的限額$CPUTHRE %,當前CPU使用率爲$CPURATE .
EOF
fi
DBUGS=YES
if [ "$DBUGS" == "$DBUG" ] ; then
echo "           "'& 內  存 &' ;echo \ ;
echo "  "當前程序佔用內存爲 $MEMB % ,總佔用內存爲 $MEM % ; echo \ ;
echo "           "'& 流  量 &'; echo \ ;
YA=`wc -l $INMBF > /dev/null 2>&1 ; echo $?`
    if [ $YA -eq 1 ] ; then
echo 0 > $INMBF
    fi
IN=`expr $INMB \> $INFLOWTHREMB >$NULL; echo $? ` 2> $NULL
         if [ $IN -eq 1 ] ; then
echo "    "當前輸入流量爲 $INMB MB/秒 .;
echo "    "當前輸入流量爲 $INKB KB/秒 .;
          fi
YB=`wc -l $OUTMBF > /dev/null 2>&1 ; echo $?`
       if [ $YB -eq 1 ] ; then
echo 0 > $OUTMBF
        fi
OUT=`expr $OUTMB \> $OUTFLOWTHREMB >$NULL ; echo $?` 2> $NULL
    if [ $OUT -eq 1 ] ; then
echo "    "當前輸出流量爲 $OUTMB MB/秒。 ; 
echo "    "當前輸出流量爲 $OUTKB KB/秒。 ; echo \ ;
    fi
echo "           "'& 鏈接數 &' ; echo \ ;
echo "    "當前TIME_WAIT"  " 鏈接數爲 $TIME_WAITV 個。
echo "    "當前FIN_WAIT1"  " 鏈接數爲 $FIN_WAIT1V 個。
echo "    "當前FIN_WAIT2"  " 鏈接數爲 $FIN_WAIT2V 個。
echo "    "當前CLOSE_WAIT" " 鏈接數爲 $CLOSE_WAITV 個。
echo "    "當前ESTABLISHED"" 鏈接數爲 $ESTABLISHEDV 個。
echo "    "當前SYN_RECV"   " 鏈接數爲 $SYN_RECVV 個。
echo "    "當前LAST_ACKV"  " 鏈接數爲 $LAST_ACKV 個。
echo "    "當前CLOSING"    " 鏈接數爲 $CLOSINGV 個。; echo \ ;
echo "         "'& CPU使用率 &' ; echo \ ;
echo "    "當前CPU 進程使用率爲 $USERATE  . ;echo \ ;
echo "         "'& 磁盤使用率 &' ; echo \ ;
echo "    "當前"  "/"  "分區,"  "使用率爲 $ROOTV %.
echo "    "當前/var 分區, 使用率爲 $VARV %.
echo "    "當前/boot分區, 使用率爲 $BOOTV %.
echo "    "當前/usr 分區, 使用率爲 $USRV %.
exit
fi
sleep $RUNTIME
done
 
運行方法,在後臺運行。
[root@AR log]# ./monitor &
 
中止方法
[root@AR log]# ps -aux |grep monitor | grep -v grep | awk '{print $2}' | xargs kill -9
郵件效果截圖
 
 
 


打開DBUG後效果截圖,設置DBUG=YES時生效。
 
相關文章
相關標籤/搜索