20.16/20.17 shell中的函數
20.18 shell中的數組
20.19 告警系統需求分析
20.20 告警系統主腳本
20.21 告警系統配置文件
20.22 告警系統監控項目
20.23/20.24/20.25 告警系統郵件引擎
20.26 運行告警系統php
20.16/20.17 shell中的函數
python
數組容許將一列詞放到一個變量名中,如一列數、一列名稱或一列文件。mysql
語法格式linux
//declare明確聲明部分能夠省略
declare -a variable_name
variable = (item1 item2 item3 ...)
[root@localhost sh]# declare -a friends [root@localhost sh]# friends=(shery1 Peter Louise) [root@localhost sh]# echo ${friends[0]} shery1 [root@localhost sh]# echo ${friends[1]} Peter [root@localhost sh]# echo ${friends[2]} Louise
或者git
直接給變量名一個下標來建立sql
[root@localhost sh]# x[3]=100 [root@localhost sh]# echo ${x[*]} 100 [root@localhost sh]# echo ${x[0]} [root@localhost sh]# echo ${x[1]} [root@localhost sh]# echo ${x[3]} 100
調用數組 ${a[@]}或者${a[*]}shell
[root@localhost sh]# a=(1 2 3 4 5) [root@localhost sh]# echo ${a[*]} 1 2 3 4 5 [root@localhost sh]# echo ${a[@]} 1 2 3 4 5
查看對應下標的元素值 默認從0開始 ${a[下標]}vim
[root@localhost sh]# a=(1 2 3 4 5) [root@localhost sh]# echo ${a[0]} 1 [root@localhost sh]# echo ${a[1]} 2 [root@localhost sh]# echo ${a[2]} 3
獲取元素的個數數組
[root@localhost sh]# echo ${#a[@]} 5
添加/更新元素 a[下標]=值bash
[root@localhost sh]# a[1]=100 [root@localhost sh]# echo ${a[@]} 1 100 3 4 5
添加/更新元素 a[下標]=值
[root@localhost sh]# arr_tt=($(seq 1 10)) [root@localhost sh]# echo ${arr_tt[@]} 1 2 3 4 5 6 7 8 9 10 //從第5個元素開始取,取3個元素 [root@localhost sh]# echo ${arr_tt[@]:5:3} 6 7 8 //從倒數第9個元素開始取,取2個 [root@localhost sh]# echo ${arr_tt[@]:0-9:2} 2 3
數組替換 ${a[@]/用來的值/替換後的值}
[root@localhost sh]# echo ${arr_tt[@]/3/100} 1 2 100 4 5 6 7 8 9 10
20.19 告警系統需求分析
需求:使用shell定製各類個性化告警工具,但須要統一化管理、規範化管理。
思路:指定一個腳本包,包含主程序、子程序、配置文件、郵件引擎、輸出日誌等。
主程序:做爲整個腳本的入口,是整個系統的命脈。
配置文件:是一個控制中心,用它來開關各個子程序,指定各個相關聯的日誌文件。
子程序:這個纔是真正的監控腳本,用來監控各個指標。
郵件引擎:是由一個python程序來實現,它能夠定義發郵件的服務器、發郵件人以及發件人密碼
輸出日誌:整個監控系統要有日誌輸出
要求:咱們的機器角色多種多樣,可是全部機器上都要部署一樣的監控系統,也就說全部機器無論什麼角色,整個程序框架都是一致的,不一樣的地方在於根據不一樣的角色,定製不一樣的配置文件
程序架構:
bin下是主程序
conf下是配置文件
shares下是各個監控腳本
mail下是郵件引擎
log下是日誌。
20.20 告警系統主腳本
根據程序架構,建立相應的目錄結構
[root@localhost sh]# cd /usr/local/sbin/ [root@localhost sbin]# mkdir -p mon/{bin,conf,shares,mail,log} [root@localhost sbin]# tree . └── mon ├── bin ├── conf ├── log ├── mail └── shares 在/usr/local/sbin/ 目錄下存放監控腳本,方便查找腳本
在mon/bin下建立主程序
[root@localhost sbin]# vim mon/bin/mail.sh #!/bin/bash #export 表示該變量會應用到全部的子腳本中(主腳本所調用的腳本) #發送郵件的開關 export send=1 #發送郵件機器的ip地址 export addr=`/usr/sbin/ifconfig |grep -A1 "ens33" |tail -1 |awk '{print $2}'` #當前所在的路徑 dir=`pwd` #找出當前路徑的最後一個目錄 last_dir=`echo $dir |awk -F '/' '{print $NF}'` #下面的判斷目的是,保證執行腳本的時候,咱們在bin目錄裏,否則監控腳本、郵件和日誌頗有可能找不到 #由於他們使用的是相對路徑 if [ $last_dir == "bin" ] || [ $last_dir == "bin/" ] then #定義配置文件路徑 conf_file="../conf/mon.conf" else echo "Please cd bin dir" exit fi #定義正確和錯誤日誌的路徑 exec 1>>../log/mon.log 2>>../log/err.log #把下面內容輸入到日誌裏 echo "`date +"%F %T"` load average" #調用load.sh腳原本監控系統負載 /bin/bash ../shares/load.sh #先檢查配置文件中是否須要監控502 if grep -q 'to_mon_502=1' $conf_file then #定義網站的訪問日誌路徑 export log=`grep 'logfile=' $conf_file |awk -F '=' '{print $2}' |sed 's/ //g'` #調用502腳本 /bin/bash ../shares/502.sh fi ~ "mon/bin/mail.sh" [New] 35L, 1202C written [root@localhost sbin]# chmod +x mon/bin/mail.sh
20.21 告警系統配置文件
告警系統配置文件以下
## to config the options if to monitor ## 定義mysql的服務器地址、端口以及user、password to_mon_cdb=0 ##0 or 1, default 0,0 not monitor, 1 monitor db_ip=10.20.3.13 db_port=3315 db_user=username db_pass=passwd ## httpd 若是是1則監控,爲0不監控 to_mon_httpd=0 ## php 若是是1則監控,爲0不監控 to_mon_php_socket=0 ## http_code_502 須要定義訪問日誌的路徑 to_mon_502=1 logfile=/data/log/xxx.xxx.com/access.log ## request_count 定義日誌路徑以及域名 to_mon_request_count=0 req_log=/data/log/www.discuz.net/access.log domainname=www.discuz.net
20.22 告警系統監控項目
建立load.sh 監控系統負載腳本
[root@localhost sbin]# vim mon/shares/load.sh #! /bin/bash ##Writen by aming## #load=$(uptime |awk -F 'average:' '{print $2}'|cut -d',' -f1|sed 's/ //g' |cut -d. -f1) load=$(uptime | awk -F 'load average' '{print $2}' | awk -F'[: .]' '{print $3}') if [ $load -gt 10 ] && [ $send -eq "1" ] then echo "$addr $(date +%T) load is $load" >../log/load.tmp /bin/bash ../mail/mail.sh kennminn@139.com "${addr}_load:$load" $(cat ../log/load.tmp) fi echo "$(date +%T) load is $load"
建立502.sh 監控502腳本
[root@localhost sbin]# vim mon/shares/502.sh #! /bin/bash d=$(date -d "-1 min" +%H:%M) c_502=$(grep :$d: $log |grep ' 502 '|wc -l) if [ $c_502 -gt 10 ] && [ $send == 1 ]; then echo "$addr $d 502 count is $c_502">../log/502.tmp /bin/bash ../mail/mail.sh ${addr}_502 $c_502 ../log/502.tmp fi echo "$(date +%T) 502 $c_502"
建立disk.sh 監控磁盤使用率腳本
[root@localhost shares]# vim disk.sh #! /bin/bash ##Writen by aming## rm -f ../log/disk.tmp for r in $(df -h |awk -F '[ %]+' '{print $5}'|grep -v Use) do if [ $r -gt 90 ] && [ $send -eq "1" ] then echo "$addr $(date +%T) disk usage is $r" >>../log/disk.tmp fi done if [ -f ../log/disk.tmp ] then df -h >>../log/disk.tmp /bin/bash ../mail/mail.sh ${addr}_disk $r ../log/disk/disk.tmp echo "$(date +%T) disk usage is too high." else echo "$(date +%T) disk usage is ok" fi
20.23/20.24/20.25 告警系統郵件引擎
mail.py參考內容在 https://coding.net/u/aminglinux/p/aminglinux-book/git/blob/master/D22Z/mail.py
#!/usr/bin/env python #-*- coding: UTF-8 -*- import os,sys reload(sys) sys.setdefaultencoding('utf8') import getopt import smtplib from email.MIMEText import MIMEText from email.MIMEMultipart import MIMEMultipart from subprocess import * def sendqqmail(username,password,mailfrom,mailto,subject,content): gserver = 'smtp.qq.com' gport = 25 try: msg = MIMEText(unicode(content).encode('utf-8')) msg['from'] = mailfrom msg['to'] = mailto msg['Reply-To'] = mailfrom msg['Subject'] = subject smtp = smtplib.SMTP(gserver, gport) smtp.set_debuglevel(0) smtp.ehlo() smtp.login(username,password) smtp.sendmail(mailfrom, mailto, msg.as_string()) smtp.close() except Exception,err: print "Send mail failed. Error: %s" % err def main(): to=sys.argv[1] subject=sys.argv[2] content=sys.argv[3] ##定義QQ郵箱的帳號和密碼,你須要修改爲你本身的帳號和密碼(請不要把真實的用戶名和密碼放到網上公開,不然你會死的很慘) sendqqmail('1234567@qq.com','aaaaaaaaaa','1234567@qq.com',to,subject,content) if __name__ == "__main__": main() //腳本須要接收三個參數: 收件人,主題,內容 //用法 mail.py 收件人 主題 內容
建立mail.sh 調用發郵件和郵件收斂的腳本
[root@localhost sbin]# vim mon/mail/mail.sh log=$1 t_s=$(date +%s) t_s2=$(date -d "2 hours ago" +%s) if [ ! -f /tmp/$log ] then echo $t_s2 > /tmp/$log fi t_s2=$(tail -1 /tmp/$log | awk '{print $1}') echo $t_si >>/tmp/$log v=$[$t_s-$t_s2] echo $v if [ $v -gt 3600 ] then ./mail.py $1 $2 $3 echo "0" > /tmp/$log.txt else if [ ! -f /tmp/$log.txt ] then echo "0" > /tmp/$log.txt fi nu=$(cat /tmp/$log.txt) nu2=$((nu+1)) echo $nu2 >/tmp/$log.txt if [ $nu2 -gt 10 ] then ./mail.py $1 "trouble continue 10 min $2" "$3" echo "0" > /tmp/$log.txt fi fi //tmp/$log是計時器日誌 /tmp/$log.txt是計數器日誌 //第一次執行mail.sh t_s是當前時間戳 t_s2是兩個小時前的時間戳 判斷差值大於3600s 發郵件 並計數器爲0 //1分鐘後再次執行mail.sh t_s是當前時間戳 t_s2爲1分鐘前的時間戳判斷差值小於3600s 計數器爲1 //每分鐘都執行mail.sh 到了第11分鐘 由於 t_s和t_s2以前的差值都是小於3600s是不會發郵件的 當時 此時計數器爲11 大於10 就發一份「問題持續10分//鍾」的郵件 並計數器清零 //假如超多一個小時後再此執行mail.sh t_s和t_s2的時間戳 判斷差值大於3600s 就會發郵件並會清空原來的計數器
20.26 運行告警系統
爲了讓系統每分鐘都執行main.sh來監控,可以使用任務計劃
[root@localhost sbin]# crontab -e no crontab for root - using an empty one * * * * * cd /usr/local/sbin/mon/bin;bash main.sh