使用Python寫一個小小的項目監控

在公司裏作的一個接口系統,主要是對接第三方的系統接口,因此,這個系統裏會和不少其餘公司的項目交互。隨之而來一個很蛋疼的問題,這麼多公司的接口,不一樣公司接口的穩定性差異很大,訪問量大的時候,有的不怎麼行的接口就各類出錯了。
這個接口系統剛剛開發不久,整個系統中,處於比較邊緣的位置,不像其餘項目,有日誌庫,還有短信告警,一旦出問題,不少狀況下都是用戶反饋回來,因此,個人想法是,拿起python,爲這個項目寫一個監控。若是在調用某個第三方接口的過程當中,大量出錯了,說明這個接口有有問題了,就能夠更快的採起措施。
項目的也是有日誌庫的,全部的info,error日誌都是每隔一分鐘掃描入庫,日誌庫是用的mysql,表裏有幾個特別重要的字段:python

level 日誌級別
message 日誌內容
file_name Java代碼文件
log_time 日誌時間mysql

有日誌庫,就不用本身去線上環境掃日誌分析了,直接從日誌庫入手。因爲日誌庫在線上時每隔1分鐘掃,那我就去日誌庫每隔2分鐘掃一次,若是掃到有必定數量的error日誌就報警,若是隻有一兩條錯誤就能夠無視了,也就是短期爆發大量錯誤日誌,就能夠判定系統有問題了。報警方式就用發送郵件,因此,須要作下面幾件事情:
1. 操做MySql。
2. 發送郵件。
3. 定時任務。
4. 日誌。
5. 運行腳本。sql

明確了以上幾件事情,就能夠動手了。shell

操做數據庫

使用MySQLdb這個驅動,直接操做數據庫,主要就是查詢操做。
獲取數據庫的鏈接:數據庫

pythondef get_con():
    host = "127.0.0.1"
    port = 3306
    logsdb = "logsdb"
    user = "root"
    password = "never tell you"
    con = MySQLdb.connect(host=host, user=user, passwd=password, db=logsdb, port=port, charset="utf8")
    return con

從日誌庫裏獲取數據,獲取當前時間以前2分鐘的數據,首先,根據當前時間進行計算一下時間。以前,計算有問題,如今已經修改,謝謝一樓wade305朋友指正~小程序

pythondef calculate_time():

    now = time.mktime(datetime.now().timetuple())-60*2
    result = time.strftime('%Y-%m-%d %H:%M:%S', time.localtime(now))
    return result

而後,根據時間和日誌級別去日誌庫查詢數據centos

pythondef get_data():
    select_time = calculate_time()
    logger.info("select time:"+select_time)
    sql = "select file_name,message from logsdb.app_logs_record " \
          "where log_time >"+"'"+select_time+"'" \
          "and level="+"'ERROR'" \
          "order by log_time desc"
    conn = get_con()

    cursor = conn.cursor()
    cursor.execute(sql)
    results = cursor.fetchall()

    cursor.close()
    conn.close()

    return results

發送郵件

使用python發送郵件比較簡單,使用標準庫smtplib就能夠
這裏使用163郵箱進行發送,你可使用其餘郵箱或者企業郵箱都行,不過host和port要設置正確。bash

pythondef send_email(content):

    sender = "sender_monitor@163.com"
    receiver = ["rec01@163.com", "rec02@163.com"]
    host = 'smtp.163.com'
    port = 465
    msg = MIMEText(content)
    msg['From'] = "sender_monitor@163.com"
    msg['To'] = "rec01@163.com,rec02@163.com"
    msg['Subject'] = "system error warning"

    try:
        smtp = smtplib.SMTP_SSL(host, port)
        smtp.login(sender, '123456')
        smtp.sendmail(sender, receiver, msg.as_string())
        logger.info("send email success")
    except Exception, e:
        logger.error(e)

定時任務

使用一個單獨的線程,每2分鐘掃描一次,若是ERROR級別的日誌條數超過5條,就發郵件通知。服務器

pythondef task():
    while True:
        logger.info("monitor running")

        results = get_data()
        if results is not None and len(results) > 5:
            content = "recharge error:"
            logger.info("a lot of error,so send mail")
            for r in results:
                content += r[1]+'\n'
            send_email(content)
        sleep(2*60)

日誌

爲這個小小的腳本配置一下日誌log.py,讓日誌能夠輸出到文件和控制檯中。app

python# coding=utf-8
import logging

logger = logging.getLogger('mylogger')
logger.setLevel(logging.DEBUG)

fh = logging.FileHandler('monitor.log')
fh.setLevel(logging.INFO)

ch = logging.StreamHandler()
ch.setLevel(logging.INFO)

formatter = logging.Formatter('%(asctime)s - %(name)s - %(levelname)s - %(message)s')
fh.setFormatter(formatter)
ch.setFormatter(formatter)

logger.addHandler(fh)
logger.addHandler(ch)

因此,最後,這個監控小程序就是這樣的app_monitor.py

python# coding=utf-8
import threading
import MySQLdb
from datetime import datetime
import time
import smtplib
from email.mime.text import MIMEText
from log import logger


def get_con():
    host = "127.0.0.1"
    port = 3306
    logsdb = "logsdb"
    user = "root"
    password = "never tell you"
    con = MySQLdb.connect(host=host, user=user, passwd=password, db=logsdb, port=port, charset="utf8")
    return con


def calculate_time():

    now = time.mktime(datetime.now().timetuple())-60*2
    result = time.strftime('%Y-%m-%d %H:%M:%S', time.localtime(now))
    return result


def get_data():
    select_time = calculate_time()
    logger.info("select time:"+select_time)
    sql = "select file_name,message from logsdb.app_logs_record " \
          "where log_time >"+"'"+select_time+"'" \
          "and level="+"'ERROR'" \
          "order by log_time desc"
    conn = get_con()

    cursor = conn.cursor()
    cursor.execute(sql)
    results = cursor.fetchall()

    cursor.close()
    conn.close()

    return results


def send_email(content):

    sender = "sender_monitor@163.com"
    receiver = ["rec01@163.com", "rec02@163.com"]
    host = 'smtp.163.com'
    port = 465
    msg = MIMEText(content)
    msg['From'] = "sender_monitor@163.com"
    msg['To'] = "rec01@163.com,rec02@163.com"
    msg['Subject'] = "system error warning"

    try:
        smtp = smtplib.SMTP_SSL(host, port)
        smtp.login(sender, '123456')
        smtp.sendmail(sender, receiver, msg.as_string())
        logger.info("send email success")
    except Exception, e:
        logger.error(e)


def task():
    while True:
        logger.info("monitor running")
        results = get_data()
        if results is not None and len(results) > 5:
            content = "recharge error:"
            logger.info("a lot of error,so send mail")
            for r in results:
                content += r[1]+'\n'
            send_email(content)
        time.sleep(2*60)


def run_monitor():
    monitor = threading.Thread(target=task)
    monitor.start()


if __name__ == "__main__":
    run_monitor()

運行腳本

腳本在服務器上運行,使用supervisor進行管理。
在服務器(centos6)上安裝supervisor,而後在/etc/supervisor.conf中加入一下配置

bash[program:app-monitor]
command = python /root/monitor/app_monitor.py
directory = /root/monitor
user = root

而後在終端中運行supervisord啓動supervisor。
在終端中運行supervisorctl,進入shell,運行status查看腳本的運行狀態。

總結

這個小監控思路很清晰,還能夠繼續修改,好比:監控特定的接口,發送短信通知等等。 由於有日誌庫,就少了去線上正式環境掃描日誌的麻煩,因此,若是沒有日誌庫,就要本身上線上環境掃描,在正式線上環境必定要當心哇~

相關文章
相關標籤/搜索