本章博客咱們一塊兒來聊一聊如何監控mysql數據庫主從狀態?mysql
思路梳理:web
1)首先咱們都知道,判斷Mysql主從是否正常,是經過主從上面的SQL和IO線程都爲yes狀態判斷(經過awk取值,grep過濾和統計yes的個數,若是爲2則爲正常值),隨後咱們取值得腳本或者命令寫入zabbix-agent端的配置文件中的「Userparamenter」,格式 爲:Userparamenter [自定義 鍵值] ,[腳本或者命令參數]sql
2)咱們zabbix沒有監控主從的模板和監控項,因此咱們須要本身定義添加,建立監控項和圖形都是能夠的shell
3)建立完成以後,咱們能夠爲zabbix主從狀態定義監控報警數據庫
下面是主從以前的配置,在這裏就不在詳細的闡述了,若是主從不熟悉的童鞋能夠參考一下便可vim
mysql-master端: [root@mysql-master]# vim /etc/my.cnf server-id =1 log-bin=/var/lib/mysql/mysql-bin root@mysql-master # /etc/init.d/mysqld restart mysql> grant replication slave on *.* to 'xiaoyu'@'192.168.17.138' identified by '123.com'; Query OK, 0 rows affected (0.00 sec) mysql> flush privileges; mysql> show master status; +------------------+----------+--------------+------------------+ | File | Position | Binlog_Do_DB | Binlog_Ignore_DB | +------------------+----------+--------------+------------------+ | mysql-bin.000001 | 339 | | | +------------------+----------+--------------+------------------+ 1 row in set (0.00 sec) mysql-slave端 [root@mysql-slave]# vim /etc/my.cnf server-id =2 log-bin=/var/lib/mysql/mysql-bin [root@mysql-slave~]# /etc/init.d/mysqld restart mysql> slave stop; Query OK, 0 rows affected, 1 warning (0.00 sec) mysql> change master to -> master_host='192.168.17.129', -> master_user='xiaoyu', -> master_password='123.com', -> master_log_file='mysql-bin.000001', -> master_log_pos=339; Query OK, 0 rows affected (0.06 sec) mysql> slave start; Query OK, 0 rows affected (0.00 sec) mysql> show slave status\G *************************** 1. row *************************** Slave_IO_State: Waiting for master to send event Master_Host: 192.168.17.129 Master_User: xiaoyu Master_Port: 3306 Connect_Retry: 60 Master_Log_File: mysql-bin.000001 Read_Master_Log_Pos: 339 Relay_Log_File: mysqld-relay-bin.000002 Relay_Log_Pos: 251 Relay_Master_Log_File: mysql-bin.000001 Slave_IO_Running: Yes Slave_SQL_Running: Yes
一:首先在Mysql-slave端建立mysql主從項取值ide
2)#測試 經過grep過濾出關鍵詞"Running"狀態,awk打印出第二列的"Yes",最後由grep -c統計「Yes」的個數測試
[root@mysql-slave ~]# mysql -u root -p123456 -e "show slave status\G" | grep "Running" |awk "{print $2}" | grep -c "Yes"
2ui
2)將這條語句寫入agent.conf配置文件中spa
[root@mysql-slave ~]# vim /usr/local/zabbix/etc/zabbix_agentd.conf
UserParameter=mysql.replication,mysql -u root -p123456 -e "show slave status\G" | grep "Running" |awk '{print $2}' | grep -c "Yes"
[root@mysql-slave ~]# /etc/init.d/zabbix_agent restart
最後在zabbix-server端抓取mysql-slave端的數據
[root@zabbix-server ~]# /usr/local/zabbix/bin/zabbix_get -s 192.168.17.138 -k mysql.replication #抓取mysql-slave端的鍵值,若是返回數值2.則代表IO和SQL線程狀態都爲yes狀態,則代表主從正常
二:【Zabbix-server-web端配置】
2.1:建立一個監控項做爲mysql主從
2.2:建立mysql主從監控圖形
三:【建立觸發器,實現主從異常報警】
到目前爲止 ,咱們的mysql主從到主從郵件報警設置一條龍服務已經完成,接下來測試一下,臨時關閉mysql從的slave stop`
OK(ps:以前已經郵件服務報警此時,報警直接觸發)
【生產環境遇到的坑 】
當我在server端執行zabbix_get測試檢查是否獲取到key值,卻提示沒法經過套接字「/opt/mysql/data/mysql.sock」鏈接到本地MySQL服務
zabbix_get獲取agent自定義的key值和mysql.sock有什麼關係呢?難道在agent端不存在sock文件?答應確定是存在的,而且我測試了一下agent的普通key值system.uname,是正常獲取的,說明在通訊這一塊是沒問題的。
另外,咱們把焦點看下權限,這個數據庫受權獲取key值都是經過zabbix這個普通用戶的
咱們在看下agent段的zabbix用戶是存在的,只不過是被禁止shell登錄,這卻是不要緊
Ps:在這裏咱們給予zabbix登陸權限,切換到zabbix普通用戶,以普通zabbix用戶在本地執行/usr/bin/mysql -uzabbix -pzabbix -e "show slave status\G" | grep "Running" |awk '{print $2}' | grep -c "Yes",會發現也會報mysql.sock問題,可是以管理員的身份能正常獲取;
此時,咱們在zabbix.conf配置文件中作修改,也就是加上sudo 以普通用戶zabbix獲取key值數據
mysql.replication,sudo /usr/bin/mysql -uzabbix -pzabbix -e "show slave status\G" | grep "Running" |awk '{print $2}' | grep -c "Yes"
修改完成以後,再次執行zabbix_get,以前的錯誤沒有了,新問題有出現了,提示sudo: sorry, you must have a tty to run sudo
此時咱們只須要在agent端修改/etc/sudoers配置文件便可
1)Defaults requiretty,修改成 #Defaults requiretty,表示不須要控制終端。
2)容許zabbx普通用戶執行mysql命令調用key值
到此爲之結束!