太讚了！送你 6個 MySQL 必備錦囊妙計！

時間 2020-05-16

標籤 mysql 必備錦囊妙計欄目 MySQL 简体版

原文原文鏈接

做者：老張
原文：http://blog.51cto.com/sumongo...html

今兒給你們分享一篇，關於MySQL DBA必備工具的使用。能夠方便幫助咱們管理咱們的數據庫，讓咱們的工做更高效。node

這款工具是 MySQL 一個重要分支 percona 的，名稱叫作 percona-toolkit（一把鋒利的瑞士軍刀），它呢是一組命令的集合。今兒給你們介紹幾個咱們在生產環境中最長用到的。mysql

工具包的下載地址：https://www.percona.com/downl...sql

安裝過程很簡單，先解壓：
tar -zxvf percona-toolkit-3.0.3_x86_64.tar.gz
因爲是二進制的包，解壓完能夠直接進到percona-toolkit-3.0.3/bin目錄下使用。mongodb

錦囊妙計一：

pt-online-schema-change數據庫

功能能夠在線整理表結構，收集碎片，給大表添加字段和索引。避免出現鎖表致使阻塞讀寫的操做。針對 MySQL 5.7 版本，就能夠不須要使用這個命令，直接在線 online DDL 就能夠了。app

展示過程以下：
因爲是測試環境，就不建立一張數據量特大的表，主要讓你們理解這個過程。
這是表裏面數據的狀況和表結構工具

mysql> select count(*) from su;  
+----------+  
| count(*) |  
+----------+  
|   100000 |  
+----------+  
1 row in set (0.03 sec)  
mysql> desc su;  
+-------+------------------+------+-----+-------------------+-----------------------------+  
| Field | Type             | Null | Key | Default           | Extra                       |  
+-------+------------------+------+-----+-------------------+-----------------------------+  
| id    | int(10) unsigned | NO   | PRI | NULL              | auto_increment              |  
| c1    | int(11)          | NO   |     | 0                 |                             |  
| c2    | int(11)          | NO   |     | 0                 |                             |  
| c3    | int(11)          | NO   |     | 0                 |                             |  
| c4    | int(11)          | NO   |     | 0                 |                             |  
| c5    | timestamp        | NO   |     | CURRENT_TIMESTAMP | on update CURRENT_TIMESTAMP |  
| c6    | varchar(200)     | NO   |     |                   |                             |

在線增長字段的過程：性能

[root@node3 bin]# ./pt-online-schema-change --user=root --password=root123 
--host=localhost  --alter="ADD COLUMN city_id INT" D=test,t=su --execute
No slaves found.  See --recursion-method if host node3 has slaves.
Not checking slave lag because no slaves were found and --check-slave-lag was not specified.
Operation, tries, wait:  
  analyze_table, 10, 1  
  copy_rows, 10, 0.25  
  create_triggers, 10, 1  
  drop_triggers, 10, 1  
  swap_tables, 10, 1  
  update_foreign_keys, 10, 1
  
Altering `test`.`su`...
Creating new table...
Created new table test._su_new OK.
Altering new table...
Altered `test`.`_su_new` OK.
2017-08-10T14:53:59 Creating triggers...
2017-08-10T14:53:59 Created triggers OK.
2017-08-10T14:53:59 Copying approximately 100163 rows...
2017-08-10T14:54:00 Copied rows OK.
2017-08-10T14:54:00 Analyzing new table...
2017-08-10T14:54:00 Swapping tables...
2017-08-10T14:54:00 Swapped original and new tables OK.
2017-08-10T14:54:00 Dropping old table...
2017-08-10T14:54:00 Dropped old table `test`.`_su_old` OK.
2017-08-10T14:54:00 Dropping triggers...
2017-08-10T14:54:00 Dropped triggers OK.
Successfully altered `test`.`su`.

查看結果新增了一個 city_id 的字段：測試

mysql> desc su;
+---------+------------------+------+-----+-------------------+-----------------------------+
| Field   | Type             | Null | Key | Default           | Extra                       |
+---------+------------------+------+-----+-------------------+-----------------------------+
| id      | int(10) unsigned | NO   | PRI | NULL              | auto_increment              | 
| c1      | int(11)          | NO   |     | 0                 |                             | 
| c2      | int(11)          | NO   |     | 0                 |                             | 
| c3      | int(11)          | NO   |     | 0                 |                             | 
| c4      | int(11)          | NO   |     | 0                 |                             | 
| c5      | timestamp        | NO   |     | CURRENT_TIMESTAMP | on update CURRENT_TIMESTAMP | 
| c6      | varchar(200)     | NO   |     |                   |                             | 
| city_id | int(11)          | YES  |     | NULL              |                             | 
+---------+------------------+------+-----+-------------------+-----------------------------+

錦囊妙計二：

pt-query-digest

功能：如今捕獲線上TOP 10 慢 sql 語句。
你們都知道數據庫大多數的性能問題是 sql 語句形成的，因此咱們要抓住它們這些犯罪分子。及時作相關的優化處理。

展示過程以下：
能夠根據時間間隔，來採樣慢 sql 語句。since 是能夠調整的 sql 語句

[root@node3 bin]# ./pt-query-digest --since=24h /data/mysql/slow.log > 1.log

查看 sql 報告，總結慢語句有哪些，並能夠看針對時間的消耗。

以下只是部分報告過程

cat 1.log
# Profile
# Rank Query ID           Response time Calls R/Call  V/M   Item
# ==== ================== ============= ===== ======= ===== ==============
#    1 0x040ADBE3A1EED0A2 16.8901 87.2%     1 16.8901  0.00 CALL insert_su
#    2 0x8E44F4ED46297D4C  1.3013  6.7%     3  0.4338  0.18 INSERT SELECT test._su_new test.su
#    3 0x12E7CAFEA3145EEF  0.7431  3.8%     1  0.7431  0.00 DELETE su
# MISC 0xMISC              0.4434  2.3%     3  0.1478   0.0  <3ITEMS>
# Query 1: 0 QPS, 0x concurrency, ID 0x040ADBE3A1EED0A2 at byte 19060 ____
# Scores: V/M = 0.00
# Time range: all events occurred at 2017-08-02 12:12:07
# Attribute    pct   total     min     max     avg     95%  stddev  median
# ============ === ======= ======= ======= ======= ======= ======= =======
# Count          2       1
# Exec time     47     18s     18s     18s     18s     18s       0     18s
# Lock time      0   103us   103us   103us   103us   103us       0   103us
# Rows sent      0       0       0       0       0       0       0       0
# Rows examine   0       0       0       0       0       0       0       0
# Query size     0      21      21      21      21      21       0      21
# String:# Databases    test
# Hosts        localhost
# Users        root
# Query_time distribution
#   1us
#  10us
# 100us
#   1ms
#  10ms
# 100ms
#    1s
#  10s+ 
################################################################
call insert_su(50000)\G

能夠看到報告中，列舉出了一些sql語句響應時間佔比狀況，和sql語句的執行時間狀況。方便咱們能夠很直觀的觀察哪些語句有問題。（這裏只列舉了一條sql）

錦囊妙計三：

pt-heartbeat
功能監控主從延遲。監控從庫落後主庫大概多少時間。
環境介紹：192.168.56.132主庫，192.168.56.133從庫

操做以下：
在主庫上執行：

[root@node3 bin]# ./pt-heartbeat --database test --update 
--create-table --daemonize -uroot -proot123

test爲我監控同步的庫，在該庫下建立一張監控表heartbeat，後臺進程會時時更新這張表。

在從庫上執行監控主從同步延遲時間的語句：
master-server-id是主庫的server-id, -h（主庫ip）

[root@node4 bin]# ./pt-heartbeat --master-server-id=1323306
--monitor --database test  -uzs -p123456 -h 192.168.56.132
0.00s [  0.00s,  0.00s,  0.00s ]
0.00s [  0.00s,  0.00s,  0.00s ]
0.00s [  0.00s,  0.00s,  0.00s ]
0.00s [  0.00s,  0.00s,  0.00s ]
0.00s [  0.00s,  0.00s,  0.00s ]
0.00s [  0.00s,  0.00s,  0.00s ]

時間是0s，目前沒有延遲的出現。

錦囊妙計四：

pt-table-checksum
功能檢查主從複製一致性

原理：在主上執行檢查語句去檢查 mysql主從複製的一致性，生成 replace 語句，而後經過複製傳遞到從庫，再經過update 更新 master_src 的值。最後經過檢測從上 this_src 和 master_src 的
值從而判斷複製是否一致。

比較test庫的差別狀況，在主庫上面執行：

[root@node3 bin]# ./pt-table-checksum --no-check-binlog-format --nocheck-replication-filters 
--databases=test --replicate=test.checksums --host=192.168.56.132 -uzs -p123456            
                    TS ERRORS  DIFFS     ROWS  CHUNKS SKIPPED    TIME TABLE
08-10T16:01:02      0      0        1       1       0   0.013 test.heartbeat
08-10T16:01:02      0      0        0       1       0   0.015 test.su
08-10T16:01:02      0      0        0       1       0   0.011 test.t

可見diff都爲0，證實主從的test庫沒有差別狀況。

比較test庫哪些表有差別(須要添加replicate-check-only)，在主庫上面執行：

[root@node3 bin]# ./pt-table-checksum --no-check-binlog-format 
--nocheck-replication-filters --databases=test --replicate=test.checksums  
--replicate-check-only  --host=192.168.56.132 -uzs -p123456
Differences on node4
TABLE CHUNK CNT_DIFF CRC_DIFF CHUNK_INDEX LOWER_BOUNDARY UPPER_BOUNDARY
test.t 1 1 1

可見test庫下面t這張表主從數據不一致。

錦囊妙計五：

pt-slave-restart
功能：監控主從錯誤，並嘗試重啓MySQL主從
注意事項：跳過錯誤這個命令，解決從庫多數據的現象（錯誤代碼1062）。若是從庫少數據，還跳過錯誤，就不能從根兒上解決主從同步的問題了（錯誤代碼1032），就須要先找到缺乏的數據是什麼了，若是缺乏的特別多，建議從新搭建主從環境。

從庫出現1062的錯誤：

Slave_IO_Running: Yes
Slave_SQL_Running: No
Last_Errno: 1062
Last_Error: Could not execute Write_rows event on table test.t;
Duplicate entry '1' for key 'PRIMARY', Error_code: 1062; handler error HA_ERR_FOUND_DUPP_KEY; 
the event's master log mysql-bin.000006, end_log_pos 757482

須要在從庫上面執行：

[root@node4 bin]# ./pt-slave-restart -uroot -proot123 --error-numbers=1062
2017-08-10T16:28:12 p=...,u=root node4-relay-bin.000002      751437 1062

跳過錯誤以後，檢查主從結果：

Slave_IO_Running: Yes
Slave_SQL_Running: Yes

同步狀態又恢復一致了。

錦囊妙計六：

pt-ioprofile
功能：方便定位IO問題，可經過IO吞吐量來定位。

[root@node3 bin]# ./pt-ioprofile 
Thu Aug 10 16:33:47 CST 2017
Tracing process ID 3907     
total       read     pwrite      write      fsync filename 
13.949355   0.839006   0.000000   0.286556  12.823793 /data/mysql/mysql-bin.000006  
7.454844   0.000000   2.913702   0.000000   4.541142 /data/mysql/ib_logfile0  0.000193   
0.000000   0.000000   0.000193   0.000000 /data/mysql/slow.log

read：從文件中讀出數據。要讀取的文件用文件描述符標識，數據讀入一個事先定義好的緩衝區。
write：把緩衝區的數據寫入文件中。
pread：因爲lseek和read調用之間，內核可能會臨時掛起進程，因此對同步問題形成了問題，調用pread至關於順序調用了lseek和read，這兩個操做至關於一個捆綁的原子操做。
pwrite：因爲lseek和write調用之間，內核可能會臨時掛起進程，因此對同步問題形成了問題，
調用pwrite至關於順序調用了lseek 和write，這兩個操做至關於一個捆綁的原子操做。
fsync：確保文件全部已修改的內容已經正確同步到硬盤上，該調用會阻塞等待直到設備報告IO完成。
filename：與磁盤交互的文件名稱

經過這個報告咱們能夠看到，哪一個文件佔用IO的時間比較多，跟磁盤交互最爲繁忙，便於鎖定IO問題。

由於這個工具集命令不少，今兒先給你們介紹這些比較經常使用的，其餘的一些你們感興趣能夠私下去研究下。
官方地址：https://www.percona.com/doc/p...

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。