MySQL統計信息簡介

時間 2019-11-05

標籤 mysql 統計信息簡介欄目 MySQL 简体版

原文原文鏈接

做者：王小龍@網易樂得DBAmysql

原文地址：sql

http://mp.weixin.qq.com/s/698g5lm9CWqbU0B_p0nLMw數據庫

MySQL執行SQL會通過SQL解析和查詢優化的過程，解析器將SQL分解成數據結構並傳遞到後續步驟，查詢優化器發現執行SQL查詢的最佳方案、生成執行計劃。查詢優化器決定SQL如何執行，依賴於數據庫的統計信息，下面咱們介紹MySQL 5.7中innodb統計信息的相關內容。數據結構

MySQL統計信息的存儲分爲兩種，非持久化和持久化統計信息。測試

1、非持久化統計信息優化

非持久化統計信息存儲在內存裏，若是數據庫重啓，統計信息將丟失。有兩種方式能夠設置爲非持久化統計信息：ui

1 全局變量，spa

INNODB_STATS_PERSISTENT=OFFcode

2 CREATE/ALTER表的參數，索引

STATS_PERSISTENT=0

非持久化統計信息在如下狀況會被自動更新：

1 執行ANALYZE TABLE

2 innodb_stats_on_metadata=ON狀況下，執SHOW TABLE STATUS, SHOW INDEX, 查詢 INFORMATION_SCHEMA下的TABLES, STATISTICS

3 啓用--auto-rehash功能狀況下，使用mysql client登陸

4 表第一次被打開

5 距上一次更新統計信息，表1/16的數據被修改

非持久化統計信息的缺點顯而易見，數據庫重啓後若是大量表開始更新統計信息，會對實例形成很大影響，因此目前都會使用持久化統計信息。

2、持久化統計信息

5.6.6開始，MySQL默認使用了持久化統計信息，即INNODB_STATS_PERSISTENT=ON，持久化統計信息保存在表mysql.innodb_table_stats和mysql.innodb_index_stats。

持久化統計信息在如下狀況會被自動更新：

1 INNODB_STATS_AUTO_RECALC=ON

狀況下，表中10%的數據被修改

2 增長新的索引

innodb_table_stats是表的統計信息，innodb_index_stats是索引的統計信息，各字段含義以下：

innodb_table_stats
database_name	數據庫名
table_name	表名
last_update	統計信息最後一次更新時間
n_rows	表的行數
clustered_index_size	彙集索引的頁的數量
sum_of_other_index_sizes	其餘索引的頁的數量

innodb_index_stats
database_name	數據庫名
table_name	表名
index_name	索引名
last_update	統計信息最後一次更新時間
stat_name	統計信息名
stat_value	統計信息的值
sample_size	採樣大小
stat_description	類型說明

爲更好的理解innodb_index_stats，建一張測試表作說明：

CREATE TABLE t1 (
a INT, b INT, c INT, d INT, e INT, f INT,
PRIMARY KEY (a, b), KEY i1 (c, d), UNIQUE KEY i2uniq (e, f)
) ENGINE=INNODB;

寫入數據以下：

查看t1表的統計信息，需主要關注stat_name和stat_value字段

stat_name=size時：stat_value表示索引的頁的數量

stat_name=n_leaf_pages時：stat_value表示葉子節點的數量

stat_name=n_diff_pfxNN時：stat_value表示索引字段上惟一值的數量，此處作一下具體說明：

一、n_diff_pfx01表示索引第一列distinct以後的數量，如PRIMARY的a列，只有一個值1，因此index_name='PRIMARY'and stat_name='n_diff_pfx01'時，stat_value=1。

二、n_diff_pfx02表示索引前兩列distinct以後的數量，如i2uniq的e,f列，有4個值，因此index_name='i2uniq' and stat_name='n_diff_pfx02'時，stat_value=4。

三、對於非惟一索引，會在原有列以後加上主鍵索引，如index_name=’i1’ and stat_name=’n_diff_pfx03’，在原索引列c,d後加了主鍵列a，(c,d,a)的distinct結果爲2。

瞭解了stat_name和stat_value的具體含義，就能夠協助咱們排查SQL執行時爲何沒有使用合適的索引，例如某個索引n_diff_pfxNN的stat_value遠小於實際值，查詢優化器認爲該索引選擇度較差，就有可能致使使用錯誤的索引。

3、統計信息不許確的處理

咱們查看執行計劃，發現未使用正確的索引，若是是innodb_index_stats中統計信息差異較大引發，可經過如下方式處理：

一、手動更新統計信息，注意執行過程當中會加讀鎖：

ANALYZETABLE TABLE_NAME;

二、若是更新後統計信息仍不許確，可考慮增長表採樣的數據頁，兩種方式能夠修改：

a) 全局變量INNODB_STATS_PERSISTENT_SAMPLE_PAGES，默認爲20；

b) 單個表能夠指定該表的採樣：

ALTER TABLE TABLE_NAME STATS_SAMPLE_PAGES=40;

經測試，此處STATS_SAMPLE_PAGES的最大值是65535，超出會報錯。

目前MySQL並無提供直方圖的功能，某些狀況下（如數據分佈不均）僅僅更新統計信息不必定能獲得準確的執行計劃，只能經過index hint的方式指定索引。新版本8.0會增長直方圖功能，讓咱們期待MySQL愈來愈強大的功能吧

相關文章

相關標籤/搜索

極簡統計學

信息系統與信息化

瀏覽器信息

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。

最新文章

本站公眾號

歡迎關注本站公眾號,獲取更多信息

相關文章

>>更多相關文章<<