MySQL統計信息簡介

做者:王小龍@網易樂得DBAmysql

原文地址:sql

http://mp.weixin.qq.com/s/698g5lm9CWqbU0B_p0nLMw數據庫

MySQL執行SQL會通過SQL解析和查詢優化的過程,解析器將SQL分解成數據結構並傳遞到後續步驟,查詢優化器發現執行SQL查詢的最佳方案、生成執行計劃。查詢優化器決定SQL如何執行,依賴於數據庫的統計信息,下面咱們介紹MySQL 5.7中innodb統計信息的相關內容。數據結構

MySQL統計信息的存儲分爲兩種,非持久化和持久化統計信息。測試

1、非持久化統計信息優化

非持久化統計信息存儲在內存裏,若是數據庫重啓,統計信息將丟失。有兩種方式能夠設置爲非持久化統計信息:ui

1 全局變量,spa

INNODB_STATS_PERSISTENT=OFFcode

2 CREATE/ALTER表的參數,索引

STATS_PERSISTENT=0

非持久化統計信息在如下狀況會被自動更新:

1 執行ANALYZE TABLE

2 innodb_stats_on_metadata=ON狀況下,執SHOW TABLE STATUS, SHOW INDEX, 查詢 INFORMATION_SCHEMA下的TABLES, STATISTICS

3 啓用--auto-rehash功能狀況下,使用mysql client登陸

4 表第一次被打開

5 距上一次更新統計信息,表1/16的數據被修改

非持久化統計信息的缺點顯而易見,數據庫重啓後若是大量表開始更新統計信息,會對實例形成很大影響,因此目前都會使用持久化統計信息。

2、持久化統計信息

5.6.6開始,MySQL默認使用了持久化統計信息,即INNODB_STATS_PERSISTENT=ON,持久化統計信息保存在表mysql.innodb_table_statsmysql.innodb_index_stats

 持久化統計信息在如下狀況會被自動更新:

1 INNODB_STATS_AUTO_RECALC=ON

狀況下,表中10%的數據被修改

2 增長新的索引 

innodb_table_stats是表的統計信息,innodb_index_stats是索引的統計信息,各字段含義以下:

innodb_table_stats

database_name

數據庫名

table_name

表名

last_update

統計信息最後一次更新時間

n_rows

表的行數

clustered_index_size

彙集索引的頁的數量

sum_of_other_index_sizes

其餘索引的頁的數量

 

innodb_index_stats

database_name

數據庫名

table_name

表名

index_name

索引名

last_update

統計信息最後一次更新時間

stat_name

統計信息名

stat_value

統計信息的值

sample_size

採樣大小

stat_description

類型說明

爲更好的理解innodb_index_stats,建一張測試表作說明:

  1.  
    CREATE TABLE t1 (
  2.  
     
  3.  
     a INT, b INT, c INT, d INT, e INT, f INT,
  4.  
     
  5.  
    PRIMARY KEY (a, b), KEY i1 (c, d), UNIQUE KEY i2uniq (e, f)
  6.  
     
  7.  
    ) ENGINE=INNODB;

寫入數據以下:

0?wx_fmt=png

查看t1表的統計信息,需主要關注stat_namestat_value字段

0?wx_fmt=png

stat_name=size時:stat_value表示索引的頁的數量

stat_name=n_leaf_pages時:stat_value表示葉子節點的數量

stat_name=n_diff_pfxNN時:stat_value表示索引字段上惟一值的數量,此處作一下具體說明:

一、n_diff_pfx01表示索引第一列distinct以後的數量,如PRIMARY的a列,只有一個值1,因此index_name='PRIMARY'and stat_name='n_diff_pfx01'時,stat_value=1

二、n_diff_pfx02表示索引前兩列distinct以後的數量,如i2uniqe,f列,有4個值,因此index_name='i2uniq' and stat_name='n_diff_pfx02'時,stat_value=4

三、對於非惟一索引,會在原有列以後加上主鍵索引,如index_name=’i1’ and stat_name=’n_diff_pfx03’,在原索引列c,d後加了主鍵列a,(c,d,a)distinct結果爲2。

瞭解了stat_namestat_value的具體含義,就能夠協助咱們排查SQL執行時爲何沒有使用合適的索引,例如某個索引n_diff_pfxNNstat_value遠小於實際值,查詢優化器認爲該索引選擇度較差,就有可能致使使用錯誤的索引。

3、統計信息不許確的處理

咱們查看執行計劃,發現未使用正確的索引,若是是innodb_index_stats中統計信息差異較大引發,可經過如下方式處理:

一、手動更新統計信息,注意執行過程當中會加讀鎖:

ANALYZETABLE TABLE_NAME;

二、若是更新後統計信息仍不許確,可考慮增長表採樣的數據頁,兩種方式能夠修改:

a) 全局變量INNODB_STATS_PERSISTENT_SAMPLE_PAGES,默認爲20;

b) 單個表能夠指定該表的採樣:

ALTER TABLE TABLE_NAME STATS_SAMPLE_PAGES=40;

經測試,此處STATS_SAMPLE_PAGES的最大值是65535,超出會報錯。

目前MySQL並無提供直方圖的功能,某些狀況下(如數據分佈不均)僅僅更新統計信息不必定能獲得準確的執行計劃,只能經過index hint的方式指定索引。新版本8.0會增長直方圖功能,讓咱們期待MySQL愈來愈強大的功能吧

相關文章
相關標籤/搜索