explain詳解與索引最佳實踐

使用EXPLAIN關鍵字能夠模擬優化器執行SQL語句,分析你的查詢語句或是結構的性能瓶頸;mysql

在 select 語句以前增長 explain 關鍵字,MySQL 會在查詢上設置一個標記,執行查詢會返回執行計劃的信息,而不是執行這條SQL;sql

注意:若是 from 中包含子查詢,仍會執行該子查詢,將結果放入臨時表中;session

咱們既然要學習 explain,那咱們就要建立一些表;函數

複製代碼
複製代碼
# 演員表
DROP TABLE IF EXISTS `actor`;
CREATE TABLE `actor` (
    `id` int(11) NOT NULL,
    `name` varchar(45) DEFAULT NULL,
    `update_time` datetime DEFAULT NULL,
    PRIMARY KEY (`id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8;
INSERT INTO `actor` (`id`, `name`, `update_time`) VALUES (1,'a','2017-12-2 15:27:18'), (2,'b','2017-12-22 15:27:18'), (3,'c','2017-12-22 15:27:18');

# 電影表
DROP TABLE IF EXISTS `film`;
CREATE TABLE `film` (
    `id` int(11) NOT NULL AUTO_INCREMENT,
    `name` varchar(10) DEFAULT NULL,
    PRIMARY KEY (`id`),
    KEY `idx_name` (`name`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8;
INSERT INTO `film` (`id`, `name`) VALUES (3,'film0'),(1,'film1'),(2,'film2');

# 演員和電影的關聯表
DROP TABLE IF EXISTS `film_actor`;
CREATE TABLE `film_actor` (
    `id` int(11) NOT NULL,
    `film_id` int(11) NOT NULL,
    `actor_id` int(11) NOT NULL,
    `remark` varchar(255) DEFAULT NULL,
    PRIMARY KEY (`id`),
    KEY `idx_film_actor_id` (`film_id`,`actor_id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8;
INSERT INTO `film_actor` (`id`, `film_id`, `actor_id`) VALUES (1,1,1),(2,1,2),(3,2,1);
複製代碼
複製代碼

explain 兩個變種 

 (1)explain extended:會在 explain 的基礎上額外提供一些查詢優化的信息。緊隨其後經過 show warnings 命令能夠獲得優化後的查詢語句,從而看出優化器優化了什麼。額外還有 filtered 列,是一個半分比的值,rows * filtered/100 能夠估算出將要和 explain 中前一個表進行鏈接的行數(前一個表指 explain 中的id值比當前表id值小的表)。性能

mysql> explain extended select * from film where id = 1;
mysql> show warnings;

 

 

 

 

 (2)explain partitions:相比 explain 多了個 partitions 字段,若是查詢是基於分區表的話,會顯示查詢將訪問的分區。mysql索引

explain 中的列

1
explain  select  from  actor;

以上的執行計劃結果:學習

 

 

 1. id 列

id 列的編號是 select 的序列號,有幾個 select 就有幾個id,而且 id 的出現順序是按 select 出現的順序增加的。優化

id 列越大執行優先級越高,id 相同則從上往下執行,id爲NULL最後執行。搜索引擎

2. select_type 列

select_type 表示對應行是簡單仍是複雜的查詢。簡單查詢只有 simple,複雜查詢有:primary,subquery,derived,union;url

(1)simple:簡單查詢。查詢不包含 子查詢 和 union;

mysql> explain select * from film where id = 2;

 

 

(2)primary:最外層的 select ;----複雜查詢
(3)subquery:包含在 select 中的子查詢(不在 from 子句中) -- 複雜查詢
(4)derived:包含在 from 子句中的子查詢。MySQL會將結果存放在一個臨時表中,也稱爲派生表(derived的英文含義) ; --複雜查詢
用下面的例子瞭解 primary、subquery 和 derived 類型: 


mysql> set session optimizer_switch='derived_merge=off'; #關閉mysql5.7新特性對衍生表的合併優化
mysql> explain select (select 1 from actor where id = 1) from (select * from film where id = 1) der;
mysql> set session optimizer_switch='derived_merge=on'; #還原默認配置

 

 

分析SQL的執行順序: 先執行 film 表的查詢 --> 再執行 actor 表的查詢 --> 最後再執行生成的臨時表查詢;

第1行( id 爲 1)的 select_type 爲 primary,表示的最外層的查詢;id 爲 1,是最小的,則最後執行;

第2行( id 爲 3)的 select_type 爲 derived,表示的 from 後面的子查詢,也叫派生表,別名爲 der 的派生表;id 爲 3,是最大的,則最早執行的;

第3行(id 爲 2)的 select_type 爲 subquery,表示的 from 前面的子查詢;id 爲 2,是中間的,則在中間執行;

(5)union:在 union 中的第二個和以後的 select 都爲 union;

mysql> explain select 1 union all select 1;

 

 

 3. table 列

 這一列表示 explain 的一行正在訪問哪一個表。

當 from 子句中有子查詢時,table列是 <derivenN> 格式,表示當前查詢依賴 id=N 的查詢,因而先執行 id=N 的查詢。

當有 union 時,UNION RESULT 的 table 列的值爲<union1,2>,1和2表示參與 union 的select 行 id。

NULL:mysql可以在優化階段分解查詢語句,在執行階段用不着再訪問表或索引。例如:在索引列中選取最小值,能夠單獨查找索引來完成,不須要在執行時訪問表

mysql> explain select min(id) from film;

 

 

4. type列

這一列表示關聯類型或訪問類型,即MySQL決定如何查找表中的行,查找數據行記錄的大概範圍。

依次從最優到最差分別爲:system > const > eq_ref > ref > range > index > ALL

通常來講,得保證查詢達到 range 級別,最好達到 ref

  (1)constsystem:mysql能對查詢的某部分進行優化並將其轉化成一個常量(能夠看show warnings 的結果)。 system = 1。

用於 primary key 或 unique key 的全部列與常數比較時,因此表最多有一個匹配行,讀取1次,速度比較快。system是const的特例,表裏只有一條數據匹配時爲 system;   (使用主鍵或者惟一索引的時候會出現)

mysql> set session optimizer_switch='derived_merge=off'; #關閉mysql5.7新特性對衍生表的合併優化
mysql> explain extended select * from (select * from film where id = 1) tmp;
mysql> set session optimizer_switch='derived_merge=on'; #還原默認配置

(2)eq_ref:primary key 或 unique key 索引的全部部分被鏈接使用 ,最多隻會返回一條符合條件的記錄。

這多是在 const 以外最好的聯接類型了,簡單的 select 查詢不會出現這種 type。

(在鏈接查詢的時候,使用了主鍵或惟一索引的所有字段)

mysql> explain select * from film_actor left join film on film_actor.film_id = film.id;

 

 

 說明:   film_id:表的聯合索引中的一個字段 ,可是 type 爲 All; 

 由於使用的 * 查詢的,指的要查詢全部的字段,可是 film_actor 表的 remark 字段沒有創建索引的,因此須要全表掃描;

 (3)ref:相比 eq_ref,不使用惟一索引,而是使用普通索引 或者 惟一性索引的部分前綴,索引要和某個值相比較,可能會找到多個符合條件的行;

(使用的普通索引 或 聯合惟一索引的部分前綴)

    <1> 簡單 select 查詢,name是普通索引(非惟一索引)

mysql> explain select * from film where name = 'film1';

     

 

 

    <2> 關聯表查詢,idx_film_actor_id 是 film_id 和 actor_id 的聯合索引,這裏使用到了film_actor的左邊前綴 film_id 部分。

mysql> explain select film_id from film left join film_actor on film.id = film_actor.film_id;

 

 

 (4)range:範圍掃描一般出如今  in(),  between ,  > ,   <,  >= 等操做中。使用一個索引來檢索給定範圍的行。 

mysql> explain select * from actor where id > 1;

 

 

 (5)index:掃描全表索引,一般比 All 快一些;

1
mysql> explain  select  from  film;

film 表的全部字段都創建了索引,使用 * 查詢,則 type 爲 index;

(6)ALL:即全表掃描,意味着mysql須要從頭至尾去查找所須要的行。一般狀況下這須要增長索引來進行優化了。

mysql> explain select * from actor;

 

 

5. possible_keys 列

這一列顯示查詢 可能 使用哪些 索引 來查找。
explain 時可能出現 possible_keys 有值,而 key 顯示 NULL 的狀況,這是由於表中數據很少,mysql認爲索引對此查詢幫助不大,選擇了全表查詢。
若是該列是NULL,則沒有相關的索引。在這種狀況下,能夠經過檢查 where 子句看是否能夠創造一個適當的索引來提升查詢性能,而後用 explain 查看效果。

6. key 列

這一列顯示mysql 實際 採用哪一個 索引 來優化對該表的訪問。
若是沒有使用索引,則該列是 NULL。若是想強制mysql使用或忽視 possible_keys 列中的索引,在查詢中使用 force index、ignore index。

1
mysql> explain  select  from  film  where  name  'film1' ;

 

 

 7. key_len列

這一列顯示了mysql 在索引裏使用的字節數,經過這個值能夠算出具體使用了索引中的哪些列。
舉例來講,film_actor的聯合索引 idx_film_actor_id 由 film_id 和 actor_id 兩個int列組成,而且每一個int是4字節。經過結果中的key_len=4可推斷出查詢使用了第一個列:film_id列來執行索引查找。

mysql> explain select * from film_actor where film_id = 2;

 

 

key_len計算規則以下

複製代碼
複製代碼
字符串 char(n):n字節長度
    varchar(n):2字節存儲字符串長度,若是是utf-8,則長度 3n + 2 數值類型 tinyint:1字節
    smallint:2字節
    int:4字節
    bigint:8字節
時間類型
    date:3字節
    timestamp:4字節
    datetime:8字節
複製代碼
複製代碼

注意若是字段容許爲 NULL,須要1字節記錄是否爲 NULL

索引最大長度是768字節,當字符串過長時,mysql會作一個相似左前綴索引的處理,將前半部分的字符提取出來作索引。

8. ref列

這一列顯示了在 key 列記錄的索引中,表查找值所用到的列或常量,常見的有:const(常量),字段名(例:film.id)。

9. rows列

這一列是mysql估計要讀取並檢測的行數,注意這個不是結果集裏的行數。掃描的索引可能的行數

10. Extra列

這一列展現的是額外信息。常見的重要值以下:

Using index >  Using index condition > Using where 

(1)Using index:使用覆蓋索引;覆蓋索引是select的數據列只用從索引中就可以取得,沒必要讀取數據行,換句話說查詢列要被所建的索引覆蓋。也就是查詢的結果集中的全部字段都是在索引中的;

mysql> explain select film_id from film_actor where film_id = 1;

 

 

 

 

(2)Using index condition:查詢的列不徹底被索引覆蓋,where條件中是一個聯合索引的前導列的範圍;

mysql> explain select * from film_actor where film_id > 1;

 

 

(3)Using where:使用 where 語句來處理結果,查詢的列未被索引覆蓋;在查找使用索引的狀況下,須要回表去查詢所需的數據

mysql> explain select * from actor where name = 'a';

 

 

(4)Using temporary:mysql須要建立一張臨時表來處理查詢。出現這種狀況通常是要進行優化的,首先是想到用索引來優化。

   <1>  actor.name沒有索引,此時建立了張臨時表來 distinct;(distinct 查詢可能會使用到臨時表)

mysql> explain select distinct name from actor;

   <2> film.name 創建了 idx_name 索引,此時查詢時 extra 是 using index, 沒有用臨時表;將索引樹加載到內存中,而後去重;

mysql> explain select distinct name from film;

 (5)Using filesort:將用外部排序而不是索引排序,數據較小時從內存排序,不然須要在磁盤完成排序。這種狀況下通常也是要考慮使用索引來優化的。

  <1> actor.name未建立索引,會瀏覽actor整個表,保存排序關鍵字name和對應的id,而後排序name並檢索行記錄

mysql> explain select * from actor order by name;

 

 

  <2> film.name創建了idx_name索引,此時查詢時extra是using index

mysql> explain select * from film order by name;

 

 

 (6)Select tables optimized away:使用某些聚合函數(好比 max、min)來訪問存在索引的某個字段;已經被 MySQL 優化過了;

mysql> explain select min(id) from film;

 

 

索引實踐

 示例表的建立

複製代碼
複製代碼
CREATE TABLE `employees` (
    `id` int(11) NOT NULL AUTO_INCREMENT,
    `name` varchar(24) NOT NULL DEFAULT '' COMMENT '姓名',
    `age` int(11) NOT NULL DEFAULT '0' COMMENT '年齡',
    `position` varchar(20) NOT NULL DEFAULT '' COMMENT '職位',
    `hire_time` timestamp NOT NULL DEFAULT CURRENT_TIMESTAMP COMMENT '入職時間',
    PRIMARY KEY (`id`),
    KEY `idx_name_age_position` (`name`,`age`,`position`) USING BTREE
) ENGINE=InnoDB AUTO_INCREMENT=4 DEFAULT CHARSET=utf8 COMMENT='員工記錄表';

INSERT INTO employees(name,age,position,hire_time) VALUES('LiLei',22,'manager',NOW());
INSERT INTO employees(name,age,position,hire_time) VALUES('HanMeimei',23,'dev',NOW());
INSERT INTO employees(name,age,position,hire_time) VALUES('Lucy',23,'dev',NOW());
複製代碼
複製代碼

一、全值匹配

EXPLAIN SELECT * FROM employees WHERE name= 'LiLei';

 

 

name 是 聯合索引 idx_name_age_position 的前導字段; 

 key_len 爲 74,name爲 varchar(24),則 3 * 24 + 2 = 74,因此使用聯合索引中的 name 字段走的索引;

EXPLAIN SELECT * FROM employees WHERE name= 'LiLei' AND age = 22;

 

 

 name,age 是聯合索引 idx_name_age_position 的字段; 

 key_len 爲 78,name爲 varchar(24),則 3 * 24 + 2 = 74;age 爲 int ,因此值爲4 ; 74 + 4 = 78,因此使用聯合索引中的 name,age 字段走的索引;

EXPLAIN SELECT * FROM employees WHERE name= 'LiLei' AND age = 22 AND position ='manager';

 

  name,age,position 是聯合索引 idx_name_age_position 的字段; 

 

 

 key_len 爲 140,name爲 varchar(24) 類型,則 3 * 24 + 2 = 74;age 爲 int 類型,因此值爲4;position 爲 varchaer(20),因此值爲 3 * 20 + 2 = 62; 74 + 4 + 62 = 140,因此使用聯合索引中的 name,age,position 字段走的索引;

 2.最左前綴法則

 若是創建了聯合索引,要遵照最左前綴法則。指的是查詢從聯合索引的最左前列開始而且不跳過索引中的列。 

(1)使用了聯合索引的前兩個字段查詢;

EXPLAIN SELECT * FROM employees WHERE name = 'LiLei' and age = 22; #name,age 都走了索引

 

 

 key_len 爲 78,(3 * 24 + 2) + 4 = 78;走了 name 和 age 索引;

 (2)使用聯合索引的第1, 3 字段查詢

EXPLAIN SELECT * FROM employees WHERE name = 'LiLei' and position ='manager'; #只有 name 走了索引

 

 

 key_len 爲 74,name 的 長恰好爲 74,因此只有 name 走了索引;

分析:聯合索引的底層存儲是 先比較最前面的字段,最前面的字段同樣則比較第2個字段,第2個同樣纔去比較第3個字段;第1個字段 name 去比較了,能夠搜索到一部分, position 爲 聯合索引的第3個字段,可是索引在存儲和查找時候不可能跳過第2個字段直接去比較第3個字段的,position 字段仍是要列出大範圍的數據作查詢,所以 name 走了索引,position 沒有走索引。

3. 不在索引列上作任何操做(計算、函數、(自動or手動)類型轉換),會致使索引失效而轉向全表掃描

(1)不給索引列進行函數操做

EXPLAIN SELECT * FROM employees WHERE left(name,3) = 'LiLei';

 

 

通常來講,只要給索引列增長了函數操做,MySQL的底層直接就不會使用索引去處理的。

(2)給 hire_time 增長一個普通索引:

ALTER TABLE `employees`
ADD INDEX `idx_hire_time` (`hire_time`) USING BTREE ;
EXPLAIN select * from employees where date(hire_time) ='2018-09-30'; #不會走索引

 針對以上的SQL,轉化爲日期範圍查詢,就會走索引

EXPLAIN select * from employees where hire_time >='2018-09-30 00:00:00' and hire_time <='2018-09-30 23:59:59';

 還原最初索引狀態

ALTER TABLE `employees`
DROP INDEX `idx_hire_time`;

4.存儲引擎不能使用索引中範圍查找條件右邊的列  

聯合索引的字段順序,範圍查找以後的列都不會去走索引;

EXPLAIN SELECT * FROM employees WHERE name= 'LiLei' AND age = 22 AND position ='manager'; #3個字段索引都會走
EXPLAIN SELECT * FROM employees WHERE name= 'LiLei' AND age > 22 AND position ='manager';

 

 

 只會走前兩個字段的索引。 第一個字段 name 使用的相等,因此能夠找到具體的數據,第2個字段會縮小到一個範圍,第3個字段是在這個範圍裏作相等的查詢,仍是會要將這個範圍去遍歷一遍的,因此只有 name,age 走了索引。

5.儘可能使用覆蓋索引(只訪問索引的查詢(索引列包含查詢列)),減小select *語句  

EXPLAIN SELECT name,age FROM employees WHERE name= 'LiLei' AND age = 23 AND position ='manager';

 

 

EXPLAIN SELECT * FROM employees WHERE name= 'LiLei' AND age = 23 AND position ='manager';

 

 

 6. mysql在使用不等於(!=或者<>)的時候沒法使用索引會致使全表掃描

EXPLAIN SELECT * FROM employees WHERE name != 'LiLei';

 7. is null, is not null 也沒法使用索引

建議在創建字段的時候都設置爲 not null,設置一個默認的值;

EXPLAIN SELECT * FROM employees WHERE name is null

 8. like以通配符開頭('$abc...')mysql索引失效會變成全表掃描操做

EXPLAIN SELECT * FROM employees WHERE name like '%Lei'

EXPLAIN SELECT * FROM employees WHERE name like 'Lei%'

模糊查找的時候,前模糊不走索引,後模糊會走索引;

由於在後模糊的時候,咱們知道了這個字段的前面有幾個字符,咱們在索引中比較的只去比較前面的幾個字符就行了;

問題:解決like '%字符串%'索引不被使用的方法?  

(a)使用覆蓋索引,查詢字段必須是創建覆蓋索引字段  

EXPLAIN SELECT name,age,position FROM employees WHERE name like '%Lei%';

 (b)若是不能使用覆蓋索引則可能須要藉助搜索引擎

9. 字符串不加單引號索引失效  

EXPLAIN SELECT * FROM employees WHERE name = '1000'; #會走索引
EXPLAIN SELECT * FROM employees WHERE name = 1000;   #不會走索引

 由於 name 爲字符串類型,MySql 會作隱式的類型轉換,作了類型的轉換,因此不會去走索引;

10.少用or或in,用它查詢時,mysql不必定使用索引,mysql內部優化器會根據檢索比例、表大小等多個因素總體評估是否使用索引,詳見範圍查詢優化

EXPLAIN SELECT * FROM employees WHERE name = 'LiLei' or name = 'HanMeimei';

 11.範圍查詢優化

給年齡添加單值索引 : ALTER TABLE `employees` ADD INDEX `idx_age` (`age`) USING BTREE ;

explain select * from employees where age >=1 and age <=2000;

從執行計劃的結果能夠看出,以上的範圍查找不會走索引;

沒走索引緣由:mysql內部優化器會根據檢索比例、表大小等多個因素總體評估是否使用索引。好比這個例子,多是因爲單次數據量查詢過大致使優化器最終選擇不走索引

優化方法:能夠將大的範圍拆分紅多個小範圍

explain select * from employees where age >=1 and age <=1000;
explain select * from employees where age >=1001 and age <=2000;

 還原最初索引狀態:ALTER TABLE `employees` DROP INDEX `idx_age`;

索引使用總結(通常狀況下)

創建了一個聯合索引: (a, b,c)

 like KK%至關於常量,因此走索引;%KK和%KK% 至關於範圍,因此不走索引;

沒走索引緣由:mysql內部優化器會根據檢索比例、表大小等多個因素總體評估是否使用索引。好比這個例子,多是因爲單次數據量查詢過大致使優化器最終選擇不走索引優化方法:能夠講大的範圍拆分紅多個小範圍。

使用覆蓋索引的時候就會出現

相關文章
相關標籤/搜索