mysql優化實戰(explain&&索引)

 

實驗環境:mysql

一、sql工具:Navicat 二、sql數據庫,使用openstack數據庫做爲示例


1、mysql索引查詢sql

show index from instances

\結果字段解釋: vcmRlcj0="1" cellpadding="2" cellspacing="0">數據庫

Table:數據庫表名 Non_unique:索引不能包括重複詞,則爲0。能夠,則爲1。 Key_name:索引的名稱。
索引中的列序列號,從1開始。 列名稱 列以什麼方式存儲在索引中。在MySQL中,有值‘A’(升序)或NULL(無分類)。 索引中惟一值的數目的估計值。經過運行ANALYZE TABLE或myisamchk -a能夠更新。基數根據被存儲爲整數的統計數據來計數,因此即便對於小型表,該值也沒有必要是精確的。基數越大,當進行聯合時,MySQL使用該索引的機 會就越大。 若是列只是被部分地編入索引,則爲被編入索引的字符的數目。若是整列被編入索引,則爲NULL。 指示關鍵字如何被壓縮。若是沒有被壓縮,則爲NULL。 若是列含有NULL,則爲YES。若是沒有,則該列爲NO。 用過的索引方法(BTREE, FULLTEXT, HASH, RTREE)。 Comment:註釋。



2、驗證Mysql的主鍵會自動建立索引? 建立一個沒有主鍵的ttx_index數據庫表:\查詢索引:\結果顯示沒有索引。 
改變ttx_index數據庫表字段id,將之設爲主鍵,再次查詢索引:\\
得出結論,在Mysql中,數據庫主鍵會自動創建索引。 

3、Mysql性能優化利器:explain 一、首先查看instances數據庫表的索引:\
二、EXPLAIN 用法詳解:性能優化

EXPLAIN SELECT * FROM instances

\\根據上述結果,能夠此查詢花了0.027ms,沒有可用的索引。 

explain字段詳解:工具

table:顯示這一行的數據是關於哪張表的性能

type:這是重要的列,顯示鏈接使用了何種類型。從最好到最差的鏈接類型爲const、eq_reg、ref、range、indexhe和ALLmysql索引

possible_keys:顯示可能應用在這張表中的索引。若是爲空,沒有可能的索引。能夠爲相關的域從WHERE語句中選擇一個合適的語句優化

key: 實際使用的索引。若是爲NULL,則沒有使用索引。不多的狀況下,MYSQL會選擇優化不足的索引。這種狀況下,能夠在SELECT語句中使用USE INDEX(indexname)來強制使用一個索引或者用IGNORE INDEX(indexname)來強制MYSQL忽略索引spa

key_len:使用的索引的長度。在不損失精確性的狀況下,長度越短越好指針

ref:顯示索引的哪一列被使用了,若是可能的話,是一個常數

rows:MYSQL認爲必須檢查的用來返回請求數據的行數

Extra:關於MYSQL如何解析查詢的額外信息。將在下表中討論,但這裏能夠看到的壞的例子是Using temporary和Using filesort,意思MYSQL根本不能使用索引,結果是檢索會很慢

 

extra列返回的描述的意義:

Distinct:一旦MYSQL找到了與行相聯合匹配的行,就再也不搜索了

Not exists: MYSQL優化了LEFT JOIN,一旦它找到了匹配LEFT JOIN標準的行,就再也不搜索了

Range checked for each Record(index map:#):沒有找到理想的索引,所以對於從前面表中來的每個行組合,MYSQL檢查使用哪一個索引,並用它來從表中返回行。這是使用索引的最慢的鏈接之一

Using filesort: 看到這個的時候,查詢就須要優化了。MYSQL須要進行額外的步驟來發現如何對返回的行排序。它根據鏈接類型以及存儲排序鍵值和匹配條件的所有行的行指針來排序所有行

Using index: 列數據是從僅僅使用了索引中的信息而沒有讀取實際的行動的表返回的,這發生在對錶的所有的請求列都是同一個索引的部分的時候

Using temporary 看到這個的時候,查詢須要優化了。這裏,MYSQL須要建立一個臨時表來存儲結果,這一般發生在對不一樣的列集進行ORDER BY上,而不是GROUP BY上

Where used 使用了WHERE從句來限制哪些行將與下一張表匹配或者是返回給用戶。若是不想返回表中的所有行,而且鏈接類型ALL或index,這就會發生,或者是查詢有問題不一樣鏈接類型的解釋(按照效率高低的順序排序)

system 表只有一行:system表。這是const鏈接類型的特殊狀況

const:表中的一個記錄的最大值可以匹配這個查詢(索引能夠是主鍵或唯一索引)。由於只有一行,這個值實際就是常數,由於MYSQL先讀這個值而後把它當作常數來對待

eq_ref:在鏈接中,MYSQL在查詢時,從前面的表中,對每個記錄的聯合都從表中讀取一個記錄,它在查詢使用了索引爲主鍵或唯一鍵的所有時使用

ref:這個鏈接類型只有在查詢使用了不是唯一或主鍵的鍵或者是這些類型的部分(好比,利用最左邊前綴)時發生。對於以前的表的每個行聯合,所有記錄都將從表中讀出。這個類型嚴重依賴於根據索引匹配的記錄多少—越少越好

range:這個鏈接類型使用索引返回一個範圍中的行,好比使用>或<查找東西時發生的狀況

index: 這個鏈接類型對前面的表中的每個記錄聯合進行徹底掃描(比ALL更好,由於索引通常小於表數據)

ALL:這個鏈接類型對於前面的每個記錄聯合進行徹底掃描,這通常比較糟糕,應該儘可能避免


那麼如何才能讓sql走索引查詢呢?

EXPLAIN SELECT * FROM instances WHERE id=1


\從上圖能夠,該sql語句走了索引。由於該表中id爲主鍵,mysql會自動建立索引,所以當將id做爲where條件查詢時,數據庫會自動走索引。 
接下來實驗,當不走索引仍是查詢id=1這條數據時候,會是如何?

SELECT id, display_name FROM instances WHERE id=1

\ 

EXPLAIN SELECT * FROM instances WHERE display_name = "vm1"



\

結論:在查詢時候,若是where條件中的字段有索引(走不走索引,取決於where條件中的字段),在執行sql語句時,mysql會自動走索引。 
可是有個問題是,在走不走索引,查詢花費時間都是0.001ms,彷佛沒有獲得性能提升?

SELECT COUNT(*) FROM instances

\ 
在數據庫表中instance數據總條數才74條,所以索引無法發揮它的性能優點,接下來人爲製造上w條數據:

insert instances(display_name) select display_name from instances

注:上述語句,可用來爲數據庫表指數形式插入新數據。\ 
再次查詢總條數:

SELECT COUNT(*) FROM instances

\ 
此次數據已經有接近500w了。 再次驗證上述索引性能問題: 
一、爲了對比的真實性,將id=1的數據記錄的display_name修改成惟一名字test_index_dispaly_name

SELECT id, display_name FROM instances WHERE id=1

\ 
二、不走索引查詢:

SELECT * FROM instances WHERE display_name = 'test_index_dispaly_name'

\ 
三、經過id走索引查詢:

SELECT * FROM instances WHERE id=1

\ 
結論:對於百萬上億級數據,走不走索引效率影響至關明顯(效率差異都到萬了)。 


四、哪些狀況sql不會走索引?

時間關係,此處暫且未總結,後續有時間補上。如有須要請自行網上查找。
相關文章
相關標籤/搜索