Mysql 索引-2

關於MySQL索引的好處，若是正確合理設計而且使用索引的MySQL是一輛蘭博基尼的話，那麼沒有設計和使用索引的MySQL就是一我的力三輪車。對於沒有索引的表，單表查詢可能幾十萬數據就是瓶頸，而一般大型網站單日就可能會產生幾十萬甚至幾百萬的數據，沒有索引查詢會變的很是緩慢。仍是以WordPress來講，其多個數據表都會對常常被查詢的字段添加索引，好比wp_comments表中針對5個字段設計了BTREE索引。前端

一個簡單的對比測試

以我去年測試的數據做爲一個簡單示例，20多條數據源隨機生成200萬條數據，平均每條數據源都重複大概10萬次，表結構比較簡單，僅包含一個自增ID，一個char類型，一個text類型和一個int類型，單表2G大小，使用MyIASM引擎。開始測試未添加任何索引。mysql

執行下面的SQL語句：sql

 
      1 
      mysql> SELECT id,FROM_UNIXTIME(time) FROM article WHERE a.title='測試標題'

查詢須要的時間很是恐怖的，若是加上聯合查詢和其餘一些約束條件，數據庫會瘋狂的消耗內存，而且會影響前端程序的執行。這時給title字段添加一個BTREE索引：數據庫

 
      1 
      mysql> ALTER TABLE article ADD INDEX index_article_title ON title(200);

再次執行上述查詢語句，其對比很是明顯：數據庫設計

MySQL索引的概念

索引是一種特殊的文件(InnoDB數據表上的索引是表空間的一個組成部分)，它們包含着對數據表裏全部記錄的引用指針。更通俗的說，數據庫索引比如是一本書前面的目錄，能加快數據庫的查詢速度。上述SQL語句，在沒有索引的狀況下，數據庫會遍歷所有200條數據後選擇符合條件的；而有了相應的索引以後，數據庫會直接在索引中查找符合條件的選項。若是咱們把SQL語句換成「SELECT * FROM article WHERE id=2000000」，那麼你是但願數據庫按照順序讀取完200萬行數據之後給你結果仍是直接在索引中定位呢？上面的兩個圖片鮮明的用時對比已經給出了答案（注：通常數據庫默認都會爲主鍵生成索引）。oop

索引分爲聚簇索引和非聚簇索引兩種，聚簇索引是按照數據存放的物理位置爲順序的，而非聚簇索引就不同了；聚簇索引能提升多行檢索的速度，而非聚簇索引對於單行的檢索很快。性能

MySQL索引的優化

上面都在說使用索引的好處，但過多的使用索引將會形成濫用。所以索引也會有它的缺點：雖然索引大大提升了查詢速度，同時卻會下降更新表的速度，如對錶進行INSERT、UPDATE和DELETE。由於更新表時，MySQL不只要保存數據，還要保存一下索引文件。創建索引會佔用磁盤空間的索引文件。通常狀況這個問題不太嚴重，但若是你在一個大表上建立了多種組合索引，索引文件的會膨脹很快。索引只是提升效率的一個因素，若是你的MySQL有大數據量的表，就須要花時間研究創建最優秀的索引，或優化查詢語句。下面是一些總結以及收藏的MySQL索引的注意事項和優化方法。測試

1. 什麼時候使用匯集索引或非彙集索引？大數據

動做描述	使用匯集索引	使用非彙集索引
列常常被分組排序	使用	使用
返回某範圍內的數據	使用	不使用
一個或極少不一樣值	不使用	不使用
小數目的不一樣值	使用	不使用
大數目的不一樣值	不使用	使用
頻繁更新的列	不使用	使用
外鍵列	使用	使用
主鍵列	使用	使用
頻繁修改索引列	不使用	使用

事實上，咱們能夠經過前面彙集索引和非彙集索引的定義的例子來理解上表。如：返回某範圍內的數據一項。好比您的某個表有一個時間列，剛好您把聚合索引創建在了該列，這時您查詢2004年1月1日至2004年10月1日之間的所有數據時，這個速度就將是很快的，由於您的這本字典正文是按日期進行排序的，聚類索引只須要找到要檢索的全部數據中的開頭和結尾數據便可；而不像非彙集索引，必須先查到目錄中查到每一項數據對應的頁碼，而後再根據頁碼查到具體內容。其實這個具體用法我還不是很理解，只能等待後期的項目開發中慢慢學學了。優化

2. 索引不會包含有NULL值的列

只要列中包含有NULL值都將不會被包含在索引中，複合索引中只要有一列含有NULL值，那麼這一列對於此複合索引就是無效的。因此咱們在數據庫設計時不要讓字段的默認值爲NULL。

3. 使用短索引

對串列進行索引，若是可能應該指定一個前綴長度。例如，若是有一個CHAR(255)的列，若是在前10個或20個字符內，多數值是唯一的，那麼就不要對整個列進行索引。短索引不只能夠提升查詢速度並且能夠節省磁盤空間和I/O操做。

4. 索引列排序

MySQL查詢只使用一個索引，所以若是where子句中已經使用了索引的話，那麼order by中的列是不會使用索引的。所以數據庫默認排序能夠符合要求的狀況下不要使用排序操做；儘可能不要包含多個列的排序，若是須要最好給這些列建立複合索引。

5. like語句操做

通常狀況下不鼓勵使用like操做，若是非使用不可，如何使用也是一個問題。like 「%aaa%」不會使用索引而like 「aaa%」可使用索引。

6. 不要在列上進行運算

例如：select * from users where YEAR(adddate)<2007，將在每一個行上進行運算，這將致使索引失效而進行全表掃描，所以咱們能夠改爲：select * from users where adddate<’2007-01-01′。關於這一點能夠圍觀：一個單引號引起的MYSQL性能損失。

最後總結一下，MySQL只對一下操做符才使用索引：<,<=,=,>,>=,between,in,以及某些時候的like(不以通配符%或_開頭的情形)。而理論上每張表裏面最多可建立16個索引，不過除非是數據量真的不少，不然過多的使用索引也不是那麼好玩的，好比我剛纔針對text類型的字段建立索引的時候，系統差點就卡死了。