mysql索引是什麼？索引結構和使用詳解

時間 2019-12-05

標籤 mysql 索引什麼結構使用詳解欄目 MySQL 简体版

原文原文鏈接

索引是什麼

mysql索引: 是一種幫助mysql高效的獲取數據的數據結構，這些數據結構以某種方式引用數據，這種結構就是索引。可簡單理解爲排好序的快速查找數據結構。若是要查「mysql」這個單詞，咱們確定須要定位到m字母，而後從下往下找到y字母，再找到剩下的sql。mysql

索引分類

單值索引:一個索引包含1個列 create index idx_XX on table(f1) 一個表能夠建多個。惟一索引: 索引列的值必須惟一，但容許有空值 create unique index idx_XX on table(f1) 複合索引: 一個索引包含多個列如：create index idx_XX on table(f1,f2，..)算法

索引結構

BTree Hash索引 full-text全文索引sql

什麼狀況創建索引

主鍵自動創建惟一索引頻繁做爲查詢條件的字段因該建立索引查詢中與其餘表關聯的字段，外鍵關係創建索引頻繁更新的字段不適合創建索引 where條件裏用不到的字段不創建索引單鍵/複合索引的選擇（高併發下傾向複合）查詢中排序的字段因創建索引查詢中統計或分組字段數據庫

什麼狀況建不創建索引

頻繁增刪改的表表記錄太少數據重複且分佈平均的表字段。（重複太多索引意義不大）數據結構

比較兩種經常使用的索引BTree與Hash索引

BTree

一個經典的B+樹索引數據結構見下圖：併發

B+樹是一個平衡的多叉樹，從根節點到每一個葉子節點的高度差值不超過1，並且同層級的節點間有指針相互連接。在B+樹上的常規檢索，從根節點到葉子節點的搜索效率基本至關，不會出現大幅波動，並且基於索引的順序掃描時，也能夠利用雙向指針快速左右移動，效率很是高。高併發

所以，B+樹索引被普遍應用於數據庫、文件系統等場景。指針

Hash

而哈希索引的示意圖則是這樣的：blog

簡單地說，哈希索引就是採用必定的哈希算法，把鍵值換算成新的哈希值，檢索時不須要相似B+樹那樣從根節點到葉子節點逐級查找，只需一次哈希算法便可馬上定位到相應的位置，速度很是快。排序

因此

從上面的圖來看，B+樹索引和哈希索引的明顯區別是：

若是是等值查詢，那麼哈希索引明顯有絕對優點，由於只須要通過一次算法便可找到相應的鍵值；固然了，這個前提是，鍵值都是惟一的。若是鍵值不是惟一的，就須要先找到該鍵所在位置，而後再根據鏈表日後掃描，直到找到相應的數據；從示意圖中也能看到，若是是範圍查詢檢索，這時候哈希索引就毫無用武之地了，由於原先是有序的鍵值，通過哈希算法後，有可能變成不連續的了，就沒辦法再利用索引完成範圍查詢檢索；同理，哈希索引也沒辦法利用索引完成排序，以及like ‘xxx%’ 這樣的部分模糊查詢（這種部分模糊查詢，其實本質上也是範圍查詢）；哈希索引也不支持多列聯合索引的最左匹配規則； B+樹索引的關鍵字檢索效率比較平均，不像B樹那樣波動幅度大，在有大量重複鍵值狀況下，哈希索引的效率也是極低的，由於存在所謂的哈希碰撞問題。

在MySQL中，只有HEAP/MEMORY引擎表才能顯式支持哈希索引（NDB也支持，但這個不經常使用），InnoDB引擎的自適應哈希索引（adaptive hash index）不在此列，由於這不是建立索引時可指定的。

還須要注意到：HEAP/MEMORY引擎表在mysql實例重啓後，數據會丟失。

一般，B+樹索引結構適用於絕大多數場景，像下面這種場景用哈希索引才更有優點：

在HEAP表中，若是存儲的數據重複度很低（也就是說基數很大），對該列數據以等值查詢爲主，沒有範圍查詢、沒有排序的時候，特別適合採用哈希索引

例如這種SQL：

SELECT … FROM t WHERE C1 = ?; — 僅等值查詢

在大多數場景下，都會有範圍查詢、排序、分組等查詢特徵，用B+樹索引就能夠了。