mysql索引是什麼?索引結構和使用詳解

索引是什麼

mysql索引: 是一種幫助mysql高效的獲取數據的數據結構,這些數據結構以某種方式引用數據,這種結構就是索引。可簡單理解爲排好序的快速查找數據結構。若是要查「mysql」這個單詞,咱們確定須要定位到m字母,而後從下往下找到y字母,再找到剩下的sql。mysql

索引分類

單值索引:一個索引包含1個列 create index idx_XX on table(f1) 一個表能夠建多個。 惟一索引: 索引列的值必須惟一,但容許有空值 create unique index idx_XX on table(f1) 複合索引: 一個索引包含多個列 如:create index idx_XX on table(f1,f2,..)算法

索引結構

BTree Hash索引 full-text全文索引sql

什麼狀況創建索引

主鍵自動創建惟一索引 頻繁做爲查詢條件的字段因該建立索引 查詢中與其餘表關聯的字段,外鍵關係創建索引 頻繁更新的字段不適合創建索引 where條件裏用不到的字段不創建索引 單鍵/複合索引的選擇(高併發下傾向複合) 查詢中排序的字段因創建索引 查詢中統計或分組字段數據庫

什麼狀況建不創建索引

頻繁增刪改的表 表記錄太少 數據重複且分佈平均的表字段。(重複太多索引意義不大)數據結構

比較兩種經常使用的索引BTree與Hash索引

BTree

一個經典的B+樹索引數據結構見下圖:併發

這裏寫圖片描述

B+樹是一個平衡的多叉樹,從根節點到每一個葉子節點的高度差值不超過1,並且同層級的節點間有指針相互連接。在B+樹上的常規檢索,從根節點到葉子節點的搜索效率基本至關,不會出現大幅波動,並且基於索引的順序掃描時,也能夠利用雙向指針快速左右移動,效率很是高。高併發

所以,B+樹索引被普遍應用於數據庫、文件系統等場景。指針

Hash

而哈希索引的示意圖則是這樣的:blog

這裏寫圖片描述

簡單地說,哈希索引就是採用必定的哈希算法,把鍵值換算成新的哈希值,檢索時不須要相似B+樹那樣從根節點到葉子節點逐級查找,只需一次哈希算法便可馬上定位到相應的位置,速度很是快。排序

因此

從上面的圖來看,B+樹索引和哈希索引的明顯區別是:

若是是等值查詢,那麼哈希索引明顯有絕對優點,由於只須要通過一次算法便可找到相應的鍵值;固然了,這個前提是,鍵值都是惟一的。若是鍵值不是惟一的,就須要先找到該鍵所在位置,而後再根據鏈表日後掃描,直到找到相應的數據; 從示意圖中也能看到,若是是範圍查詢檢索,這時候哈希索引就毫無用武之地了,由於原先是有序的鍵值,通過哈希算法後,有可能變成不連續的了,就沒辦法再利用索引完成範圍查詢檢索; 同理,哈希索引也沒辦法利用索引完成排序,以及like ‘xxx%’ 這樣的部分模糊查詢(這種部分模糊查詢,其實本質上也是範圍查詢); 哈希索引也不支持多列聯合索引的最左匹配規則; B+樹索引的關鍵字檢索效率比較平均,不像B樹那樣波動幅度大,在有大量重複鍵值狀況下,哈希索引的效率也是極低的,由於存在所謂的哈希碰撞問題。

在MySQL中,只有HEAP/MEMORY引擎表才能顯式支持哈希索引(NDB也支持,但這個不經常使用),InnoDB引擎的自適應哈希索引(adaptive hash index)不在此列,由於這不是建立索引時可指定的。

還須要注意到:HEAP/MEMORY引擎表在mysql實例重啓後,數據會丟失。

一般,B+樹索引結構適用於絕大多數場景,像下面這種場景用哈希索引才更有優點:

在HEAP表中,若是存儲的數據重複度很低(也就是說基數很大),對該列數據以等值查詢爲主,沒有範圍查詢、沒有排序的時候,特別適合採用哈希索引

例如這種SQL:

SELECT … FROM t WHERE C1 = ?; — 僅等值查詢

在大多數場景下,都會有範圍查詢、排序、分組等查詢特徵,用B+樹索引就能夠了。

相關文章
相關標籤/搜索