MySQL B+樹索引和哈希索引的區別

時間 2019-11-26

標籤 mysql 索引哈希區別欄目 MySQL 简体版

原文原文鏈接

導讀

在MySQL裏經常使用的索引數據結構有B+樹索引和哈希索引兩種，咱們來看下這兩種索引數據結構的區別及其不一樣的應用建議。html

兩者區別

備註：先說下，在MySQL文檔裏，其實是把B+樹索引寫成了BTREE，例如像下面這樣的寫法：mysql

CREATE TABLE t(
aid int unsigned not null auto_increment,
userid int unsigned not null default 0,
username varchar(20) not null default ‘’,
detail varchar(255) not null default ‘’,
primary key(aid),
unique key(uid) USING BTREE,
key (username(12)) USING BTREE — 此處 uname 列只建立了最左12個字符長度的部分索引
)engine=InnoDB;算法

一個經典的B+樹索引數據結構見下圖：

(圖片源自網絡)sql

B+樹是一個平衡的多叉樹，從根節點到每一個葉子節點的高度差值不超過1，並且同層級的節點間有指針相互連接。數據庫

在B+樹上的常規檢索，從根節點到葉子節點的搜索效率基本至關，不會出現大幅波動，並且基於索引的順序掃描時，也能夠利用雙向指針快速左右移動，效率很是高。網絡

所以，B+樹索引被普遍應用於數據庫、文件系統等場景。順便說一下，xfs文件系統比ext3/ext4效率高不少的緣由之一就是，它的文件及目錄索引結構所有采用B+樹索引，而ext3/ext4的文件目錄結構則採用Linked list, hashed B-tree、Extents/Bitmap等索引數據結構，所以在高I/O壓力下，其IOPS能力不如xfs。數據結構

詳細可參見：ui

https://en.wikipedia.org/wiki/Ext4
https://en.wikipedia.org/wiki/XFS指針

而哈希索引的示意圖則是這樣的：

(圖片源自網絡)htm

簡單地說，哈希索引就是採用必定的哈希算法，把鍵值換算成新的哈希值，檢索時不須要相似B+樹那樣從根節點到葉子節點逐級查找，只需一次哈希算法便可馬上定位到相應的位置，速度很是快。

從上面的圖來看，B+樹索引和哈希索引的明顯區別是：

若是是等值查詢，那麼哈希索引明顯有絕對優點，由於只須要通過一次算法便可找到相應的鍵值；固然了，這個前提是，鍵值都是惟一的。若是鍵值不是惟一的，就須要先找到該鍵所在位置，而後再根據鏈表日後掃描，直到找到相應的數據；
從示意圖中也能看到，若是是範圍查詢檢索，這時候哈希索引就毫無用武之地了，由於原先是有序的鍵值，通過哈希算法後，有可能變成不連續的了，就沒辦法再利用索引完成範圍查詢檢索；
同理，哈希索引也沒辦法利用索引完成排序，以及like ‘xxx%’ 這樣的部分模糊查詢（這種部分模糊查詢，其實本質上也是範圍查詢）；
哈希索引也不支持多列聯合索引的最左匹配規則；
B+樹索引的關鍵字檢索效率比較平均，不像B樹那樣波動幅度大，在有大量重複鍵值狀況下，哈希索引的效率也是極低的，由於存在所謂的哈希碰撞問題。