終於有人將 MySQL 索引講清楚了！

時間 2019-11-05

標籤終於 mysql 索引講清楚欄目 MySQL 简体版

原文原文鏈接

做者：浪人mysql

來源：http://tinyurl.com/y5ymnj9a面試

本文版權歸做者全部
sql

--------------------------------------------------數據庫

1、索引的分類bash
2、索引的底層實現數據結構
3、問題ui

看了不少關於索引的博客，講的大同小異。可是始終沒有讓我明白關於索引的一些概念，如B-Tree索引，Hash索引，惟一索引....url

或許有不少人和我同樣，沒搞清楚概念就開始研究B-Tree，B+Tree等結構，致使在面試的時候答非所問！spa

索引是什麼?3d

索引是幫助MySQL高效獲取數據的數據結構。

索引能幹什麼?

提升數據查詢的效率。

索引：排好序的快速查找數據結構！索引會影響where後面的查找，和order by 後面的排序。

1、索引的分類

從存儲結構上來劃分：BTree索引（B-Tree或B+Tree索引），Hash索引，full-index全文索引，R-Tree索引。
從應用層次來分：普通索引，惟一索引，複合索引
根據中數據的物理順序與鍵值的邏輯（索引）順序關係：彙集索引，非彙集索引。

第一點描述的是索引存儲時保存的形式，第二點是索引使用過程當中進行的分類，二者是不一樣層次上的劃分。不過平時講的索引類型通常是指在應用層次的劃分。

就像手機分類：安卓手機，IOS手機與華爲手機，蘋果手機，OPPO手機同樣。

普通索引：即一個索引只包含單個列，一個表能夠有多個單列索引

惟一索引：索引列的值必須惟一，但容許有空值

複合索引：即一個索引包含多個列

聚簇索引(彙集索引)：並非一種單獨的索引類型，而是一種數據存儲方式。具體細節取決於不一樣的實現，InnoDB的聚簇索引其實就是在同一個結構中保存了B-Tree索引(技術上來講是B+Tree)和數據行。

非聚簇索引：不是聚簇索引，就是非聚簇索引（認真臉）。

2、索引的底層實現

mysql默認存儲引擎innodb只顯式支持B-Tree( 從技術上來講

是B+Tree)索引，對於頻繁訪問的表，innodb會透明創建自適應hash索引，

即在B樹索引基礎上創建hash索引，能夠顯著提升查找效率，對於客戶端是

透明的，不可控制的，隱式的。
複製代碼

不談存儲引擎，只討論實現(抽象)

Hash索引

基於哈希表實現，只有精確匹配索引全部列的查詢纔有效。

對於每一行數據，存儲引擎都會對全部的索引列計算一個哈希碼（hash code），而且Hash索引將全部的哈希碼存儲在索引中，同時在索引表中保存指向每一個數據行的指針。

img

B-Tree索引（MySQL使用B+Tree）

B-Tree能加快數據的訪問速度，由於存儲引擎再也不須要進行全表掃描來獲取數據，數據分佈在各個節點之中。

img

B+Tree索引

是B-Tree的改進版本，同時也是數據庫索引所採用的存儲結構。

數據都在葉子節點上，而且增長了順序訪問指針，每一個葉子節點都指向相鄰的葉子節點的地址。

相比B-Tree來講，進行範圍查找時只須要查找兩個節點，進行遍歷便可。而B-Tree須要獲取全部節點，相比之下B+Tree效率更高。

結合存儲引擎來討論（通常默認使用B+Tree）

案例：假設有一張學生表，id爲主鍵

id	name	birthday
1	Tom	1996-01-01
2	Jann	1996-01-04
3	Ray	1996-01-08
4	Michael	1996-01-10
5	Jack	1996-01-13
6	Steven	1996-01-23
7	Lily	1996-01-25

在MyISAM引擎中的實現（二級索引也是這樣實現的）

在InnoDB中的實現

img

3、問題

問：爲何索引結構默認使用B-Tree，而不是hash，二叉樹，紅黑樹？

hash：雖然能夠快速定位，可是沒有順序，IO複雜度高。

二叉樹：樹的高度不均勻，不能自平衡，查找效率跟數據有關（樹的高度），而且IO代價高。

紅黑樹：樹的高度隨着數據量增長而增長，IO代價高。

問：爲何官方建議使用自增加主鍵做爲索引。

結合B+Tree的特色，自增主鍵是連續的，在插入過程當中儘可能減小頁分裂，即便要進行頁分裂，也只會分裂不多一部分。

而且能減小數據的移動，每次插入都是插入到最後。總之就是減小分裂和移動的頻率。

插入連續的數據：

img

插入非連續的數據

End

掃描下方二維碼試讀

《從零開始帶你成爲JVM實戰高手》詳細目錄：

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。