講到索引,第一反應確定是能提升查詢效率。例如書的目錄,想要查找某一章節,會先從目錄中定位。若是沒有目錄,那麼就須要將全部內容都看一遍才能找到。數據結構
索引的設計對程序的性能相當重要,若索引太少,對查詢性能受影響;而若是索引太多,則會影響增/改/刪等的性能。性能
MySQL中通常支持如下幾種常見的索引:設計
咱們今天重點來說下B+樹索引,以及爲何要用B+樹來做爲索引的數據結構。指針
B+樹索引並不能直接找到具體的行,只是找到被查找行所在的頁,而後DB經過把整頁讀入內存,再在內存中查找。code
若有 三、一、二、十、九、0、四、6這8個數據,創建如圖1-1
所示哈希索引。orm
直接查詢:如今要從8個數中查找6這條記錄,只須要計算6的哈希值,即可快速定位記錄,時間複雜度爲O(1)。cdn
範圍查詢:若是要進行範圍查詢(大於4的數據),那這個索引就徹底沒用了。blog
二叉樹是一種經典的數據結構,要求左子樹小於根節點,右子樹大於根節點。排序
若有 三、一、二、十、九、0、四、6這8個數據,創建如圖1-2
所示二分查找樹。索引
直接查詢:假設查找鍵值爲6的記錄,先找到根4,4<6,所以查找4的右子樹,找到9;9大於6,所以查找9的左子樹;一共查找3次。但若是順序查找,則須要查找8次(位於最後)。
範圍查詢:若是須要查找大於4的數據,則遍歷4的右子樹就好了。
按照二叉查找樹的定義,它是能夠任意的構造,一樣是這些數字,能夠按照圖1-3-1
的方式來創建二叉查找樹。一樣查找數據6,須要查找5次。
所以爲了最大性能地構造一個二叉查找樹,須要它是平衡的,即平衡二叉樹。
平衡二叉樹定義:首先符合二叉查找樹的定義,另外任何節點的兩個子樹高度最大差爲1。
平衡二叉樹的查詢速度是很快的,可是有缺點:
圖1-3-2
所示在B+樹中,全部記錄節點存放在葉子節點上,且是順序存放,由各葉子節點指針進行鏈接。若是從最左邊的葉子節點開始順序遍歷,能獲得全部鍵值的順序排序。
若有 三、一、二、十、九、0、四、6這8個數據,可創建如圖1-4-1所示高度爲2的B+樹。
在進行更新時,B+樹一樣須要相似二叉樹的旋轉操做。舉例,假設新增一個7,那能夠直接填充到四、6的後面。若是再添加8,那麼就須要進行旋轉了,感覺下面的B+樹旋轉過程。
採用B+樹的索引結構優勢:
未完待續…
若是想要實時關注更新的文章以及分享的乾貨,能夠關注個人公衆號