Mysql 百問系列:B+Tree 究竟是什麼

前言:

之前看過許多關於B+ Tree的文章,當時看了總以爲明白了,但是沒過多久就又要忘了。直到我看了掘金小冊:Mysql是怎麼運行 第7,第8章才終於明白了B+ Tree究竟是怎麼回事。若是對Mysql內部具體如何實現感興趣的能夠去看小冊,我本身看這2章,每章都花了2個小時,畢竟介紹的概念有點多。  我這篇文章至關於對這2章內容的概況總結吧,也能夠當導讀看,看完這個,再去看小冊子可能就沒那麼吃力了。(ps, 這本小冊子是我見過最詳細介紹Mysql內部原理的系列文章。)算法

問題:

1.數據是怎麼存儲在InnoDB中的
2.若是快速找到一條記錄?
3.搜索查找記錄的流程是怎麼樣的?
4.頁分裂是什麼?sql

準備工做

沒錯,首先忘了什麼數據結構。
在介紹Buffer Pool時提到過數據庫

InnoDB 是以 頁(通常爲大小爲16K) 爲單位,從磁盤文件中讀取數據 到內存的。 一頁 包含多條記錄(每頁至少要有2條記錄)數據結構

CREATE TABLE `school` (
  `id` int(11) NOT NULL AUTO_INCREMENT,
  `name` varchar(255) DEFAULT NULL,
  PRIMARY KEY (`id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8;

delimiter;;
CREATE PROCEDURE idata ( ) BEGIN
	DECLARE
		i INT;
	
	SET i = 1;
	WHILE
			( i <= 25 ) DO
			INSERT INTO school
		VALUES
			( i, 'school' );
		SET i = i + 1;
		
	END WHILE;
	
END;;

delimiter;
CALL idata ( );
複製代碼

如今咱們建立了一張school 表格,而且插入了25條記錄。
現實場景中,一頁能夠記錄幾百上千條記錄。這裏爲了方便理解,咱們假設一頁只能存放5條記錄。那麼存放狀況就如圖:spa

image.png

  • 頁與頁之間是個雙向鏈表,這樣方便範圍查找。
  • 頁號不必定連續
  • 頁中的記錄是按Key進行排序的。記錄之間也是鏈表


知道了記錄的存儲狀況,那麼要查找某個id的記錄,就變成了2個問題:設計

  1. 怎麼快速定位某個Key(這裏爲id) 存在在哪一個頁面中?
  2. 怎麼在頁中快速找到對應Key 的記錄?

如何快速定位頁

爲了快速定位,最容易想到的就是創建字典了,好比(1,200),(2,200),(6,210) 這樣的確可以知足快速查找的需求,可是比較浪費空間。
因此轉換一下方法:code

  • 咱們用 key,value 的形式,key 記錄每一頁的最小值,value 記錄對應數據頁頁號。這樣造成了目錄項。例如,如今咱們有25條記錄,每5條記錄存放在1頁中,那麼至少有5頁,因此至少有5個目錄項
  • 目錄項管理也經過頁的形式進行。5條記錄爲1頁,那麼5個目錄項就造成了1個目錄頁。目錄頁中的記錄(即目錄項)也是按照順序排列

image.png

這就是最簡單的一個B+Tree 了。葉子節點爲數據頁,存放數據。(爲何說對於聚簇索引,索引即數據?)而非葉子節點存放的是目錄項。cdn

搜索流程

select * from student where id = 14
複製代碼

咱們要從查id = 14 的數據。那麼從根節點``(這裏是頁400)開始查找,頁400有5個記錄,經過二分查找算法進行查找,由於11 < 14 < 16 因此 14記錄對應的頁和11記錄對應的頁同樣。(請牢記下面2個特性: 目錄項中的key 記錄的是對應頁中key的最小值。而且無論數據頁仍是目錄頁其中的記錄都是有序的。)
那麼14 對應的頁就是212號頁。而後再到頁212號中進行二分查找找到對應數據。blog

頁分裂

若是這個時候再插入一條數據。排序

insert into student values (28,'王五')
複製代碼

因爲數據頁都滿了,因此必須新開一個頁面來存放28這條記錄。假如這個頁面爲310頁。但同時因爲目錄頁400頁也滿了,無法記錄(28,310)這個目錄項,因此又必須加個新的目錄頁例如410頁來存放新的目錄項。這個時候因爲有2個目錄頁了,因此須要新建新的目錄頁來管理目錄頁,``沒錯,目錄頁中的記錄不必定是指向數據頁的,也可能指向目錄頁。
看起來會變成下面這樣:(圖有點醜,有好的畫圖軟件麻煩推薦下)

image.png

經過頁分裂,B+Tree 變成了3層。根節點從頁400 變成了頁420。 看到這裏也許你會疑惑你看過的一些文章,B+Tree 的構建並非這樣的。我想說明的是:InnoDB 構建過程跟我上面所提的過程是不一樣的。上面的過程是爲了讓你們首先了解下隨着數據插入,頁面( 不論是數據頁仍是目錄頁)是會增長的。我作出這個流程是爲了讓你們知道有這麼一個流程,可是具體實施,InnoDB的大神考慮的固然比咱們要多,能夠說是 異曲同工吧,方法不一樣,但要達到的目的是同樣的:就是現有頁面存放不了新插入的數據時會進行頁分裂。具體流程感情的小夥伴能夠查看小冊子。我介紹最重要的點:

  • 根節點肯定後是不會變的。(上面說的根節點從400 變成頁420在真實數據庫中是不會存在的。)真實的流程相似於:假設一開始只有5條數據都存放在頁10當中,那麼這個時候頁10便是數據頁又是根節點。這個時候又新插入一條數據,Innodb會把頁10複製獲得數據頁20,而後對數據頁20進行分裂,把數據頁20中的部分數據遷移,獲得數據頁30,而後新插入的數據根據索引的大小插入到對應的頁20或頁30中。這個時候原來的頁10變成了目錄頁,記錄的目錄項對應頁20,和頁30。可是頁10仍是根節點

總結

  • 數據記錄按頁爲單位存儲,每頁包含多條記錄。
  • 爲了方便從衆多數據頁中找到對應的記錄,設計了目錄頁。目錄頁和數據頁 構成了一棵B+ Tree。
  • B+ Tree 個根節點固定,會隨着數據插入進行頁分裂。
  • 也許通篇文章都沒有提B+ Tree的數據結構究竟是什麼,但但願經過B+ Tree 在InnoDB 中現實場景應用,讓你對B+ Tree 的做用,以及B+ Tree 中葉子節點和非葉子節點究竟是什麼有個具體的概念。好好理解下文中的搜索過程,和插入流程。再回過頭去瞧那些介紹B+Tree的數據結構的文章相信你會更容易懂。任何數據結構都是爲某些場景服務而存在的,瞭解應用場景後再去看具體實現更容易懂並且印象深入
相關文章
相關標籤/搜索