《數據庫索引,究竟是什麼作的?》介紹了B+樹,它是一種很是適合用來作數據庫索引的數據結構:數據庫
(1)很適合磁盤存儲,可以充分利用局部性原理,磁盤預讀;數據結構
(2)很低的樹高度,可以存儲大量數據;post
(3)索引自己佔用的內存很小;3d
(4)可以很好的支持單點查詢,範圍查詢,有序性查詢;指針
數據庫的索引分爲主鍵索引(Primary Inkex)與普通索引(Secondary Index)。InnoDB和MyISAM是怎麼利用B+樹來實現這兩類索引,其又有什麼差別呢?這是今天要聊的內容。code
MyISAM的索引與行記錄是分開存儲的
,叫作非彙集索引(UnClustered Index)。orm
其主鍵索引與普通索引沒有本質差別:cdn
單獨存儲行記錄
指針
指針
*畫外音:MyISAM的表能夠沒有主鍵。*
blog
主鍵索引與普通索引是兩棵獨立的索引B+樹,經過索引列查找時,先定位到B+樹的葉子節點,再經過指針定位到行記錄。索引
舉個例子,MyISAM:
t(id PK, name KEY, sex, flag);
表中有四條記錄:
1, shenjian, m, A
3, zhangsan, m, A
5, lisi, m, A
9, wangwu, f, B
其B+樹索引構造如上圖:
InnoDB的主鍵索引與行記錄是存儲在一塊兒的,故叫作彙集索引(Clustered Index):
存儲主鍵,與對應行記錄
(而不是指針)畫外音:所以,InnoDB的PK查詢是很是快的。
由於這個特性,InnoDB的表必需要有彙集索引
:
(1)若是表定義了PK,則PK就是彙集索引;
(2)若是表沒有定義PK,則第一個非空unique列是彙集索引;
(3)不然,InnoDB會建立一個隱藏的row-id做爲彙集索引;
彙集索引,也只可以有一個
,由於數據行在物理磁盤上只能有一份彙集存儲。
InnoDB的普通索引能夠有多個,它與彙集索引是不一樣的:
存儲主鍵
(也不是指針)對於InnoDB表,這裏的啓示是:
(1)不建議使用較長的列作主鍵,例如char(64),由於全部的普通索引都會存儲主鍵,會致使普通索引過於龐大;
(2)建議使用趨勢遞增
的key作主鍵,因爲數據行與索引一體,這樣不至於插入記錄時,有大量索引分裂,行記錄移動;
還是上面的例子,只是存儲引擎換成InnoDB:
t(id PK, name KEY, sex, flag);
表中仍是四條記錄:
1, shenjian, m, A
3, zhangsan, m, A
5, lisi, m, A
9, wangwu, f, B
其B+樹索引構造如上圖:
當:
select * from t where name=‘lisi’;
會先經過name輔助索引定位到B+樹的葉子節點獲得id=5,再經過彙集索引定位到行記錄。
*畫外音:因此,其實掃了2遍索引樹。*
三,總結
MyISAM和InnoDB都使用B+樹來實現索引:
分開
存儲存儲指針
,主鍵索引與普通索引無太大區別數據行統一存儲
存儲主鍵
趨勢遞增整數做爲PK
,而不宜使用較長的列做爲PK