MySQL的索引是數據庫很是重要的知識點,這些知識點你都掌握了嗎?若是有幫到你能夠點贊收藏呦。html
推薦閱讀:這些必會的計算機網絡知識點你都掌握了嗎mysql
百度百科的解釋:索引是對數據庫表的一列或者多列的值進行排序一種結構,使用索引能夠快速訪問數據表中的特定信息。算法
優勢:sql
缺點:數據庫
索引的數據結構主要有B+樹和哈希表,對應的索引分別爲B+樹索引和哈希索引。InnoDB引擎的索引類型有B+樹索引和哈希索引,默認的索引類型爲B+樹索引。緩存
B+樹索引網絡
熟悉數據結構的同窗都知道,B+樹、平衡二叉樹、紅黑樹都是經典的數據結構。在B+樹中,全部的記錄節點都是按照鍵值大小的順序放在葉子節點上,以下圖。數據結構
從上圖能夠看出 ,由於B+樹具備有序性,而且全部的數據都存放在葉子節點,因此查找的效率很是高,而且支持排序和範圍查找。函數
B+樹的索引又能夠分爲主索引和輔助索引。其中主索引爲聚簇索引,輔助索引爲非聚簇索引。聚簇索引是以主鍵做爲B+ 樹索引的鍵值所構成的B+樹索引,聚簇索引的葉子節點存儲着完整的數據記錄;非聚簇索引是以非主鍵的列做爲B+樹索引的鍵值所構成的B+樹索引,非聚簇索引的葉子節點存儲着主鍵值。因此使用非聚簇索引進行查詢時,會先找到主鍵值,而後到根據聚簇索引找到主鍵對應的數據域。上圖中葉子節點存儲的是數據記錄,爲聚簇索引的結構圖,非聚簇索引的結構圖以下:性能
上圖中的字母爲數據的非主鍵的列值,假設要查詢該列值爲B的信息,則需先找到主鍵7,在到聚簇索引中查詢主鍵7所對應的數據域。
哈希索引
哈希索引是基於哈希表實現的,對於每一行數據,存儲引擎會對索引列經過哈希算法進行哈希計算獲得哈希碼,而且哈希算法要儘可能保證不一樣的列值計算出的哈希碼值是不一樣的,將哈希碼的值做爲哈希表的key值,將指向數據行的指針做爲哈希表的value值。這樣查找一個數據的時間複雜度就是o(1),通常多用於精確查找。
由於二者數據結構上的差別致使它們的使用場景也不一樣,哈希索引通常多用於精確的等值查找,B+索引則多用於除了精確的等值查找外的其餘查找。在大多數狀況下,會選擇使用B+樹索引。
MySQL主要的索引類型主要有FULLTEXT,HASH,BTREE,RTREE。
FULLTEXT
FULLTEXT即全文索引,MyISAM存儲引擎和InnoDB存儲引擎在MySQL5.6.4以上版本支持全文索引,通常用於查找文本中的關鍵字,而不是直接比較是否相等,多在CHAR,VARCHAR,TAXT等數據類型上建立全文索引。全文索引主要是用來解決WHERE name LIKE "%zhang%"等針對文本的模糊查詢效率低的問題。
HASH
HASH即哈希索引,哈希索引多用於等值查詢,時間複雜夫爲o(1),效率很是高,但不支持排序、範圍查詢及模糊查詢等。
BTREE
BTREE即B+樹索引,INnoDB存儲引擎默認的索引,支持排序、分組、範圍查詢、模糊查詢等,而且性能穩定。
RTREE
RTREE即空間數據索引,多用於地理數據的存儲,相比於其餘索引,空間數據索引的優點在於範圍查找
B樹和B+樹最主要的區別主要有兩點:
B樹中的內部節點和葉子節點均存放鍵和值,而B+樹的內部節點只有鍵沒有值,葉子節點存放全部的鍵和值。
B+樹的葉子節點是經過相連在一塊兒的,方便順序檢索。
二者的結構圖以下。
那在什麼狀況適合使用B樹呢,由於B樹的內部節點也能夠存儲值,因此能夠把一些頻繁訪問的值放在距離根節點比較近的地方,這樣就能夠提升查詢效率。綜上所述,B+樹的性能更加適合做爲數據庫的索引。
聚簇索引和非聚簇索引最主要的區別是數據和索引是否分開存儲。
在InnoDB存儲引擎中,默認的索引爲B+樹索引,利用主鍵建立的索引爲主索引,也是聚簇索引,在主索引之上建立的索引爲輔助索引,也是非聚簇索引。爲何說輔助索引是在主索引之上建立的呢,由於輔助索引中的葉子節點存儲的是主鍵。
在MyISAM存儲引擎中,默認的索引也是B+樹索引,但主索引和輔助索引都是非聚簇索引,也就是說索引結構的葉子節點存儲的都是一個指向數據行的地址。而且使用輔助索引檢索無需訪問主鍵的索引。
能夠從很是經典的兩張圖看看它們的區別(圖片來源於網絡):
上面是說了非聚簇索引的葉子節點存儲的是主鍵,也就是說要先經過非聚簇索引找到主鍵,再經過聚簇索引找到主鍵所對應的數據,後面這個再經過聚簇索引找到主鍵對應的數據的過程就是回表查詢,那麼非聚簇索引就必定會進行回表查詢嗎?
答案是不必定的,這裏涉及到一個索引覆蓋的問題,若是查詢的數據再輔助索引上徹底能獲取到便不須要回表查詢。例若有一張表存儲着我的信息包括id、name、age等字段。假設聚簇索引是以ID爲鍵值構建的索引,非聚簇索引是以name爲鍵值構建的索引,select id,name from user where name = 'zhangsan';
這個查詢便不須要進行回表查詢由於,經過非聚簇索引已經能所有檢索出數據,這就是索引覆蓋的狀況。若是查詢語句是這樣,select id,name,age from user where name = 'zhangsan';
則須要進行回表查詢,由於經過非聚簇索引不能檢索出age的值。那應該如何解決那呢?只須要將索引覆蓋便可,創建age和name的聯合索引再使用select id,name,age from user where name = 'zhangsan';
進行查詢便可。
因此經過索引覆蓋能解決非聚簇索引回表查詢的問題。
對索引的優化其實最關鍵的就是要符合索引的設計原則和應用場景,將不符合要求的索引優化成符合索引設計原則和應用場景的索引。
除了索引的設計原則和應用場景那幾點外,還能夠從如下兩方面考慮。
select * from table_name where a + 1 = 2
索引的使用場景、索引的設計原則和如何對索引進行優化能夠當作一個問題。
建立索引:
使用CREATE INDEX 語句
CREATE INDEX index_name ON table_name (column_list);
在CREATE TABLE時建立
CREATE TABLE user( id INT PRIMARY KEY, information text, FULLTEXT KEY (information) );
使用ALTER TABLE建立索引
ALTER TABLE table_name ADD INDEX index_name (column_list);
刪除索引:
刪除主鍵索引
alter table 表名 drop primary key
刪除其餘索引
alter table 表名 drop key 索引名
不必定,前面在索引的使用場景和索引的設計原則中已經提到了如何合理地使用索引,由於建立和維護索引須要花費空間和時間上的代價,若是不合理地使用索引反而會使查詢性能降低。
前綴索引是指對文本或者字符串的前幾個字符創建索引,這樣索引的長度更短,查詢速度更快。
使用場景:前綴的區分度比較高的狀況下。
創建前綴索引的方式
ALTER TABLE table_name ADD KEY(column_name(prefix_length));
這裏面有個prefix_length參數很難肯定,這個參數就是前綴長度的意思。一般可使用如下方法進行肯定,先計算全列的區分度
SELECT COUNT(DISTINCT column_name) / COUNT(*) FROM table_name;
而後在計算前綴長度爲多少時和全列的區分度最類似。
SELECT COUNT(DISTINCT LEFT(column_name, prefix_length)) / COUNT(*) FROM table_name;
不斷地調整prefix_length的值,直到和全列計算出區分度相近。
最左匹配原則:從最左邊爲起點開始連續匹配,遇到範圍查詢(<、>、between、like)會中止匹配。
例如創建索引(a,b,c),你們能夠猜想如下幾種狀況是否用到了索引。
第一種
select * from table_name where a = 1 and b = 2 and c = 3 select * from table_name where b = 2 and a = 1 and c = 3
上面兩次查詢過程當中全部值都用到了索引,where後面字段調換不會影響查詢結果,由於MySQL中的優化器會自動優化查詢順序。
第二種
select * from table_name where a = 1 select * from table_name where a = 1 and b = 2 select * from table_name where a = 1 and b = 2 and c = 3
答案是三個查詢語句都用到了索引,由於三個語句都是從最左開始匹配的。
第三種
select * from table_name where b = 1 select * from table_name where b = 1 and c = 2
答案是這兩個查詢語句都沒有用到索引,由於不是從最左邊開始匹配的
第四種
select * from table_name where a = 1 and c = 2
這個查詢語句只有a列用到了索引,c列沒有用到索引,由於中間跳過了b列,不是從最左開始連續匹配的。
第五種
select * from table_name where a = 1 and b < 3 and c < 1
這個查詢中只有a列和b列使用到了索引,而c列沒有使用索引,由於根據最左匹配查詢原則,遇到範圍查詢會中止。
第六種
select * from table_name where a like 'ab%'; select * from table_name where a like '%ab' select * from table_name where a like '%ab%'
對於列爲字符串的狀況,只有前綴匹配可使用索引,中綴匹配和後綴匹配只能進行全表掃描。
在上面介紹了幾種不符合最左匹配原則的狀況會致使索引失效,除此以外,如下這幾種狀況也會致使索引失效。
select * from table_name where a = 1 or b = 3
select * from table_name where a + 1 = 2
select * from table_name where a = '1'
會使用到索引,若是寫成select * from table_name where a = 1
則會致使索引失效。select * from table_name where abs(a) = 1
select * from table_name where a != 1
select * from table_name where a is null