原創做者,公衆號【程序員讀書】,歡迎關注公衆號,轉載文章請註明出處哦。程序員
與數據庫索引有關的知識,說實在的,真的是很複雜,原本想好好看看這方面的東西,而後寫篇文章詳細談談的,後來發現索引的知識太難太深,要談得全面又詳細真的很難,因此最後仍是把本身學到的和想到的變成下面一個個的問題,但願能對你們幫助!數據庫
數據庫索引是數據庫系統中一個重要的概念,索引也叫作key
,是一種用於提高數據庫查詢效率的數據結構,咱們能夠把索引理解成一本書的目錄,經過目錄咱們能夠快速找到對應章節的內容,一樣的,經過數據庫索引,咱們能夠快速找到數據表中對應的記錄。bash
總而言之,索引就像給數據表建了一個目錄同樣。數據結構
1 . 使用索引大大減小了存儲引擎須要掃描的數據量,若是沒有使用索引的話,每查詢一行數據都要對數據表進行掃描,這樣的話會很是慢。性能
2 . 因爲索引已經排好序的,因此對數據表進行ORDER BY
和GROUP BY
等操做時,能夠很快獲得結果。ui
3 . 索引能夠將隨機的I/O
轉爲順序的I/O
,避免高昂的磁盤IO
成本,提高查詢效率。spa
MySQL
的索引是在存儲引擎這一層實現的,所以每一種存儲引擎都有不一樣的實現方式,對同一種索引的處理方式也完成不一樣。指針
若是使用以%
開頭的LIKE
語句進行模糊匹配,則沒法使用索引,如:code
SELECT * FROM users WHERE name LIKE '%小張%';
SELECT * FROM users WHERE name LIKE '%小張';
複製代碼
不過以%
爲結尾則可使用索引,如:cdn
SELECT * FROM users WHERE name LIKE '張%';
複製代碼
OR
語句先後沒有同時使用索引,好比下面的語句,字段id
有索引,而字段name
沒有建立索引,那麼下面的語句只能全表掃描,沒法用到索引:
SELECT * FROM users id = 10 or name='test'
複製代碼
在MySQL
中,大部分狀況下,索引都是使用B-Tree
做爲底層數據結構,B-Tree
只是一種泛稱,實際上不一樣的存儲引擎使用B-Tree
時,有不一樣的變種,好比InnoDB
使用的是B+Tree
。
另外也有一些特殊的索引結構,好比哈希索引,哈希索引底層則使用的是哈希表,在MySQL
中,只有Memory
存儲引擎支持哈希索引。
1 . 對於用於存儲歸檔歷史數據的且不多用於查詢的數據表,不建議建立索引。
2 . 數據量比較小的數據表,並且將來數據也不會有太大增加的數據,不該該建索引,好比用於保存配置的數據表。
3 . 修改頻繁,且修改性能遠大於查詢性能時,不該該再建立索引。
回表是對Innodb存儲引擎而言的,在InnoDB
存儲引擎中,主鍵索引的葉子節點存儲的記錄的數據,而普通索引的葉子節點存儲的主鍵索引的地點。
當咱們經過主鍵查詢時,只須要搜索主鍵索引的搜索樹,直接能夠獲得記錄的數據。
當咱們經過普通索引進行查詢時,經過搜索普通索引的搜索樹獲得主鍵的地址以後,還要再使用該主鍵對主鍵搜索樹進行搜索,這個過程稱爲回表。
聚簇索引:聚簇索引的順序就是數據的物理存儲順序,而且索引與數據放在一塊,經過索引能夠直接獲取數據,一個數據表中僅有一個聚簇索引。
非聚簇索引:索引順序與數據物理排列順序無關,索引文件與數據是分開存放。
設置爲主鍵索引的字段不容許爲NULL
,並且一張數據表只能有一個主鍵索引。
設置爲惟一索引的字段,其字段值不容許重要。
普通索引能夠包含重複的值,也能夠爲NULL
。
索引做爲一個數據表的目錄,自己的存儲就須要消耗不少的磁盤和內存存儲空間。
並助在寫入數據表數據時,每次都須要更新索引,因此索引越多,寫入就越慢。
尤爲是糟糕的索引,建得越多對數據庫的性能影響越大。
MyISAM
存儲引擎是非聚族索引,索引與數據是分開存儲的,索引文件中記錄了數據的指針
而InnoDB
存儲引擎是聚族索引,即索引跟數據是放在一塊的,InnoDB
通常將主鍵與數據放在一塊,若是沒有主鍵,則將unique key
做爲主鍵,若是沒有unique key
,則自動建立一個rowid
做爲主鍵,其餘二級索引葉子指針存儲的是主鍵的位置。
MySQL
數據庫不單能夠爲單個數據列建立索引,也能夠爲多個數據列建立一個聯合索引,好比:
CREATE TABLE test(
a INT NOT NOT,
b INT NOT NOT,
KEY(a,b)
);
複製代碼
當咱們使用下面的查詢語句時,因爲WHERE
語句中查詢的條件就是聯合索引,因此能夠很快查詢到數據。
SELECT * FROM test WHERE a=1 AND b=1;
複製代碼
一樣,下面的語句也會利用上面建立的聯合索引,這是由於MySQL
會按照索引建立的順序進行排序,而後根據查詢條件從索引最左邊開始檢測查詢條件是否知足該索引,因爲字段a
在最左邊,因此知足索引。
SELECT * FROM test WHERE a=1;
複製代碼
而使用字段b
進行查詢時,則爲知足,由於從最左邊匹配到的是字段a
,因此MySQL
判斷爲不知足索引條件。
SELECT * FROM test WHERE b=1;
複製代碼
從上面例子能夠很好地瞭解索引的最左前綴原則,同時也說明了索引順序的重要性。
若是一個索引中包含查詢所要的字段時,此時不須要再回表查詢,咱們就稱該索引爲覆蓋索引。
好比下面的查詢中,字段id是主鍵索引,因此能夠直接返回索引的值,顯著提高了查詢的性能。
SELECT id FROM users WHERE id BETWEEN 10 AND 20;
複製代碼
固然,上面列出的只是索引的一小部分知識點,有什麼回答不對的地方,歡迎指出。
若是你以爲文章不錯,歡迎掃碼關注,你的關注就是我寫做的最大動力