本文源碼:GitHub·點這裏 || GitEE·點這裏mysql
首先要明確索引是什麼:索引是一種數據結構,數據結構是計算機存儲、組織數據的方式,是指相互之間存在一種或多種特定關係的數據元素的集合,例如:鏈表,堆棧,隊列,二叉樹等等。git
其次要清楚索引的做用:索引可使存儲引擎快速找到數據記錄,這是最基本的做用,索引是對查詢速度最關鍵的影響,良好的索引設計可使查詢的效率有質的飛越。github
索引的使用:若是查詢語句使用全部,MySQL會在索引的數據結構上查詢,若是查詢到,就返回包含該索引的數據行。sql
索引的種類很是多,如何分類取決多個場景和不一樣的角度,常見的劃分以下:數據庫
注意:索引的實現是在存儲引擎層面,相同的索引在不一樣的存儲引擎中,其實現方式可能都是不同的。緩存
普通索引服務器
基本的索引,沒有任何使用限制,主要用來加速數據查詢。適合常常出如今查詢條件或排序條件中的數據列。數據結構
主鍵索引架構
特殊的惟一索引,不容許有空值,在建表的時候指定主鍵,就會建立主鍵索引,MySQL中最核心的索引,大量的業務數據都是基於主鍵查詢。ide
惟一索引
普通索引相似,不一樣的就是:索引列的值必須惟一,但容許有空值。若是是組合索引,則列值的組合必須是惟一性的。
全文索引
用於全文搜索,經過創建全文索引,基於分詞的查詢模式,能夠極大的提高檢索效率。
組合索引
建立的索引覆蓋兩個或者兩個以上的列,適應組合查詢的場景,也經常使用於要素驗證的業務,例如判斷用戶身份ID,手機號,郵箱,是否爲同一個用戶。
基礎用戶表
CREATE TABLE user_base ( id INT (11) NOT NULL AUTO_INCREMENT COMMENT '主鍵ID', user_name VARCHAR (20) NOT NULL COMMENT '用戶名', phone VARCHAR (20) NOT NULL COMMENT '手機號', email VARCHAR (32) DEFAULT NULL COMMENT '郵箱', card_id VARCHAR (32) DEFAULT NULL COMMENT '身份編號', create_time datetime DEFAULT NULL COMMENT '建立時間', state INT (1) DEFAULT '1' COMMENT '是否可用,0-不可用,1-可用', PRIMARY KEY (`id`) ) ENGINE = INNODB DEFAULT CHARSET = utf8 COMMENT = '用戶基礎表';
建立單列索引
CREATE INDEX card_id_index ON user_base(card_id);
修改添加索引
ALTER TABLE user_base ADD INDEX state_index(state) ;
建立組合索引
CREATE INDEX bind_index ON user_base(phone,card_id);
刪除索引
DROP INDEX card_id_index ON user_base ;
修改索引
MySQL不支持真正修改索引的語法規範,能夠經過刪除舊索引,添加新索引的方式進行操做。
分析MySQL查詢,多數狀況下用來分析執行語句的SQL中是否使用索引,是否產生臨時表等性能相關問題。
基礎用法
EXPLAIN SELECT * FROM user_base WHERE id='1';
參數說明
simple:簡單select查詢,查詢中不包含子查詢或者 primary:查詢中若包含複雜的子部分,最外層查詢則被標記爲primary subquery:select或where中包含子查詢 derived:from中包含的子查詢被標記爲derived衍生,mysql會遞歸執行這些子查詢,且生成臨時表 union:第二個select出如今union後,標記爲union union-result:從union表獲取結果的select
system-const:對查詢的某部分進行優化並轉換成一個常量時,會使用該類型 eq_ref:常見於主鍵或惟一索引掃描,表中只有一條記錄與之匹配 ref:非惟一性索引掃描,返回匹配某個單獨值的全部行 index:遍歷索引結構,索引文件一般比數據文件小 all:遍歷全表進行查詢
Using-Filesort:查詢使用文件排序,最差的執行計劃 Using-Temporary:臨時表保存中間結果,比文件排序稍微強點 Using-Index:查詢操做中使用了覆蓋索引 Using-Where:代表使用了where過濾條件 Using-Join-Buffer:代表使用了鏈接緩存 Impossible-Where:表示where條件false,不能過濾元素 Distinct:優化distinct找到第一匹配的數據後即中止找一樣值的動做 Select-Tables-Optimized-Away:沒必要等到執行階段再進行計算,查詢執行計劃生成的階段即完成優化
MySQL官方比較推薦的索引結構類型,在實際的數據庫開發中,基於MySQL中的表結構,大部分使用的都是B-Three索引結構,即二叉樹的結構。能夠加快數據的訪問速度,存儲引擎再也不須要進行全表掃描來獲取數據,數據分佈在各個索引節點上,B-Tree索引結構如圖:
該結構是典型的二叉樹結構,特色:數據值按照順序存儲的,每一個葉子節點到根部的距離是相同的,注意這裏描述的是索引結構圖。
實際存儲結構上,數據順序存儲,每一個節點包含索引值,索引指向的數據行的值,指向子頁的指針,指向葉子頁的指針,這樣才能把索引和數據結構組織起來,結構如圖:
這樣完整描述B-Tree索引的數據特色,基於樹搜索提高效率,減小掃描數據,數據被順序的組織起來,按照索引值順序排列。
索引的根本做用,減小掃描的數據量,提高查詢效率,基於B-Tree索引的結構的查詢規則基本以下:
注意:必需要強調一點,查詢必須是在執行索引的基礎上,纔是該邏輯,正常的開發中多分析一下查詢語句,有時候可能只是本身感受查詢索引是執行的,實際多是失效的。
好的索引設計十分重要,可是查詢的時候極可能由於觸發各類索引失效機制,致使SQL語句不執行索引搜索,嚴重損失性能,因此基於業務下數據查詢特色,設計相對好用的索引結構,是十分關鍵的,這裏涉及不少場景問題,後續再詳細記錄。
索引有時候並非最好的解決方式,當數據量龐大的時候,索引也會佔據龐大的存儲空間,這裏提供一個業務測試場景,僅供參數:單表三個字符類型字段,兩個字段使用索引結構,存儲數據在700W量級,在A和B兩個數據庫,A數據庫有索引結構,B數據庫沒有索引,A庫佔用的空間是B庫的1.6倍,寫入千萬數據的速度也比B數據庫慢9分鐘。
這裏只想說明一點:索引雖然好,使用穩當才能發揮做用。
GitHub·地址 https://github.com/cicadasmile/mysql-data-base GitEE·地址 https://gitee.com/cicadasmile/mysql-data-base
推薦閱讀:MySQL系列