彙集索引(InnoDB,使用B+Tree做爲索引結構)mysql
在一個結構中保存了b-tree索引和數據行;按照主鍵的順序存儲在葉子頁上;算法
主鍵索引:葉節點存儲key-value爲(主鍵數據:全部剩餘列數據)sql
二級索引(非聚簇索引):葉節點存儲key-value爲(索引列數據:主鍵數據)服務器
非葉節點只存儲 索引列ide
優勢:函數
能夠把相關數據保存在一塊兒,如根據用戶id彙集電子郵箱信息,只須要讀取少數的數據頁就能獲取某個id用戶的所有郵件;性能
數據訪問更快,將索引和數據保存在同一個b-tree中;優化
使用覆蓋索引掃描的查詢能夠直接使用葉節點中的主鍵值;spa
缺點:代理
插入速度嚴重依賴於插入順序,按照主鍵的順序插入是加載數據到innodb表中速度最快的方式;
插入新行可能面臨頁分裂的問題,頁分裂致使表佔用更多磁盤空間;
經過二級索引須要兩次查找,存儲引擎找到二級索引的葉子節點得到對應的主鍵值,根據這個值去聚簇索引中找到對應的行
主鍵:
若是表沒有什麼數據須要被彙集(如上述郵件用戶id),那麼能夠定義一個代理鍵做爲主鍵,使用auto_increment自增列;
非彙集索引(MyISAM使用B+Tree做爲索引結構)
按照數據插入順序存儲在磁盤上,訪問數據須要一次系統調用;
主鍵索引/二級索引:葉節點存儲(索引列數據:數據在磁盤上的行號)
對比:
InnoDB提供事務支持事務,外鍵等功能;MyISAM不支持。
InnoDB支持行級鎖;MyISAM只支持表級鎖
InnoDB要求必須有主鍵;MyISAM容許沒有任何索引和主鍵的表存在,索引都是保存行的地址。
覆蓋索引
一個索引包含(或者說覆蓋)全部須要查詢的字段的值
覆蓋索引要存儲索引列的值,只能用b-tree索引作覆蓋索引(不能用哈希索引,全文索引等)
優勢
1. MyISAM存儲引擎在內存中只存儲索引,覆蓋索引不須要進行系統調用;
2. innodb存儲引擎的聚簇索引機制,二級主鍵若是能覆蓋查詢,能夠避免對主鍵索引的二次查詢;
全文索引
但願經過關鍵字的匹配來進行查詢過濾,而不是經過常規的數值比較,範圍過濾操做;
MyISAM的全文索引是一類特殊的B-Tree索引,共有兩層,第一層是全部關鍵字,對於每個關鍵字的第二層,包含的是一組相關的「文檔指針」;
對於文檔對象中的全部詞語的過濾條件:
1. 停用詞列表中的詞語都不會被索引
2. 長度大於指定範圍和小於指定範圍的詞語不會被索引
另外,全文索引不會存儲關鍵字具體匹配在哪一列。
1. 天然語言全文索引
根據where子句中的MATCH AGAINST區分是否使用全文索引
Eg.在表file_text的字段title,description上創建fulltext全文索引
Select film_id,title,right(description,25)
Match(title,description) against(‘factory casualties’) as relevance
From file_text where Match(title,description) against(‘factory casualties’);
結果:
Film_id title right(description,25) relevance
831 spirited casualties a car is a baloon factory 8.4692449702
126 casualties encino face a boy in a monastery 5.2615661621
... ...
函數match()將返回關鍵詞的匹配相關度,是一個浮點數。
2. 布爾全文索引
用戶能夠自定義被搜索詞語的相關性;用戶能夠經過一些前置修飾符定製搜索:
example meaning
Dinosaur 包含dinosaur的行rank值更高
-dinosaur 包含dinosaur的行rank值更低
+dinosaur 行記錄必須包含dinosaur
-dinosaur 行記錄不能包含dinosaur
Dino* 包含以dino開頭的單詞的行rank值更高
Eg. Select film_id,title,right(description,25)
From file_text where Match(title,description) against(‘+factory +casualties’ in boolean mood);
結果:
Film_id title right(description,25)
831 spirited casualties a car is a baloon factory
搜索的關鍵詞是不常見的詞語時,比LIKE操做要快得多,由於是直接從索引中過濾記錄。
全文索引的限制:
1. mysql的全文索引只有一種判斷相關性的方法:詞頻。沒有其餘相關性排序算法,如存儲的位置。
2. 只有全文索引所有在內存中時,性能才能很是好
3. 其餘的where條件,只能在mysql完成全文搜索返回記錄後才能進行
4. 全文索引不能存儲列的實際值,不能用做覆蓋掃描
5. 除了相關性排序,不能用做其餘排序
配置和優化
1. 停用詞表
2. 容許最小詞長
在搜索的精度和搜索的效率之間找到合適的平衡點。
索引和鎖
索引可讓查詢鎖定更少的行,innodb只有在訪問行時纔會對其加鎖,而索引能夠減小innodb訪問的行數,從而減小鎖的數量;
可是,只有當innodb在存儲引擎層可以過濾掉不須要的行時纔有效,若是沒法過濾,那麼在innodb檢索到數據並返回給服務器層,mysql才能應用where語句進行過濾,而innodb已經鎖住了這些行,直到服務器層過濾完成後釋放鎖;
如:select actor_id from sakila.actor where actor_id < 5 (範圍)and actor_id <> 1 (過濾) for update;
執行explain命令,顯示type爲range,表示mysql爲該查詢選擇的執行計劃是索引範圍查詢,即在存儲引擎層只執行了actor_id < 5的條件,查詢結果:2,3,4;而被鎖定的數據行:1,2,3,4;
即便使用索引,也可能鎖住一些不須要的行,可是不使用索引查找的話mysql會全表掃描並鎖住全部的行。