MYSQL（二）數據庫彙集/非彙集索引，索引和鎖

時間 2020-09-10

標籤 mysql 數據庫彙集索引欄目 MySQL 简体版

原文原文鏈接

彙集索引（InnoDB，使用B+Tree做爲索引結構）mysql

在一個結構中保存了b-tree索引和數據行；按照主鍵的順序存儲在葉子頁上；算法

主鍵索引：葉節點存儲key-value爲（主鍵數據：全部剩餘列數據）sql

二級索引（非聚簇索引）：葉節點存儲key-value爲（索引列數據：主鍵數據）服務器

非葉節點只存儲索引列ide

優勢：函數

能夠把相關數據保存在一塊兒，如根據用戶id彙集電子郵箱信息，只須要讀取少數的數據頁就能獲取某個id用戶的所有郵件；性能

數據訪問更快，將索引和數據保存在同一個b-tree中；優化

使用覆蓋索引掃描的查詢能夠直接使用葉節點中的主鍵值；spa

缺點：代理

插入速度嚴重依賴於插入順序，按照主鍵的順序插入是加載數據到innodb表中速度最快的方式；

插入新行可能面臨頁分裂的問題，頁分裂致使表佔用更多磁盤空間；

經過二級索引須要兩次查找，存儲引擎找到二級索引的葉子節點得到對應的主鍵值，根據這個值去聚簇索引中找到對應的行

主鍵：

若是表沒有什麼數據須要被彙集（如上述郵件用戶id），那麼能夠定義一個代理鍵做爲主鍵，使用auto_increment自增列；

非彙集索引（MyISAM使用B+Tree做爲索引結構）

按照數據插入順序存儲在磁盤上，訪問數據須要一次系統調用；

主鍵索引/二級索引：葉節點存儲（索引列數據：數據在磁盤上的行號）

對比：

InnoDB提供事務支持事務，外鍵等功能；MyISAM不支持。

InnoDB支持行級鎖；MyISAM只支持表級鎖

InnoDB要求必須有主鍵；MyISAM容許沒有任何索引和主鍵的表存在，索引都是保存行的地址。

覆蓋索引

一個索引包含（或者說覆蓋）全部須要查詢的字段的值

覆蓋索引要存儲索引列的值，只能用b-tree索引作覆蓋索引（不能用哈希索引，全文索引等）

優勢

1. MyISAM存儲引擎在內存中只存儲索引，覆蓋索引不須要進行系統調用；

2. innodb存儲引擎的聚簇索引機制，二級主鍵若是能覆蓋查詢，能夠避免對主鍵索引的二次查詢；

全文索引

但願經過關鍵字的匹配來進行查詢過濾，而不是經過常規的數值比較，範圍過濾操做；

MyISAM的全文索引是一類特殊的B-Tree索引，共有兩層，第一層是全部關鍵字，對於每個關鍵字的第二層，包含的是一組相關的「文檔指針」；

對於文檔對象中的全部詞語的過濾條件：

1. 停用詞列表中的詞語都不會被索引

2. 長度大於指定範圍和小於指定範圍的詞語不會被索引

另外，全文索引不會存儲關鍵字具體匹配在哪一列。

1. 天然語言全文索引

根據where子句中的MATCH AGAINST區分是否使用全文索引

Eg.在表file_text的字段title，description上創建fulltext全文索引

Select film_id,title,right(description,25)

Match(title,description) against(‘factory casualties’) as relevance

From file_text where Match(title,description) against(‘factory casualties’);

結果：

Film_id title right(description,25) relevance

831 spirited casualties a car is a baloon factory 8.4692449702

126 casualties encino face a boy in a monastery 5.2615661621

... ...

函數match()將返回關鍵詞的匹配相關度，是一個浮點數。

2. 布爾全文索引

用戶能夠自定義被搜索詞語的相關性；用戶能夠經過一些前置修飾符定製搜索：
example meaning

Dinosaur 包含dinosaur的行rank值更高

-dinosaur 包含dinosaur的行rank值更低

+dinosaur 行記錄必須包含dinosaur

-dinosaur 行記錄不能包含dinosaur

Dino* 包含以dino開頭的單詞的行rank值更高

Eg. Select film_id,title,right(description,25)

From file_text where Match(title,description) against(‘+factory +casualties’ in boolean mood);

結果：

Film_id title right(description,25)

831 spirited casualties a car is a baloon factory

搜索的關鍵詞是不常見的詞語時，比LIKE操做要快得多，由於是直接從索引中過濾記錄。

全文索引的限制：

1. mysql的全文索引只有一種判斷相關性的方法：詞頻。沒有其餘相關性排序算法，如存儲的位置。

2. 只有全文索引所有在內存中時，性能才能很是好

3. 其餘的where條件，只能在mysql完成全文搜索返回記錄後才能進行

4. 全文索引不能存儲列的實際值，不能用做覆蓋掃描

5. 除了相關性排序，不能用做其餘排序

配置和優化

1. 停用詞表

2. 容許最小詞長

在搜索的精度和搜索的效率之間找到合適的平衡點。

索引和鎖

索引可讓查詢鎖定更少的行，innodb只有在訪問行時纔會對其加鎖，而索引能夠減小innodb訪問的行數，從而減小鎖的數量；

可是，只有當innodb在存儲引擎層可以過濾掉不須要的行時纔有效，若是沒法過濾，那麼在innodb檢索到數據並返回給服務器層，mysql才能應用where語句進行過濾，而innodb已經鎖住了這些行，直到服務器層過濾完成後釋放鎖；

如：select actor_id from sakila.actor where actor_id < 5 (範圍)and actor_id <> 1 (過濾) for update;

執行explain命令，顯示type爲range，表示mysql爲該查詢選擇的執行計劃是索引範圍查詢，即在存儲引擎層只執行了actor_id < 5的條件，查詢結果：2,3,4；而被鎖定的數據行：1,2,3,4；

即便使用索引，也可能鎖住一些不須要的行，可是不使用索引查找的話mysql會全表掃描並鎖住全部的行。

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。