MySQL 加鎖處理分析（二）

時間 2019-11-13

標籤 mysql 加鎖處理分析欄目 MySQL 简体版

原文原文鏈接

備註：上接 MySQL 加鎖處理分析（一）html

2.一條簡單SQL的加鎖實現分析

在介紹完一些背景知識以後，本文接下來將選擇幾個有表明性的例子，來詳細分析MySQL的加鎖處理。固然，仍是從最簡單的例子提及。常常有朋友發給我一個SQL，而後問我，這個SQL加什麼鎖？就如同下面兩條簡單的SQL，他們加什麼鎖？mysql

SQL1：select * from t1 where id = 10;sql
SQL2：delete from t1 where id = 10;併發

針對這個問題，該怎麼回答？我能想象到的一個答案是：優化

SQL1：不加鎖。由於MySQL是使用多版本併發控制的，讀不加鎖。spa
SQL2：對id = 10的記錄加寫鎖 (走主鍵索引)。.net

這個答案對嗎？說不上來。便可能是正確的，也有多是錯誤的，已知條件不足，這個問題沒有答案。若是讓我來回答這個問題，我必須還要知道如下的一些前提，前提不一樣，我能給出的答案也就不一樣。要回答這個問題，還缺乏哪些前提條件？htm

前提一：id列是否是主鍵？blog

前提二：當前系統的隔離級別是什麼？索引

前提三：id列若是不是主鍵，那麼id列上有索引嗎？

前提四：id列上若是有二級索引，那麼這個索引是惟一索引嗎？

前提五：兩個SQL的執行計劃是什麼？索引掃描？全表掃描？

沒有這些前提，直接就給定一條SQL，而後問這個SQL會加什麼鎖，都是很業餘的表現。而當這些問題有了明確的回答以後，給定的SQL會加什麼鎖，也就一目瞭然。下面，我將這些問題的答案進行組合，而後依照從易到難的順序，逐個分析每種組合下，對應的SQL會加哪些鎖？

注：下面的這些組合，我作了一個前提假設，也就是有索引時，執行計劃必定會選擇使用索引進行過濾 (索引掃描)。但實際狀況會複雜不少，真正的執行計劃，仍是須要根據MySQL輸出的爲準。

組合一：id列是主鍵，RC隔離級別
組合二：id列是二級惟一索引，RC隔離級別
組合三：id列是二級非惟一索引，RC隔離級別
組合四：id列上沒有索引，RC隔離級別
組合五：id列是主鍵，RR隔離級別
組合六：id列是二級惟一索引，RR隔離級別
組合七：id列是二級非惟一索引，RR隔離級別
組合八：id列上沒有索引，RR隔離級別
組合九：Serializable隔離級別

排列組合尚未列舉徹底，可是看起來，已經不少了。真的有必要這麼複雜嗎？事實上，要分析加鎖，就是須要這麼複雜。可是從另外一個角度來講，只要你選定了一種組合，SQL須要加哪些鎖，其實也就肯定了。接下來，就讓咱們來逐個分析這9種組合下的SQL加鎖策略。

注：在前面八種組合下，也就是RC，RR隔離級別下，SQL1：select操做均不加鎖，採用的是快照讀，所以在下面的討論中就忽略了，主要討論SQL2：delete操做的加鎖。

組合一：id主鍵+RC

這個組合，是最簡單，最容易分析的組合。id是主鍵，Read Committed隔離級別，給定SQL：delete from t1 where id = 10; 只須要將主鍵上，id = 10的記錄加上X鎖便可。以下圖所示：

結論：id是主鍵時，此SQL只須要在id=10這條記錄上加X鎖便可。

組合二：id惟一索引+RC

這個組合，id不是主鍵，而是一個Unique的二級索引鍵值。那麼在RC隔離級別下，delete from t1 where id = 10; 須要加什麼鎖呢？見下圖：

此組合中，id是unique索引，而主鍵是name列。此時，加鎖的狀況因爲組合一有所不一樣。因爲id是unique索引，所以delete語句會選擇走id列的索引進行where條件的過濾，在找到id=10的記錄後，首先會將unique索引上的id=10索引記錄加上X鎖，同時，會根據讀取到的name列，回主鍵索引(聚簇索引)，而後將聚簇索引上的name = ‘d’ 對應的主鍵索引項加X鎖。爲何聚簇索引上的記錄也要加鎖？試想一下，若是併發的一個SQL，是經過主鍵索引來更新：update t1 set id = 100 where name = ‘d'; 此時，若是delete語句沒有將主鍵索引上的記錄加鎖，那麼併發的update就會感知不到delete語句的存在，違背了同一記錄上的更新/刪除須要串行執行的約束。

結論：若id列是unique列，其上有unique索引。那麼SQL須要加兩個X鎖，一個對應於id unique索引上的id = 10的記錄，另外一把鎖對應於聚簇索引上的[name=’d’,id=10]的記錄。

組合三：id非惟一索引+RC

相對於組合1、二，組合三又發生了變化，隔離級別仍舊是RC不變，可是id列上的約束又下降了，id列再也不惟一，只有一個普通的索引。假設 delete from t1 where id = 10; 語句，仍舊選擇id列上的索引進行過濾where條件，那麼此時會持有哪些鎖？一樣見下圖：

根據此圖，能夠看到，首先，id列索引上，知足id = 10查詢條件的記錄，均已加鎖。同時，這些記錄對應的主鍵索引上的記錄也都加上了鎖。與組合二惟一的區別在於，組合二最多隻有一個知足等值查詢的記錄，而組合三會將全部知足查詢條件的記錄都加鎖。

結論：若id列上有非惟一索引，那麼對應的全部知足SQL查詢條件的記錄，都會被加鎖。同時，這些記錄在主鍵索引上的記錄，也會被加鎖。

組合四：id無索引+RC

相對於前面三個組合，這是一個比較特殊的狀況。id列上沒有索引，where id = 10;這個過濾條件，無法經過索引進行過濾，那麼只能走全表掃描作過濾。對應於這個組合，SQL會加什麼鎖？或者是換句話說，全表掃描時，會加什麼鎖？這個答案也有不少：有人說會在表上加X鎖；有人說會將聚簇索引上，選擇出來的id = 10;的記錄加上X鎖。那麼實際狀況呢？請看下圖：

因爲id列上沒有索引，所以只能走聚簇索引，進行所有掃描。從圖中能夠看到，知足刪除條件的記錄有兩條，可是，聚簇索引上全部的記錄，都被加上了X鎖。不管記錄是否知足條件，所有被加上X鎖。既不是加表鎖，也不是在知足條件的記錄上加行鎖。

有人可能會問？爲何不是隻在知足條件的記錄上加鎖呢？這是因爲MySQL的實現決定的。若是一個條件沒法經過索引快速過濾，那麼存儲引擎層面就會將全部記錄加鎖後返回，而後由MySQL Server層進行過濾。所以也就把全部的記錄，都鎖上了。

注：在實際的實現中，MySQL有一些改進，在MySQL Server過濾條件，發現不知足後，會調用unlock_row方法，把不知足條件的記錄放鎖 (違背了2PL的約束)。這樣作，保證了最後只會持有知足條件記錄上的鎖，可是每條記錄的加鎖操做仍是不能省略的。

結論：若id列上沒有索引，SQL會走聚簇索引的全掃描進行過濾，因爲過濾是由MySQL Server層面進行的。所以每條記錄，不管是否知足條件，都會被加上X鎖。可是，爲了效率考量，MySQL作了優化，對於不知足條件的記錄，會在判斷後放鎖，最終持有的，是知足條件的記錄上的鎖，可是不知足條件的記錄上的加鎖/放鎖動做不會省略。同時，優化也違背了2PL的約束。

組合五：id主鍵+RR

上面的四個組合，都是在Read Committed隔離級別下的加鎖行爲，接下來的四個組合，是在Repeatable Read隔離級別下的加鎖行爲。

組合五，id列是主鍵列，Repeatable Read隔離級別，針對delete from t1 where id = 10; 這條SQL，加鎖與組合一：[id主鍵，Read Committed]一致。

組合六：id惟一索引+RR

與組合五相似，組合六的加鎖，與組合二：[id惟一索引，Read Committed]一致。兩個X鎖，id惟一索引知足條件的記錄上一個，對應的聚簇索引上的記錄一個。

組合七：id非惟一索引+RR

還記得前面提到的MySQL的四種隔離級別的區別嗎？RC隔離級別容許幻讀，而RR隔離級別，不容許存在幻讀。可是在組合5、組合六中，加鎖行爲又是與RC下的加鎖行爲徹底一致。那麼RR隔離級別下，如何防止幻讀呢？問題的答案，就在組合七中揭曉。

組合七，Repeatable Read隔離級別，id上有一個非惟一索引，執行delete from t1 where id = 10; 假設選擇id列上的索引進行條件過濾，最後的加鎖行爲，是怎麼樣的呢？一樣看下面這幅圖：

此圖，相對於組合三：[id列上非惟一鎖，Read Committed]看似相同，其實卻有很大的區別。最大的區別在於，這幅圖中多了一個GAP鎖，並且GAP鎖看起來也不是加在記錄上的，倒像是加載兩條記錄之間的位置，GAP鎖有何用？

其實這個多出來的GAP鎖，就是RR隔離級別，相對於RC隔離級別，不會出現幻讀的關鍵。確實，GAP鎖鎖住的位置，也不是記錄自己，而是兩條記錄之間的GAP。所謂幻讀，就是同一個事務，連續作兩次當前讀 (例如：select * from t1 where id = 10 for update;)，那麼這兩次當前讀返回的是徹底相同的記錄 (記錄數量一致，記錄自己也一致)，第二次的當前讀，不會比第一次返回更多的記錄 (幻象)。

如何保證兩次當前讀返回一致的記錄，那就須要在第一次當前讀與第二次當前讀之間，其餘的事務不會插入新的知足條件的記錄並提交。爲了實現這個功能，GAP鎖應運而生。

如圖中所示，有哪些位置能夠插入新的知足條件的項 (id = 10)，考慮到B+樹索引的有序性，知足條件的項必定是連續存放的。記錄[6,c]以前，不會插入id=10的記錄；[6,c] 與[10,b]間能夠插入[10, aa]；[10,b]與[10,d]間，能夠插入新的[10,bb],[10,c]等；[10,d]與[11,f]間能夠插入知足條件的[10,e], [10,z]等；而[11,f]以後也不會插入知足條件的記錄。所以，爲了保證[6,c]與[10,b]間，[10,b]與[10,d]間，[10,d] 與[11,f]不會插入新的知足條件的記錄，MySQL選擇了用GAP鎖，將這三個GAP給鎖起來。

Insert操做，如insert [10,aa]，首先會定位到[6,c]與[10,b]間，而後在插入前，會檢查這個GAP是否已經被鎖上，若是被鎖上，則Insert不能插入記錄。因此，經過第一遍的當前讀，不只將知足條件的記錄鎖上 (X鎖)，與組合三相似。同時仍是增長3把GAP鎖，將可能插入知足條件記錄的3個GAP給鎖上，保證後續的Insert不能插入新的id=10的記錄，也就杜絕了同一事務的第二次當前讀，出現幻象的狀況。

有心的朋友看到這兒，能夠會問：既然防止幻讀，須要靠GAP鎖的保護，爲何組合5、組合六，也是RR隔離級別，卻不須要加GAP鎖呢？

首先，這是一個好問題。其次，回答這個問題，也很簡單。GAP鎖的目的，是爲了防止同一事務的兩次當前讀，出現幻讀的狀況。而組合五，id是主鍵；組合六，id是unique鍵，都可以保證惟一性。一個等值查詢，最多隻能返回一條記錄，並且新的相同取值的記錄，必定不會在新插入進來，所以也就避免了 GAP鎖的使用。其實，針對此問題，還有一個更深刻的問題：若是組合5、組合六下，針對SQL：select * from t1 where id = 10 for update; 第一次查詢，沒有找到知足查詢條件的記錄，那麼GAP鎖是否還可以省略？此問題留給你們思考。

結論：Repeatable Read隔離級別下，id列上有一個非惟一索引，對應SQL：delete from t1 where id = 10; 首先，經過id索引定位到第一條知足查詢條件的記錄，加記錄上的X鎖，加GAP上的GAP鎖，而後加主鍵聚簇索引上的記錄X鎖，而後返回；而後讀取下一條，重複進行。直至進行到第一條不知足條件的記錄[11,f]，此時，不須要加記錄X鎖，可是仍舊須要加GAP鎖，最後返回結束。

組合八：id無索引+RR

組合八，Repeatable Read隔離級別下的最後一種狀況，id列上沒有索引。此時SQL：delete from t1 where id = 10; 沒有其餘的路徑能夠選擇，只能進行全表掃描。最終的加鎖狀況，以下圖所示：

如圖，這是一個很恐怖的現象。首先，聚簇索引上的全部記錄，都被加上了X鎖。其次，聚簇索引每條記錄間的間隙(GAP)，也同時被加上了GAP鎖。這個示例表，只有6條記錄，一共須要6個記錄鎖，7個GAP鎖。試想，若是表上有1000萬條記錄呢？

在這種狀況下，這個表上，除了不加鎖的快照度，其餘任何加鎖的併發SQL，均不能執行，不能更新，不能刪除，不能插入，全表被鎖死。

固然，跟組合四：[id無索引, Read Committed] 相似，這個狀況下，MySQL也作了一些優化，就是所謂的semi-consistent read。semi-consistent read開啓的狀況下，對於不知足查詢條件的記錄，MySQL會提早放鎖。針對上面的這個用例，就是除了記錄[d,10]，[g,10]以外，全部的記錄鎖都會被釋放，同時不加GAP鎖。semi-consistent read如何觸發：要麼是read committed隔離級別；要麼是Repeatable Read隔離級別，同時設置了 innodb_locks_unsafe_for_binlog 參數。更詳細的關於semi-consistent read的介紹，可參考我以前的一篇博客：MySQL+InnoDB semi-consitent read原理及實現分析。

結論：在Repeatable Read隔離級別下，若是進行全表掃描的當前讀，那麼會鎖上表中的全部記錄，同時會鎖上聚簇索引內的全部GAP，杜絕全部的併發更新/刪除/插入操做。固然，也能夠經過觸發semi-consistent read，來緩解加鎖開銷與併發影響，可是semi-consistent read自己也會帶來其餘問題，不建議使用。

組合九：Serializable

針對前面提到的簡單的SQL，最後一個狀況：Serializable隔離級別。對於SQL2：delete from t1 where id = 10; 來講，Serializable隔離級別與Repeatable Read隔離級別徹底一致，所以不作介紹。

Serializable隔離級別，影響的是SQL1：select * from t1 where id = 10; 這條SQL，在RC，RR隔離級別下，都是快照讀，不加鎖。可是在Serializable隔離級別，SQL1會加讀鎖，也就是說快照讀不復存在，MVCC併發控制降級爲Lock-Based CC。

結論：在MySQL/InnoDB中，所謂的讀不加鎖，並不適用於全部的狀況，而是隔離級別相關的。Serializable隔離級別，讀不加鎖就再也不成立，全部的讀操做，都是當前讀。

備註：下接 MySQL 加鎖處理分析（三）