MySQL的鎖機制

MySQL的鎖機制

 

咱們最簡單的例子提及。常常有朋友發給我一個SQL,而後問我,這個SQL加什麼鎖?就如同下面兩條簡單的SQL,他們加什麼鎖?數據庫

  • SQL1:select * from t1 where id = 10;
  • SQL2:delete from t1 where id = 10;

針對這個問題?我能想象到的一個結論是:併發

  • SQL1:不加鎖。由於MySQL是使用多版本併發控制的,讀不加鎖。
  • SQL2:對id = 10的記錄加寫鎖 (走主鍵索引)。

這個對嗎?說不上來。便可能是正確的,也有多是錯誤的,已知條件不足。若是讓我來回復這個問題,我必須還要知道如下的一些前提,前提不一樣,結論也就不一樣。這個問題,還缺乏哪些前提條件?優化

前提一:id列是否是主鍵?spa

前提二:當前系統的隔離級別是什麼?3d

前提三:id列若是不是主鍵,那麼id列上有索引嗎?對象

前提四:id列上若是有二級索引,那麼這個索引是惟一索引嗎?blog

前提五:兩個SQL的執行計劃是什麼?索引掃描?全表掃描?索引

沒有這些前提,直接就給定一條SQL,而後問這個SQL會加什麼鎖,都是很業餘的表現。而當這些問題有了明確的以後,給定的SQL會加什麼鎖,也就一目瞭然。下面,我將這些問題進行組合,而後按照從易到難的順序,逐個分析每種組合下,對應的SQL會加哪些鎖?事務

先來溫習下事物的隔離級別和鎖的知識:it

MySQL的鎖機制

 

共享鎖【S鎖】

又稱讀鎖,若事務T對數據對象A加上S鎖,則事務T能夠讀A但不能修改A,其餘事務只能再對A加S鎖,而不能加X鎖,直到T釋放A上的S鎖。這保證了其餘事務能夠讀A,但在T釋放A上的S鎖以前不能對A作任何修改。

排他鎖【X鎖】

又稱寫鎖。若事務T對數據對象A加上X鎖,事務T能夠讀A也能夠修改A,其餘事務不能再對A加任何鎖,直到T釋放A上的鎖。這保證了其餘事務在T釋放A上的鎖以前不能再讀取和修改A。

下面的這些組合,我作了一個前提假設,也就是有索引時,執行計劃必定會選擇使用索引進行過濾 (索引掃描)。但實際狀況會複雜不少,真正的執行計劃,仍是須要根據MySQL輸出的爲準。

  • 組合一:id列是主鍵,RC隔離級別
  • 組合二:id列是二級惟一索引,RC隔離級別
  • 組合三:id列是二級非惟一索引,RC隔離級別
  • 組合四:id列上沒有索引,RC隔離級別
  • 組合五:id列是主鍵,RR隔離級別
  • 組合六:id列是二級惟一索引,RR隔離級別
  • 組合七:id列是二級非惟一索引,RR隔離級別
  • 組合八:id列上沒有索引,RR隔離級別
  • 組合九:Serializable隔離級別

排列組合尚未列舉徹底,可是看起來,已經不少了。真的有必要這麼複雜嗎?事實上,要分析加鎖,就是須要這麼複雜。可是從另外一個角度來講,只要你選定了一種組合,SQL須要加哪些鎖,其實也就肯定了。接下來,就讓咱們來逐個分析這9種組合下的SQL加鎖策略。

注:在前面八種組合下,也就是RC,RR隔離級別下,SQL1:select操做均不加鎖,採用的是快照讀,所以在下面的討論中就忽略了,主要討論SQL2:delete操做的加鎖。

組合一:id主鍵+RC(Read-Committed級別)

  • 結論:id是主鍵時,此SQL只須要在id=10這條記錄上加X鎖便可。

組合二:id惟一索引+RC

  • 這個組合,id不是主鍵,而是一個Unique的二級索引鍵值。那麼在RC隔離級別下,delete from t1 where id = 10; 須要加什麼鎖呢?見下圖:

MySQL的鎖機制

 

此組合中,id是unique索引,而主鍵是name列。此時,加鎖的狀況因爲組合一有所不一樣。因爲id是unique索引,所以delete語句會選擇走id列的索引進行where條件的過濾,在找到id=10的記錄後,首先會將unique索引上的id=10索引記錄加上X鎖。

同時,會根據讀取到的name列,回主鍵索引(聚簇索引),而後將聚簇索引上的name = ‘d’ 對應的主鍵索引項加X鎖。爲何聚簇索引上的記錄也要加鎖?試想一下,若是併發的一個SQL,是經過主鍵索引來更新:update t1 set id = 100 where name = ‘d';

此時,若是delete語句沒有將主鍵索引上的記錄加鎖,那麼併發的update就會感知不到delete語句的存在,違背了同一記錄上的更新/刪除須要串行執行的約束。

結論:若id列是unique列,其上有unique索引。那麼SQL須要加兩個X鎖,一個對應於id unique索引上的id = 10的記錄,另外一把鎖對應於聚簇索引上的[name=’d’,id=10]的記錄。

這個組合,是最簡單,最容易分析的組合。id是主鍵,Read Committed隔離級別,給定SQL:delete from t1 where id = 10; 只須要將主鍵上,id = 10的記錄加上X鎖便可。以下圖所示:

MySQL的鎖機制

 

組合三:id非惟一索引+RC

相對於組合1、二,組合三又發生了變化,隔離級別仍舊是RC不變,可是id列上的約束又下降了,id列再也不惟一,只有一個普通的索引。假設delete from t1 where id = 10; 語句,仍舊選擇id列上的索引進行過濾where條件,那麼此時會持有哪些鎖?一樣見下圖:

MySQL的鎖機制

 

根據此圖,能夠看到,首先,id列索引上,知足id = 10查詢條件的記錄,均已加鎖。同時,這些記錄對應的主鍵索引上的記錄也都加上了鎖。與組合二惟一的區別在於,組合二最多隻有一個知足等值查詢的記錄,而組合三會將全部知足查詢條件的記錄都加鎖。

結論:若id列上有非惟一索引,那麼對應的全部知足SQL查詢條件的記錄,都會被加鎖。同時,這些記錄在主鍵索引上的記錄,也會被加鎖。

組合四:id無索引+RC

相對於前面三個組合,這是一個比較特殊的狀況。id列上沒有索引,where id = 10;這個過濾條件,無法經過索引進行過濾,那麼只能走全表掃描作過濾。對應於這個組合,SQL會加什麼鎖?或者是換句話說,全表掃描時,會加什麼鎖?這個也有不少:有人說會在表上加X鎖;有人說會將聚簇索引上,選擇出來的id = 10;的記錄加上X鎖。那麼實際狀況呢?請看下圖:

MySQL的鎖機制

 

因爲id列上沒有索引,所以只能走聚簇索引,進行所有掃描。從圖中能夠看到,知足刪除條件的記錄有兩條,可是,聚簇索引上全部的記錄,都被加上了X鎖。不管記錄是否知足條件,所有被加上X鎖。既不是加表鎖,也不是在知足條件的記錄上加行鎖。

有人可能會問?爲何不是隻在知足條件的記錄上加鎖呢?這是因爲MySQL的實現決定的。若是一個條件沒法經過索引快速過濾,那麼存儲引擎層面就會將全部記錄加鎖後返回,而後由MySQL Server層進行過濾。所以也就把全部的記錄,都鎖上了。

注:在實際的實現中,MySQL有一些改進,在MySQL Server過濾條件,發現不知足後,會調用unlock_row方法,把不知足條件的記錄放鎖 (違背了2PL的約束)。這樣作,保證了最後只會持有知足條件記錄上的鎖,可是每條記錄的加鎖操做仍是不能省略的。

結論:若id列上沒有索引,SQL會走聚簇索引的全掃描進行過濾,因爲過濾是由MySQL Server層面進行的。所以每條記錄,不管是否知足條件,都會被加上X鎖。可是,爲了效率考量,MySQL作了優化,對於不知足條件的記錄,會在判斷後放鎖,最終持有的,是知足條件的記錄上的鎖,可是不知足條件的記錄上的加鎖/放鎖動做不會省略。同時,優化也違背了2PL的約束。

組合五:id主鍵+RR

上面的四個組合,都是在Read Committed隔離級別下的加鎖行爲,接下來的四個組合,是在Repeatable Read隔離級別下的加鎖行爲。

組合五,id列是主鍵列,Repeatable Read隔離級別,針對delete from t1 where id = 10; 這條SQL,加鎖與組合一:[id主鍵,Read Committed]一致。

組合六:id惟一索引+RR

與組合五相似,組合六的加鎖,與組合二:[id惟一索引,Read Committed]一致。兩個X鎖,id惟一索引知足條件的記錄上一個,對應的聚簇索引上的記錄一個。

組合七:id非惟一索引+RR

RC隔離級別容許幻讀,而RR隔離級別,不容許存在幻讀。可是在組合5、組合六中,加鎖行爲又是與RC下的加鎖行爲徹底一致。那麼RR隔離級別下,如何防止幻讀呢?就在組合七中揭曉。

組合七,Repeatable Read隔離級別,id上有一個非惟一索引,執行delete from t1 where id = 10; 假設選擇id列上的索引進行條件過濾,最後的加鎖行爲,是怎麼樣的呢?一樣看下面這幅圖:

MySQL的鎖機制

 

此圖,相對於組合三:[id列上非惟一鎖,Read Committed]看似相同,其實卻有很大的區別。最大的區別在於,這幅圖中多了一個GAP鎖,並且GAP鎖看起來也不是加在記錄上的,倒像是加載兩條記錄之間的位置,GAP鎖有何用?

其實這個多出來的GAP鎖,就是RR隔離級別,相對於RC隔離級別,不會出現幻讀的關鍵。確實,GAP鎖鎖住的位置,也不是記錄自己,而是兩條記錄之間的GAP。所謂幻讀,就是同一個事務,連續作兩次當前讀 (例如:select * from t1 where id = 10 for update;),那麼這兩次當前讀返回的是徹底相同的記錄 (記錄數量一致,記錄自己也一致),第二次的當前讀,不會比第一次返回更多的記錄 (幻象)。

如何保證兩次當前讀返回一致的記錄,那就須要在第一次當前讀與第二次當前讀之間,其餘的事務不會插入新的知足條件的記錄並提交。爲了實現這個功能,GAP鎖應運而生。

如圖中所示,有哪些位置能夠插入新的知足條件的項 (id = 10),考慮到B+樹索引的有序性,知足條件的項必定是連續存放的。記錄[6,c]以前,不會插入id=10的記錄;[6,c]與[10,b]間能夠插入[10, aa];[10,b]與[10,d]間,能夠插入新的[10,bb],[10,c]等;[10,d]與[11,f]間能夠插入知足條件的[10,e],[10,z]等;而[11,f]以後也不會插入知足條件的記錄。所以,爲了保證[6,c]與[10,b]間,[10,b]與[10,d]間,[10,d]與[11,f]不會插入新的知足條件的記錄,MySQL選擇了用GAP鎖,將這三個GAP給鎖起來。

Insert操做,如insert [10,aa],首先會定位到[6,c]與[10,b]間,而後在插入前,會檢查這個GAP是否已經被鎖上,若是被鎖上,則Insert不能插入記錄。所以,經過第一遍的當前讀,不只將知足條件的記錄鎖上 (X鎖),與組合三相似。同時仍是增長3把GAP鎖,將可能插入知足條件記錄的3個GAP給鎖上,保證後續的Insert不能插入新的id=10的記錄,也就杜絕了同一事務的第二次當前讀,出現幻象的狀況。

有心的朋友看到這兒,能夠會問:既然防止幻讀,須要靠GAP鎖的保護,爲何組合5、組合六,也是RR隔離級別,卻不須要加GAP鎖呢?

首先,這是一個好問題。其次,這個問題,也很簡單。GAP鎖的目的,是爲了防止同一事務的兩次當前讀,出現幻讀的狀況。而組合五,id是主鍵;組合六,id是unique鍵,都可以保證惟一性。一個等值查詢,最多隻能返回一條記錄,並且新的相同取值的記錄,必定不會在新插入進來,所以也就避免了GAP鎖的使用。其實,針對此問題,還有一個更深刻的問題:若是組合5、組合六下,針對SQL:select * from t1 where id = 10 for update; 第一次查詢,沒有找到知足查詢條件的記錄,那麼GAP鎖是否還可以省略?此問題留給你們思考。

結論:Repeatable Read隔離級別下,id列上有一個非惟一索引,對應SQL:delete from t1 where id = 10; 首先,經過id索引定位到第一條知足查詢條件的記錄,加記錄上的X鎖,加GAP上的GAP鎖,而後加主鍵聚簇索引上的記錄X鎖,而後返回;而後讀取下一條,重複進行。直至進行到第一條不知足條件的記錄[11,f],此時,不須要加記錄X鎖,可是仍舊須要加GAP鎖,最後返回結束。

組合八:id無索引+RR

組合八,Repeatable Read隔離級別下的最後一種狀況,id列上沒有索引。此時SQL:delete from t1 where id = 10; 沒有其餘的路徑能夠選擇,只能進行全表掃描。最終的加鎖狀況,以下圖所示:

MySQL的鎖機制

 

如圖,這是一個很恐怖的現象。首先,聚簇索引上的全部記錄,都被加上了X鎖。其次,聚簇索引每條記錄間的間隙(GAP),也同時被加上了GAP鎖。這個示例表,只有6條記錄,一共須要6個記錄鎖,7個GAP鎖。試想,若是表上有1000萬條記錄呢?

在這種狀況下,這個表上,除了不加鎖的快照度,其餘任何加鎖的併發SQL,均不能執行,不能更新,不能刪除,不能插入,全表被鎖死。

固然,跟組合四:[id無索引, Read Committed]相似,這個狀況下,MySQL也作了一些優化,就是所謂的semi-consistent read。semi-consistent read開啓的狀況下,對於不知足查詢條件的記錄,MySQL會提早放鎖。針對上面的這個用例,就是除了記錄[d,10],[g,10]以外,全部的記錄鎖都會被釋放,同時不加GAP鎖。semi-consistent read如何觸發:要麼是read committed隔離級別;要麼是Repeatable Read隔離級別,同時設置了innodb_locks_unsafe_for_binlog 參數。

結論:在Repeatable Read隔離級別下,若是進行全表掃描的當前讀,那麼會鎖上表中的全部記錄,同時會鎖上聚簇索引內的全部GAP,杜絕全部的併發 更新/刪除/插入 操做。固然,也能夠經過觸發semi-consistent read,來緩解加鎖開銷與併發影響,可是semi-consistent read自己也會帶來其餘問題,不建議使用。

組合九:Serializable

針對前面提到的簡單的SQL,最後一個狀況:Serializable隔離級別。對於SQL2:delete from t1 where id = 10; 來講,Serializable隔離級別與Repeatable Read隔離級別徹底一致,所以不作介紹。

Serializable隔離級別,影響的是SQL1:select * from t1 where id = 10; 這條SQL,在RC,RR隔離級別下,都是快照讀,不加鎖。可是在Serializable隔離級別,SQL1會加讀鎖,也就是說快照讀不復存在,MVCC併發控制降級爲Lock-Based CC。

結論:在MySQL/InnoDB中,所謂的讀不加鎖,並不適用於全部的狀況,而是隔離級別相關的。Serializable隔離級別,讀不加鎖就再也不成立,全部的讀操做,都是當前讀。

一條複雜的SQL

寫到這裏,其實MySQL的加鎖實現也已經介紹的八八九九。只要將本文上面的分析思路,大部分的SQL,都能分析出其會加哪些鎖。而這裏,再來看一個稍微複雜點的SQL,用於說明MySQL加鎖的另一個邏輯。SQL用例以下:

MySQL的鎖機制

 

如圖中的SQL,會加什麼鎖?假定在Repeatable Read隔離級別下 (Read Committed隔離級別下的加鎖狀況,留給讀者分析。),同時,假設SQL走的是idx_t1_pu索引。

在詳細分析這條SQL的加鎖狀況前,還須要有一個知識儲備,那就是一個SQL中的where條件如何拆分?具體的介紹,建議閱讀我以前的一篇文章:SQL中的where條件,在數據庫中提取與應用淺析 。在這裏,我直接給出分析後的結果:

  • Index key:pubtime > 1 and puptime < 20。此條件,用於肯定SQL在idx_t1_pu索引上的查詢範圍。
  • Index Filter:userid = ‘hdc’ 。此條件,能夠在idx_t1_pu索引上進行過濾,但不屬於Index Key。
  • Table Filter:comment is not NULL。此條件,在idx_t1_pu索引上沒法過濾,只能在聚簇索引上過濾。

在分析出SQL where條件的構成以後,再來看看這條SQL的加鎖狀況 (RR隔離級別),以下圖所示:

MySQL的鎖機制

 

從圖中能夠看出,在Repeatable Read隔離級別下,由Index Key所肯定的範圍,被加上了GAP鎖;Index Filter鎖給定的條件 (userid = ‘hdc’)什麼時候過濾,視MySQL的版本而定,在MySQL 5.6版本以前,不支持Index Condition Pushdown(ICP),所以Index Filter在MySQL Server層過濾,在5.6後支持了Index Condition Pushdown,則在index上過濾。若不支持ICP,不知足Index Filter的記錄,也須要加上記錄X鎖,若支持ICP,則不知足Index Filter的記錄,無需加記錄X鎖 (圖中,用紅色箭頭標出的X鎖,是否要加,視是否支持ICP而定);而Table Filter對應的過濾條件,則在聚簇索引中讀取後,在MySQL Server層面過濾,所以聚簇索引上也須要X鎖。最後,選取出了一條知足條件的記錄[8,hdc,d,5,good],可是加鎖的數量,要遠遠大於知足條件的記錄數量。

結論:在Repeatable Read隔離級別下,針對一個複雜的SQL,首先須要提取其where條件。Index Key肯定的範圍,須要加上GAP鎖;Index Filter過濾條件,視MySQL版本是否支持ICP,若支持ICP,則不知足Index Filter的記錄,不加X鎖,不然須要X鎖;Table Filter過濾條件,不管是否知足,都須要加X鎖。

相關文章
相關標籤/搜索