MySQL 加鎖處理分析(二)

備註:上接 MySQL 加鎖處理分析(一)html

 

2.一條簡單SQL的加鎖實現分析

 

在介紹完一些背景知識以後,本文接下來將選擇幾個有表明性的例子,來詳細分析MySQL的加鎖處理。固然,仍是從最簡單的例子提及。常常有朋友發給我一個SQL,而後問我,這個SQL加什麼鎖?就如同下面兩條簡單的SQL,他們加什麼鎖?mysql

 

  • SQL1:select * from t1 where id = 10;sql

  • SQL2:delete from t1 where id = 10;併發

針對這個問題,該怎麼回答?我能想象到的一個答案是:優化

  • SQL1:不加鎖。由於MySQL是使用多版本併發控制的,讀不加鎖。spa

  • SQL2:對id = 10的記錄加寫鎖 (走主鍵索引)。.net

 

這個答案對嗎?說不上來。便可能是正確的,也有多是錯誤的,已知條件不足,這個問題沒有答案。若是讓我來回答這個問題,我必須還要知道如下的一些前提,前提不一樣,我能給出的答案也就不一樣。要回答這個問題,還缺乏哪些前提條件?htm

  • 前提一:id列是否是主鍵?blog

 

  • 前提二:當前系統的隔離級別是什麼?索引

  • 前提三:id列若是不是主鍵,那麼id列上有索引嗎?

  • 前提四:id列上若是有二級索引,那麼這個索引是惟一索引嗎?

  • 前提五:兩個SQL的執行計劃是什麼?索引掃描?全表掃描?

沒有這些前提,直接就給定一條SQL,而後問這個SQL會加什麼鎖,都是很業餘的表現。而當這些問題有了明確的回答以後,給定的SQL會加什麼鎖,也就一目瞭然。下面,我將這些問題的答案進行組合,而後依照從易到難的順序,逐個分析每種組合下,對應的SQL會加哪些鎖?

注:下面的這些組合,我作了一個前提假設,也就是有索引時,執行計劃必定會選擇使用索引進行過濾 (索引掃描)。但實際狀況會複雜不少,真正的執行計劃,仍是須要根據MySQL輸出的爲準。

  • 組合一id列是主鍵,RC隔離級別

  • 組合二id列是二級惟一索引,RC隔離級別

  • 組合三id列是二級非惟一索引,RC隔離級別

  • 組合四id列上沒有索引,RC隔離級別

  • 組合五id列是主鍵,RR隔離級別

  • 組合六id列是二級惟一索引,RR隔離級別

  • 組合七id列是二級非惟一索引,RR隔離級別

  • 組合八id列上沒有索引,RR隔離級別

  • 組合九Serializable隔離級別

 

排列組合尚未列舉徹底,可是看起來,已經不少了。真的有必要這麼複雜嗎?事實上,要分析加鎖,就是須要這麼複雜。可是從另外一個角度來講,只要你選定了一種組合,SQL須要加哪些鎖,其實也就肯定了。接下來,就讓咱們來逐個分析這9種組合下的SQL加鎖策略。

 

注:在前面八種組合下,也就是RC,RR隔離級別下,SQL1:select操做均不加鎖,採用的是快照讀,所以在下面的討論中就忽略了,主要討論SQL2:delete操做的加鎖。

  1. 組合一:id主鍵+RC

 

這個組合,是最簡單,最容易分析的組合。id是主鍵,Read Committed隔離級別,給定SQL:delete from t1 where id = 10; 只須要將主鍵上,id = 10的記錄加上X鎖便可。以下圖所示:

id主鍵+rc

結論:id是主鍵時,此SQL只須要在id=10這條記錄上加X鎖便可。

 

  1. 組合二:id惟一索引+RC

 

這個組合,id不是主鍵,而是一個Unique的二級索引鍵值。那麼在RC隔離級別下,delete from t1 where id = 10; 須要加什麼鎖呢?見下圖:

id unique+rc

此組合中,id是unique索引,而主鍵是name列。此時,加鎖的狀況因爲組合一有所不一樣。因爲id是unique索引,所以delete語句 會選擇走id列的索引進行where條件的過濾,在找到id=10的記錄後,首先會將unique索引上的id=10索引記錄加上X鎖,同時,會根據讀取 到的name列,回主鍵索引(聚簇索引),而後將聚簇索引上的name = ‘d’ 對應的主鍵索引項加X鎖。爲何聚簇索引上的記錄也要加鎖?試想一下,若是併發的一個SQL,是經過主鍵索引來更新:update t1 set id = 100 where name = ‘d'; 此時,若是delete語句沒有將主鍵索引上的記錄加鎖,那麼併發的update就會感知不到delete語句的存在,違背了同一記錄上的更新/刪除須要 串行執行的約束。

 

結論若id列是unique列,其上有unique索引。那麼SQL須要加兩個X鎖,一個對應於id unique索引上的id = 10的記錄,另外一把鎖對應於聚簇索引上的[name=’d’,id=10]的記錄。

 

  1. 組合三:id非惟一索引+RC

 

相對於組合1、二,組合三又發生了變化,隔離級別仍舊是RC不變,可是id列上的約束又下降了,id列再也不惟一,只有一個普通的索引。假設 delete from t1 where id = 10; 語句,仍舊選擇id列上的索引進行過濾where條件,那麼此時會持有哪些鎖?一樣見下圖:

id 非惟一索引+rc

根據此圖,能夠看到,首先,id列索引上,知足id = 10查詢條件的記錄,均已加鎖。同時,這些記錄對應的主鍵索引上的記錄也都加上了鎖。與組合二惟一的區別在於,組合二最多隻有一個知足等值查詢的記錄,而組合三會將全部知足查詢條件的記錄都加鎖。

 

結論若id列上有非惟一索引,那麼對應的全部知足SQL查詢條件的記錄,都會被加鎖。同時,這些記錄在主鍵索引上的記錄,也會被加鎖。

 

  1. 組合四:id無索引+RC

 

相對於前面三個組合,這是一個比較特殊的狀況。id列上沒有索引,where id = 10;這個過濾條件,無法經過索引進行過濾,那麼只能走全表掃描作過濾。對應於這個組合,SQL會加什麼鎖?或者是換句話說,全表掃描時,會加什麼鎖?這 個答案也有不少:有人說會在表上加X鎖;有人說會將聚簇索引上,選擇出來的id = 10;的記錄加上X鎖。那麼實際狀況呢?請看下圖:

id 無索引+rc

因爲id列上沒有索引,所以只能走聚簇索引,進行所有掃描。從圖中能夠看到,知足刪除條件的記錄有兩條,可是,聚簇索引上全部的記錄,都被加上了X鎖。不管記錄是否知足條件,所有被加上X鎖。既不是加表鎖,也不是在知足條件的記錄上加行鎖。

 

有人可能會問?爲何不是隻在知足條件的記錄上加鎖呢?這是因爲MySQL的實現決定的。若是一個條件沒法經過索引快速過濾,那麼存儲引擎層面就會將全部記錄加鎖後返回,而後由MySQL Server層進行過濾。所以也就把全部的記錄,都鎖上了。

 

注:在實際的實現中,MySQL有一些改進,在MySQL Server過濾條件,發現不知足後,會調用unlock_row方法,把不知足條件的記錄放鎖 (違背了2PL的約束)。這樣作,保證了最後只會持有知足條件記錄上的鎖,可是每條記錄的加鎖操做仍是不能省略的。

 

結論:若id列上沒有索 引,SQL會走聚簇索引的全掃描進行過濾,因爲過濾是由MySQL Server層面進行的。所以每條記錄,不管是否知足條件,都會被加上X鎖。可是,爲了效率考量,MySQL作了優化,對於不知足條件的記錄,會在判斷後 放鎖,最終持有的,是知足條件的記錄上的鎖,可是不知足條件的記錄上的加鎖/放鎖動做不會省略。同時,優化也違背了2PL的約束。

 

  1. 組合五:id主鍵+RR

 

上面的四個組合,都是在Read Committed隔離級別下的加鎖行爲,接下來的四個組合,是在Repeatable Read隔離級別下的加鎖行爲。

 

組合五,id列是主鍵列,Repeatable Read隔離級別,針對delete from t1 where id = 10; 這條SQL,加鎖與組合一:[id主鍵,Read Committed]一致。

 

  1. 組合六:id惟一索引+RR

 

與組合五相似,組合六的加鎖,與組合二:[id惟一索引,Read Committed]一致。兩個X鎖,id惟一索引知足條件的記錄上一個,對應的聚簇索引上的記錄一個。

 

  1. 組合七:id非惟一索引+RR

 

還記得前面提到的MySQL的四種隔離級別的區別嗎?RC隔離級別容許幻讀,而RR隔離級別,不容許存在幻讀。可是在組合5、組合六中,加鎖行爲又是與RC下的加鎖行爲徹底一致。那麼RR隔離級別下,如何防止幻讀呢?問題的答案,就在組合七中揭曉。

 

組合七,Repeatable Read隔離級別,id上有一個非惟一索引,執行delete from t1 where id = 10; 假設選擇id列上的索引進行條件過濾,最後的加鎖行爲,是怎麼樣的呢?一樣看下面這幅圖:

id 非惟一索引 + rr

此圖,相對於組合三:[id列上非惟一鎖,Read Committed]看似相同,其實卻有很大的區別。最大的區別在於,這幅圖中多了一個GAP鎖,並且GAP鎖看起來也不是加在記錄上的,倒像是加載兩條記錄之間的位置,GAP鎖有何用?

 

其實這個多出來的GAP鎖,就是RR隔離級別,相對於RC隔離級別,不會出現幻讀的關鍵。確實,GAP鎖鎖住的位置,也不是記錄自己,而是兩條記錄 之間的GAP。所謂幻讀,就是同一個事務,連續作兩次當前讀 (例如:select * from t1 where id = 10 for update;),那麼這兩次當前讀返回的是徹底相同的記錄 (記錄數量一致,記錄自己也一致),第二次的當前讀,不會比第一次返回更多的記錄 (幻象)。

 

如何保證兩次當前讀返回一致的記錄,那就須要在第一次當前讀與第二次當前讀之間,其餘的事務不會插入新的知足條件的記錄並提交。爲了實現這個功能,GAP鎖應運而生。

 

如圖中所示,有哪些位置能夠插入新的知足條件的項 (id = 10),考慮到B+樹索引的有序性,知足條件的項必定是連續存放的。記錄[6,c]以前,不會插入id=10的記錄;[6,c] 與[10,b]間能夠插入[10, aa];[10,b]與[10,d]間,能夠插入新的[10,bb],[10,c]等;[10,d]與[11,f]間能夠插入知足條件的[10,e], [10,z]等;而[11,f]以後也不會插入知足條件的記錄。所以,爲了保證[6,c]與[10,b]間,[10,b]與[10,d]間,[10,d] 與[11,f]不會插入新的知足條件的記錄,MySQL選擇了用GAP鎖,將這三個GAP給鎖起來。

 

Insert操做,如insert [10,aa],首先會定位到[6,c]與[10,b]間,而後在插入前,會檢查這個GAP是否已經被鎖上,若是被鎖上,則Insert不能插入記錄。因 此,經過第一遍的當前讀,不只將知足條件的記錄鎖上 (X鎖),與組合三相似。同時仍是增長3把GAP鎖,將可能插入知足條件記錄的3個GAP給鎖上,保證後續的Insert不能插入新的id=10的記錄, 也就杜絕了同一事務的第二次當前讀,出現幻象的狀況。

 

有心的朋友看到這兒,能夠會問:既然防止幻讀,須要靠GAP鎖的保護,爲何組合5、組合六,也是RR隔離級別,卻不須要加GAP鎖呢?

 

首先,這是一個好問題。其次,回答這個問題,也很簡單。GAP鎖的目的,是爲了防止同一事務的兩次當前讀,出現幻讀的狀況。而組合五,id是主鍵; 組合六,id是unique鍵,都可以保證惟一性。一個等值查詢,最多隻能返回一條記錄,並且新的相同取值的記錄,必定不會在新插入進來,所以也就避免了 GAP鎖的使用。其實,針對此問題,還有一個更深刻的問題:若是組合5、組合六下,針對SQL:select * from t1 where id = 10 for update; 第一次查詢,沒有找到知足查詢條件的記錄,那麼GAP鎖是否還可以省略?此問題留給你們思考。

 

結論:Repeatable Read隔離級別下,id列上有一個非惟一索引,對應SQL:delete from t1 where id = 10; 首先,經過id索引定位到第一條知足查詢條件的記錄,加記錄上的X鎖,加GAP上的GAP鎖,而後加主鍵聚簇索引上的記錄X鎖,而後返回;而後讀取下一 條,重複進行。直至進行到第一條不知足條件的記錄[11,f],此時,不須要加記錄X鎖,可是仍舊須要加GAP鎖,最後返回結束。

 

  1. 組合八:id無索引+RR

 

組合八,Repeatable Read隔離級別下的最後一種狀況,id列上沒有索引。此時SQL:delete from t1 where id = 10; 沒有其餘的路徑能夠選擇,只能進行全表掃描。最終的加鎖狀況,以下圖所示:

id 無索引+rr

如圖,這是一個很恐怖的現象。首先,聚簇索引上的全部記錄,都被加上了X鎖。其次,聚簇索引每條記錄間的間隙(GAP),也同時被加上了GAP鎖。這個示例表,只有6條記錄,一共須要6個記錄鎖,7個GAP鎖。試想,若是表上有1000萬條記錄呢?

 

在這種狀況下,這個表上,除了不加鎖的快照度,其餘任何加鎖的併發SQL,均不能執行,不能更新,不能刪除,不能插入,全表被鎖死。

 

固然,跟組合四:[id無索引, Read Committed] 相似,這個狀況下,MySQL也作了一些優化,就是所謂的semi-consistent read。semi-consistent read開啓的狀況下,對於不知足查詢條件的記錄,MySQL會提早放鎖。針對上面的這個用例,就是除了記錄[d,10],[g,10]以外,全部的記錄 鎖都會被釋放,同時不加GAP鎖。semi-consistent read如何觸發:要麼是read committed隔離級別;要麼是Repeatable Read隔離級別,同時設置了 innodb_locks_unsafe_for_binlog 參數。更詳細的關於semi-consistent read的介紹,可參考我以前的一篇博客:MySQL+InnoDB semi-consitent read原理及實現分析

 

結論:在Repeatable Read隔離級別下,若是進行全表掃描的當前讀,那麼會鎖上表中的全部記錄,同時會鎖上聚簇索引內的全部GAP,杜絕全部的併發 更新/刪除/插入 操做。固然,也能夠經過觸發semi-consistent read,來緩解加鎖開銷與併發影響,可是semi-consistent read自己也會帶來其餘問題,不建議使用。

 

  1. 組合九:Serializable

 

針對前面提到的簡單的SQL,最後一個狀況:Serializable隔離級別。對於SQL2:delete from t1 where id = 10; 來講,Serializable隔離級別與Repeatable Read隔離級別徹底一致,所以不作介紹。

 

Serializable隔離級別,影響的是SQL1:select * from t1 where id = 10; 這條SQL,在RC,RR隔離級別下,都是快照讀,不加鎖。可是在Serializable隔離級別,SQL1會加讀鎖,也就是說快照讀不復存 在,MVCC併發控制降級爲Lock-Based CC。

 

結論:在MySQL/InnoDB中,所謂的讀不加鎖,並不適用於全部的狀況,而是隔離級別相關的。Serializable隔離級別,讀不加鎖就再也不成立,全部的讀操做,都是當前讀。

備註:下接 MySQL 加鎖處理分析(三)

相關文章
相關標籤/搜索