1 背景 1
html
1.1 MVCC:Snapshot Read vs Current Read 2mysql
1.3 2PL:Two-Phase Locking 3數據庫
MySQL/InnoDB的加鎖分析,一直是一個比較困難的話題。我在工做過程當中,常常會有同事諮詢這方面的問題。同時,微博上也常常會收到MySQL鎖相關的私信,讓我幫助解決一些死鎖的問題。本文,準備就MySQL/InnoDB的加鎖問題,展開較爲深刻的分析與討論,主要是介紹一種思路,運用此思路,拿到任何一條SQL語句,都能完整的分析出這條語句會加什麼鎖?會有什麼樣的使用風險?甚至是分析線上的一個死鎖場景,瞭解死鎖產生的緣由。
注:MySQL是一個支持插件式存儲引擎的數據庫系統。本文下面的全部介紹,都是基於InnoDB存儲引擎,其餘引擎的表現,會有較大的區別。
MySQL InnoDB存儲引擎,實現的是基於多版本的併發控制協議——MVCC (Multi-Version Concurrency Control) (注:與MVCC相對的,是基於鎖的併發控制,Lock-Based Concurrency Control)。MVCC最大的好處,相信也是耳熟能詳:讀不加鎖,讀寫不衝突。在讀多寫少的OLTP應用中,讀寫不衝突是很是重要的,極大的增長了系統的併發性能,這也是爲何現階段,幾乎全部的RDBMS,都支持了MVCC。
在MVCC併發控制中,讀操做能夠分紅兩類:快照讀 (snapshot read)與當前讀 (current read)。快照讀,讀取的是記錄的可見版本 (有多是歷史版本),不用加鎖。當前讀,讀取的是記錄的最新版本,而且,當前讀返回的記錄,都會加上鎖,保證其餘事務不會再併發修改這條記錄。
在一個支持MVCC併發控制的系統中,哪些讀操做是快照讀?哪些操做又是當前讀呢?以MySQL InnoDB爲例:
全部以上的語句,都屬於當前讀,讀取記錄的最新版本。而且,讀取以後,還須要保證其餘併發事務不能修改當前記錄,對讀取記錄加鎖。其中,除了第一條語句,對讀取記錄加S鎖 (共享鎖)外,其餘的操做,都加的是X鎖 (排它鎖)。
爲何將 插入/更新/刪除 操做,都歸爲當前讀?能夠看看下面這個 更新 操做,在數據庫中的執行流程:
從圖中,能夠看到,一個Update操做的具體流程。當Update SQL被髮給MySQL後,MySQL Server會根據where條件,讀取第一條知足條件的記錄,而後InnoDB引擎會將第一條記錄返回,並加鎖 (current read)。待MySQL Server收到這條加鎖的記錄以後,會再發起一個Update請求,更新這條記錄。一條記錄操做完成,再讀取下一條記錄,直至沒有知足條件的記錄爲止。所以,Update操做內部,就包含了一個當前讀。同理,Delete操做也同樣。Insert操做會稍微有些不一樣,簡單來講,就是Insert操做可能會觸發Unique Key的衝突檢查,也會進行一個當前讀。
注:根據上圖的交互,針對一條當前讀的SQL語句,InnoDB與MySQL Server的交互,是一條一條進行的,所以,加鎖也是一條一條進行的。先對一條知足條件的記錄加鎖,返回給MySQL Server,作一些DML操做;而後在讀取下一條加鎖,直至讀取完畢。
InnoDB存儲引擎的數據組織方式,是聚簇索引表:完整的記錄,存儲在主鍵索引中,經過主鍵索引,就能夠獲取記錄全部的列。關於聚簇索引表的組織方式,能夠參考MySQL的官方文檔:Clustered and Secondary Indexes 。本文假設讀者對這個,已經有了必定的認識,就再也不作具體的介紹。接下來的部分,主鍵索引/聚簇索引 兩個名稱,會有一些混用,望讀者知曉。
傳統RDBMS加鎖的一個原則,就是2PL (二階段鎖):Two-Phase Locking。相對而言,2PL比較容易理解,說的是鎖操做分爲兩個階段:加鎖階段與解鎖階段,而且保證加鎖階段與解鎖階段不相交。下面,仍舊以MySQL爲例,來簡單看看2PL在MySQL中的實現。
從上圖能夠看出,2PL就是將加鎖/解鎖分爲兩個徹底不相交的階段。加鎖階段:只加鎖,不放鎖。解鎖階段:只放鎖,不加鎖。
隔離級別:Isolation Level,也是RDBMS的一個關鍵特性。相信對數據庫有所瞭解的朋友,對於4種隔離級別:Read Uncommited,Read Committed,Repeatable Read,Serializable,都有了深刻的認識。本文不打算討論數據庫理論中,是如何定義這4種隔離級別的含義的,而是跟你們介紹一下MySQL/InnoDB是如何定義這4種隔離級別的。
MySQL/InnoDB定義的4種隔離級別:
能夠讀取未提交記錄。此隔離級別,不會使用,忽略。
快照讀忽略,本文不考慮。
針對當前讀,RC隔離級別保證對讀取到的記錄加鎖 (記錄鎖),存在幻讀現象。
快照讀忽略,本文不考慮。
針對當前讀,RR隔離級別保證對讀取到的記錄加鎖 (記錄鎖),同時保證對讀取的範圍加鎖,新的知足查詢條件的記錄不可以插入 (間隙鎖),不存在幻讀現象。
從MVCC併發控制退化爲基於鎖的併發控制。不區別快照讀與當前讀,全部的讀操做均爲當前讀,讀加讀鎖 (S鎖),寫加寫鎖 (X鎖)。
Serializable隔離級別下,讀寫衝突,所以併發度急劇降低,在MySQL/InnoDB下不建議使用。
在介紹完一些背景知識以後,本文接下來將選擇幾個有表明性的例子,來詳細分析MySQL的加鎖處理。固然,仍是從最簡單的例子提及。常常有朋友發給我一個SQL,而後問我,這個SQL加什麼鎖?就如同下面兩條簡單的SQL,他們加什麼鎖?
針對這個問題,該怎麼回答?我能想象到的一個答案是:
這個答案對嗎?說不上來。便可能是正確的,也有多是錯誤的,已知條件不足,這個問題沒有答案。若是讓我來回答這個問題,我必須還要知道如下的一些前提,前提不一樣,我能給出的答案也就不一樣。要回答這個問題,還缺乏哪些前提條件?
沒有這些前提,直接就給定一條SQL,而後問這個SQL會加什麼鎖,都是很業餘的表現。而當這些問題有了明確的答案以後,給定的SQL會加什麼鎖,也就一目瞭然。下面,我將這些問題的答案進行組合,而後按照從易到難的順序,逐個分析每種組合下,對應的SQL會加哪些鎖?
注:下面的這些組合,我作了一個前提假設,也就是有索引時,執行計劃必定會選擇使用索引進行過濾 (索引掃描)。但實際狀況會複雜不少,真正的執行計劃,仍是須要根據MySQL輸出的爲準。
排列組合尚未列舉徹底,可是看起來,已經不少了。真的有必要這麼複雜嗎?事實上,要分析加鎖,就是須要這麼複雜。可是從另外一個角度來講,只要你選定了一種組合,SQL須要加哪些鎖,其實也就肯定了。接下來,就讓咱們來逐個分析這9種組合下的SQL加鎖策略。
注:在前面八種組合下,也就是RC,RR隔離級別下,SQL1:select操做均不加鎖,採用的是快照讀,所以在下面的討論中就忽略了,主要討論SQL2:delete操做的加鎖。
這個組合,是最簡單,最容易分析的組合。id是主鍵,Read Committed隔離級別,給定SQL:delete from t1 where id = 10; 只須要將主鍵上,id = 10的記錄加上X鎖便可。以下圖所示:
結論:id是主鍵時,此SQL只須要在id=10這條記錄上加X鎖便可。
這個組合,id不是主鍵,而是一個Unique的二級索引鍵值。那麼在RC隔離級別下,delete from t1 where id = 10; 須要加什麼鎖呢?見下圖:
此組合中,id是unique索引,而主鍵是name列。此時,加鎖的狀況因爲組合一有所不一樣。因爲id是unique索引,所以delete語句會選擇走id列的索引進行where條件的過濾,在找到id=10的記錄後,首先會將unique索引上的id=10索引記錄加上X鎖,同時,會根據讀取到的name列,回主鍵索引(聚簇索引),而後將聚簇索引上的name = ‘d’ 對應的主鍵索引項加X鎖。爲何聚簇索引上的記錄也要加鎖?試想一下,若是併發的一個SQL,是經過主鍵索引來更新:update t1 set id = 100 where name = ‘d’; 此時,若是delete語句沒有將主鍵索引上的記錄加鎖,那麼併發的update就會感知不到delete語句的存在,違背了同一記錄上的更新/刪除須要串行執行的約束。
結論:若id列是unique列,其上有unique索引。那麼SQL須要加兩個X鎖,一個對應於id unique索引上的id = 10的記錄,另外一把鎖對應於聚簇索引上的[name='d',id=10]的記錄。
相對於組合1、二,組合三又發生了變化,隔離級別仍舊是RC不變,可是id列上的約束又下降了,id列再也不惟一,只有一個普通的索引。假設delete from t1 where id = 10; 語句,仍舊選擇id列上的索引進行過濾where條件,那麼此時會持有哪些鎖?一樣見下圖:
根據此圖,能夠看到,首先,id列索引上,知足id = 10查詢條件的記錄,均已加鎖。同時,這些記錄對應的主鍵索引上的記錄也都加上了鎖。與組合二惟一的區別在於,組合二最多隻有一個知足等值查詢的記錄,而組合三會將全部知足查詢條件的記錄都加鎖。
結論:若id列上有非惟一索引,那麼對應的全部知足SQL查詢條件的記錄,都會被加鎖。同時,這些記錄在主鍵索引上的記錄,也會被加鎖。
相對於前面三個組合,這是一個比較特殊的狀況。id列上沒有索引,where id = 10;這個過濾條件,無法經過索引進行過濾,那麼只能走全表掃描作過濾。對應於這個組合,SQL會加什麼鎖?或者是換句話說,全表掃描時,會加什麼鎖?這個答案也有不少:有人說會在表上加X鎖;有人說會將聚簇索引上,選擇出來的id = 10;的記錄加上X鎖。那麼實際狀況呢?請看下圖:
因爲id列上沒有索引,所以只能走聚簇索引,進行所有掃描。從圖中能夠看到,知足刪除條件的記錄有兩條,可是,聚簇索引上全部的記錄,都被加上了X鎖。不管記錄是否知足條件,所有被加上X鎖。既不是加表鎖,也不是在知足條件的記錄上加行鎖。
有人可能會問?爲何不是隻在知足條件的記錄上加鎖呢?這是因爲MySQL的實現決定的。若是一個條件沒法經過索引快速過濾,那麼存儲引擎層面就會將全部記錄加鎖後返回,而後由MySQL Server層進行過濾。所以也就把全部的記錄,都鎖上了。
注:在實際的實現中,MySQL有一些改進,在MySQL Server過濾條件,發現不知足後,會調用unlock_row方法,把不知足條件的記錄放鎖 (違背了2PL的約束)。這樣作,保證了最後只會持有知足條件記錄上的鎖,可是每條記錄的加鎖操做仍是不能省略的。
結論:若id列上沒有索引,SQL會走聚簇索引的全掃描進行過濾,因爲過濾是由MySQL Server層面進行的。所以每條記錄,不管是否知足條件,都會被加上X鎖。可是,爲了效率考量,MySQL作了優化,對於不知足條件的記錄,會在判斷後放鎖,最終持有的,是知足條件的記錄上的鎖,可是不知足條件的記錄上的加鎖/放鎖動做不會省略。同時,優化也違背了2PL的約束。
上面的四個組合,都是在Read Committed隔離級別下的加鎖行爲,接下來的四個組合,是在Repeatable Read隔離級別下的加鎖行爲。
組合五,id列是主鍵列,Repeatable Read隔離級別,針對delete from t1 where id = 10; 這條SQL,加鎖與組合一:[id主鍵,Read Committed]一致。
與組合五相似,組合六的加鎖,與組合二:[id惟一索引,Read Committed]一致。兩個X鎖,id惟一索引知足條件的記錄上一個,對應的聚簇索引上的記錄一個。
還記得前面提到的MySQL的四種隔離級別的區別嗎?RC隔離級別容許幻讀,而RR隔離級別,不容許存在幻讀。可是在組合5、組合六中,加鎖行爲又是與RC下的加鎖行爲徹底一致。那麼RR隔離級別下,如何防止幻讀呢?問題的答案,就在組合七中揭曉。
組合七,Repeatable Read隔離級別,id上有一個非惟一索引,執行delete from t1 where id = 10; 假設選擇id列上的索引進行條件過濾,最後的加鎖行爲,是怎麼樣的呢?一樣看下面這幅圖:
此圖,相對於組合三:[id列上非惟一鎖,Read Committed]看似相同,其實卻有很大的區別。最大的區別在於,這幅圖中多了一個GAP鎖,並且GAP鎖看起來也不是加在記錄上的,倒像是加載兩條記錄之間的位置,GAP鎖有何用?
其實這個多出來的GAP鎖,就是RR隔離級別,相對於RC隔離級別,不會出現幻讀的關鍵。確實,GAP鎖鎖住的位置,也不是記錄自己,而是兩條記錄之間的GAP。所謂幻讀,就是同一個事務,連續作兩次當前讀 (例如:select * from t1 where id = 10 for update;),那麼這兩次當前讀返回的是徹底相同的記錄 (記錄數量一致,記錄自己也一致),第二次的當前讀,不會比第一次返回更多的記錄 (幻象)。
如何保證兩次當前讀返回一致的記錄,那就須要在第一次當前讀與第二次當前讀之間,其餘的事務不會插入新的知足條件的記錄並提交。爲了實現這個功能,GAP鎖應運而生。
如圖中所示,有哪些位置能夠插入新的知足條件的項 (id = 10),考慮到B+樹索引的有序性,知足條件的項必定是連續存放的。記錄[6,c]以前,不會插入id=10的記錄;[6,c]與[10,b]間能夠插入[10, aa];[10,b]與[10,d]間,能夠插入新的[10,bb],[10,c]等;[10,d]與[11,f]間能夠插入知足條件的[10,e],[10,z]等;而[11,f]以後也不會插入知足條件的記錄。所以,爲了保證[6,c]與[10,b]間,[10,b]與[10,d]間,[10,d]與[11,f]不會插入新的知足條件的記錄,MySQL選擇了用GAP鎖,將這三個GAP給鎖起來。
Insert操做,如insert [10,aa],首先會定位到[6,c]與[10,b]間,而後在插入前,會檢查這個GAP是否已經被鎖上,若是被鎖上,則Insert不能插入記錄。所以,經過第一遍的當前讀,不只將知足條件的記錄鎖上 (X鎖),與組合三相似。同時仍是增長3把GAP鎖,將可能插入知足條件記錄的3個GAP給鎖上,保證後續的Insert不能插入新的id=10的記錄,也就杜絕了同一事務的第二次當前讀,出現幻象的狀況。
有心的朋友看到這兒,能夠會問:既然防止幻讀,須要靠GAP鎖的保護,爲何組合5、組合六,也是RR隔離級別,卻不須要加GAP鎖呢?
首先,這是一個好問題。其次,回答這個問題,也很簡單。GAP鎖的目的,是爲了防止同一事務的兩次當前讀,出現幻讀的狀況。而組合五,id是主鍵;組合六,id是unique鍵,都可以保證惟一性。一個等值查詢,最多隻能返回一條記錄,並且新的相同取值的記錄,必定不會在新插入進來,所以也就避免了GAP鎖的使用。其實,針對此問題,還有一個更深刻的問題:若是組合5、組合六下,針對SQL:select * from t1 where id = 10 for update; 第一次查詢,沒有找到知足查詢條件的記錄,那麼GAP鎖是否還可以省略?此問題留給你們思考。
結論:Repeatable Read隔離級別下,id列上有一個非惟一索引,對應SQL:delete from t1 where id = 10; 首先,經過id索引定位到第一條知足查詢條件的記錄,加記錄上的X鎖,加GAP上的GAP鎖,而後加主鍵聚簇索引上的記錄X鎖,而後返回;而後讀取下一條,重複進行。直至進行到第一條不知足條件的記錄[11,f],此時,不須要加記錄X鎖,可是仍舊須要加GAP鎖,最後返回結束。
組合八,Repeatable Read隔離級別下的最後一種狀況,id列上沒有索引。此時SQL:delete from t1 where id = 10; 沒有其餘的路徑能夠選擇,只能進行全表掃描。最終的加鎖狀況,以下圖所示:
如圖,這是一個很恐怖的現象。首先,聚簇索引上的全部記錄,都被加上了X鎖。其次,聚簇索引每條記錄間的間隙(GAP),也同時被加上了GAP鎖。這個示例表,只有6條記錄,一共須要6個記錄鎖,7個GAP鎖。試想,若是表上有1000萬條記錄呢?
在這種狀況下,這個表上,除了不加鎖的快照度,其餘任何加鎖的併發SQL,均不能執行,不能更新,不能刪除,不能插入,全表被鎖死。
固然,跟組合四:[id無索引, Read Committed]相似,這個狀況下,MySQL也作了一些優化,就是所謂的semi-consistent read。semi-consistent read開啓的狀況下,對於不知足查詢條件的記錄,MySQL會提早放鎖。針對上面的這個用例,就是除了記錄[d,10],[g,10]以外,全部的記錄鎖都會被釋放,同時不加GAP鎖。semi-consistent read如何觸發:要麼是read committed隔離級別;要麼是Repeatable Read隔離級別,同時設置了innodb_locks_unsafe_for_binlog 參數。更詳細的關於semi-consistent read的介紹,可參考我以前的一篇博客:MySQL+InnoDB semi-consitent read原理及實現分析 。
結論:在Repeatable Read隔離級別下,若是進行全表掃描的當前讀,那麼會鎖上表中的全部記錄,同時會鎖上聚簇索引內的全部GAP,杜絕全部的併發 更新/刪除/插入 操做。固然,也能夠經過觸發semi-consistent read,來緩解加鎖開銷與併發影響,可是semi-consistent read自己也會帶來其餘問題,不建議使用。
針對前面提到的簡單的SQL,最後一個狀況:Serializable隔離級別。對於SQL2:delete from t1 where id = 10; 來講,Serializable隔離級別與Repeatable Read隔離級別徹底一致,所以不作介紹。
Serializable隔離級別,影響的是SQL1:select * from t1 where id = 10; 這條SQL,在RC,RR隔離級別下,都是快照讀,不加鎖。可是在Serializable隔離級別,SQL1會加讀鎖,也就是說快照讀不復存在,MVCC併發控制降級爲Lock-Based CC。
結論:在MySQL/InnoDB中,所謂的讀不加鎖,並不適用於全部的狀況,而是隔離級別相關的。Serializable隔離級別,讀不加鎖就再也不成立,全部的讀操做,都是當前讀。
寫到這裏,其實MySQL的加鎖實現也已經介紹的八八九九。只要將本文上面的分析思路,大部分的SQL,都能分析出其會加哪些鎖。而這裏,再來看一個稍微複雜點的SQL,用於說明MySQL加鎖的另一個邏輯。SQL用例以下:
如圖中的SQL,會加什麼鎖?假定在Repeatable Read隔離級別下 (Read Committed隔離級別下的加鎖狀況,留給讀者分析。),同時,假設SQL走的是idx_t1_pu索引。
在詳細分析這條SQL的加鎖狀況前,還須要有一個知識儲備,那就是一個SQL中的where條件如何拆分?具體的介紹,建議閱讀我以前的一篇文章:SQL中的where條件,在數據庫中提取與應用淺析 。在這裏,我直接給出分析後的結果:
在分析出SQL where條件的構成以後,再來看看這條SQL的加鎖狀況 (RR隔離級別),以下圖所示:
從圖中能夠看出,在Repeatable Read隔離級別下,由Index Key所肯定的範圍,被加上了GAP鎖;Index Filter鎖給定的條件 (userid = ‘hdc’)什麼時候過濾,視MySQL的版本而定,在MySQL 5.6版本以前,不支持Index Condition Pushdown(ICP),所以Index Filter在MySQL Server層過濾,在5.6後支持了Index Condition Pushdown,則在index上過濾。若不支持ICP,不知足Index Filter的記錄,也須要加上記錄X鎖,若支持ICP,則不知足Index Filter的記錄,無需加記錄X鎖 (圖中,用紅色箭頭標出的X鎖,是否要加,視是否支持ICP而定);而Table Filter對應的過濾條件,則在聚簇索引中讀取後,在MySQL Server層面過濾,所以聚簇索引上也須要X鎖。最後,選取出了一條知足條件的記錄[8,hdc,d,5,good],可是加鎖的數量,要遠遠大於知足條件的記錄數量。
結論:在Repeatable Read隔離級別下,針對一個複雜的SQL,首先須要提取其where條件。Index Key肯定的範圍,須要加上GAP鎖;Index Filter過濾條件,視MySQL版本是否支持ICP,若支持ICP,則不知足Index Filter的記錄,不加X鎖,不然須要X鎖;Table Filter過濾條件,不管是否知足,都須要加X鎖。
本文前面的部分,基本上已經涵蓋了MySQL/InnoDB全部的加鎖規則。深刻理解MySQL如何加鎖,有兩個比較重要的做用:
下面,來看看兩個死鎖的例子 (一個是兩個Session的兩條SQL產生死鎖;另外一個是兩個Session的一條SQL,產生死鎖):
上面的兩個死鎖用例。第一個很是好理解,也是最多見的死鎖,每一個事務執行兩條SQL,分別持有了一把鎖,而後加另外一把鎖,產生死鎖。
第二個用例,雖然每一個Session都只有一條語句,仍舊會產生死鎖。要分析這個死鎖,首先必須用到本文前面提到的MySQL加鎖的規則。針對Session 1,從name索引出發,讀到的[hdc, 1],[hdc, 6]均知足條件,不只會加name索引上的記錄X鎖,並且會加聚簇索引上的記錄X鎖,加鎖順序爲先[1,hdc,100],後[6,hdc,10]。而Session 2,從pubtime索引出發,[10,6],[100,1]均知足過濾條件,一樣也會加聚簇索引上的記錄X鎖,加鎖順序爲[6,hdc,10],後[1,hdc,100]。發現沒有,跟Session 1的加鎖順序正好相反,若是兩個Session剛好都持有了第一把鎖,請求加第二把鎖,死鎖就發生了。
結論:死鎖的發生與否,並不在於事務中有多少條SQL語句,死鎖的關鍵在於:兩個(或以上)的Session加鎖的順序不一致。而使用本文上面提到的,分析MySQL每條SQL語句的加鎖規則,分析出每條語句的加鎖順序,而後檢查多個併發SQL間是否存在以相反的順序加鎖的狀況,就能夠分析出各類潛在的死鎖狀況,也能夠分析出線上死鎖發生的緣由。
寫到這兒,本文也告一段落,作一個簡單的總結,要作的徹底掌握MySQL/InnoDB的加鎖規則,甚至是其餘任何數據庫的加鎖規則,須要具有如下的一些知識點:
有了這些知識點,再加上適當的實戰經驗,全面掌控MySQL/InnoDB的加鎖規則,當不在話下。