深刻理解分佈式事務

我在上一期介紹了spring的事務原理(詳情見《深刻理解spring事務原理》),Spring事務本質是單機下的事務,是由數據庫自己保證的。今天,我將介紹一種比較複雜的事務:分佈式事務mysql

一、什麼是分佈式事務

分佈式事務就是指事務的參與者、支持事務的服務器、資源服務器以及事務管理器分別位於不一樣的分佈式系統的不一樣節點之上。以上是百度百科的解釋,簡單的說,就是一次大的操做由不一樣的小操做組成,這些小的操做分佈在不一樣的服務器上,且屬於不一樣的應用,分佈式事務須要保證這些小操做要麼所有成功,要麼所有失敗。本質上來講,分佈式事務就是爲了保證不一樣數據庫的數據一致性。spring

二、分佈式事務的產生的緣由

2.一、數據庫分庫分表

當數據庫單表一年產生的數據超過1000W,那麼就要考慮分庫分表,具體分庫分表的原理在此不作解釋,之後有空詳細說,簡單的說就是原來的一個數據庫變成了多個數據庫。這時候,若是一個操做既訪問01庫,又訪問02庫,並且要保證數據的一致性,那麼就要用到分佈式事務。sql

2.二、應用SOA化

所謂的SOA化,就是業務的服務化。好比原來單機支撐了整個電商網站,如今對整個網站進行拆解,分離出了訂單中心、用戶中心、庫存中心。對於訂單中心,有專門的數據庫存儲訂單信息,用戶中心也有專門的數據庫存儲用戶信息,庫存中心也會有專門的數據庫存儲庫存信息。這時候若是要同時對訂單和庫存進行操做,那麼就會涉及到訂單數據庫和庫存數據庫,爲了保證數據一致性,就須要用到分佈式事務。數據庫

以上兩種狀況表象不一樣,可是本質相同,都是由於要操做的數據庫變多了!編程

三、事務的ACID特性

3.一、原子性(A)

所謂的原子性就是說,在整個事務中的全部操做,要麼所有完成,要麼所有不作,沒有中間狀態。對於事務在執行中發生錯誤,全部的操做都會被回滾,整個事務就像從沒被執行過同樣。服務器

3.二、一致性(C)

事務的執行必須保證系統的一致性,就拿轉帳爲例,A有500元,B有300元,若是在一個事務裏A成功轉給B50元,那麼無論併發多少,無論發生什麼,只要事務執行成功了,那麼最後A帳戶必定是450元,B帳戶必定是350元。併發

3.三、隔離性(I)

所謂的隔離性就是說,事務與事務之間不會互相影響,一個事務的中間狀態不會被其餘事務感知。框架

3.四、持久性(D)

所謂的持久性,就是說一單事務完成了,那麼事務對數據所作的變動就徹底保存在了數據庫中,即便發生停電,系統宕機也是如此。nosql

四、分佈式事務的應用場景

4.一、支付

最經典的場景就是支付了,一筆支付,是對買家帳戶進行扣款,同時對賣家帳戶進行加錢,這些操做必須在一個事務裏執行,要麼所有成功,要麼所有失敗。而對於買家帳戶屬於買家中心,對應的是買家數據庫,而賣家帳戶屬於賣家中心,對應的是賣家數據庫,對不一樣數據庫的操做必然須要引入分佈式事務。分佈式

4.二、在線下單

買家在電商平臺下單,每每會涉及到兩個動做,一個是扣庫存,第二個是更新訂單狀態,庫存和訂單通常屬於不一樣的數據庫,須要使用分佈式事務保證數據一致性。

五、常見的分佈式事務解決方案

5.一、基於XA協議的兩階段提交

XA是一個分佈式事務協議,由Tuxedo提出。XA中大體分爲兩部分:事務管理器和本地資源管理器。其中本地資源管理器每每由數據庫實現,好比Oracle、DB2這些商業數據庫都實現了XA接口,而事務管理器做爲全局的調度者,負責各個本地資源的提交和回滾。XA實現分佈式事務的原理以下:

總的來講,XA協議比較簡單,並且一旦商業數據庫實現了XA協議,使用分佈式事務的成本也比較低。可是,XA也有致命的缺點,那就是性能不理想,特別是在交易下單鏈路,每每併發量很高,XA沒法知足高併發場景。XA目前在商業數據庫支持的比較理想,在mysql數據庫中支持的不太理想,mysql的XA實現,沒有記錄prepare階段日誌,主備切換回致使主庫與備庫數據不一致。許多nosql也沒有支持XA,這讓XA的應用場景變得很是狹隘。

5.二、消息事務+最終一致性

所謂的消息事務就是基於消息中間件的兩階段提交,本質上是對消息中間件的一種特殊利用,它是將本地事務和發消息放在了一個分佈式事務裏,保證要麼本地操做成功成功而且對外發消息成功,要麼二者都失敗,開源的RocketMQ就支持這一特性,具體原理以下:

一、A系統向消息中間件發送一條預備消息
二、消息中間件保存預備消息並返回成功
三、A執行本地事務
四、A發送提交消息給消息中間件

經過以上4步完成了一個消息事務。對於以上的4個步驟,每一個步驟均可能產生錯誤,下面一一分析:

  • 步驟一出錯,則整個事務失敗,不會執行A的本地操做
  • 步驟二出錯,則整個事務失敗,不會執行A的本地操做
  • 步驟三出錯,這時候須要回滾預備消息,怎麼回滾?答案是A系統實現一個消息中間件的回調接口,消息中間件會去不斷執行回調接口,檢查A事務執行是否執行成功,若是失敗則回滾預備消息
  • 步驟四出錯,這時候A的本地事務是成功的,那麼消息中間件要回滾A嗎?答案是不須要,其實經過回調接口,消息中間件可以檢查到A執行成功了,這時候其實不須要A發提交消息了,消息中間件能夠本身對消息進行提交,從而完成整個消息事務

基於消息中間件的兩階段提交每每用在高併發場景下,將一個分佈式事務拆成一個消息事務(A系統的本地操做+發消息)+B系統的本地操做,其中B系統的操做由消息驅動,只要消息事務成功,那麼A操做必定成功,消息也必定發出來了,這時候B會收到消息去執行本地操做,若是本地操做失敗,消息會重投,直到B操做成功,這樣就變相地實現了A與B的分佈式事務。原理以下:

雖然上面的方案可以完成A和B的操做,可是A和B並非嚴格一致的,而是最終一致的,咱們在這裏犧牲了一致性,換來了性能的大幅度提高。固然,這種玩法也是有風險的,若是B一直執行不成功,那麼一致性會被破壞,具體要不要玩,仍是得看業務可以承擔多少風險。

5.三、TCC編程模式

所謂的TCC編程模式,也是兩階段提交的一個變種。TCC提供了一個編程框架,將整個業務邏輯分爲三塊:Try、Confirm和Cancel三個操做。以在線下單爲例,Try階段會去扣庫存,Confirm階段則是去更新訂單狀態,若是更新訂單失敗,則進入Cancel階段,會去恢復庫存。總之,TCC就是經過代碼人爲實現了兩階段提交,不一樣的業務場景所寫的代碼都不同,複雜度也不同,所以,這種模式並不能很好地被複用。

六、總結

分佈式事務,本質上是對多個數據庫的事務進行統一控制,按照控制力度能夠分爲:不控制、部分控制和徹底控制。不控制就是不引入分佈式事務,部分控制就是各類變種的兩階段提交,包括上面提到的消息事務+最終一致性、TCC模式,而徹底控制就是徹底實現兩階段提交。部分控制的好處是併發量和性能很好,缺點是數據一致性減弱了,徹底控制則是犧牲了性能,保障了一致性,具體用哪一種方式,最終仍是取決於業務場景。做爲技術人員,必定不能忘了技術是爲業務服務的,不要爲了技術而技術,針對不一樣業務進行技術選型也是一種很重要的能力!

========================================================

若是以爲還不錯,請隨意打賞

相關文章
相關標籤/搜索