分佈式事務的解決方案

時間 2019-11-30

原文原文鏈接

分佈式事務的解決方案有以下幾種：mysql

全局消息
基於可靠消息服務的分佈式事務
TCC
最大努力通知

方案1：全局事務（DTP模型）

全局事務基於DTP模型實現。DTP是由X/Open組織提出的一種分佈式事務模型——X/Open Distributed Transaction Processing Reference Model。它規定了要實現分佈式事務，須要三種角色：sql

公衆號

全網惟一一個從0開始幫助Java開發者轉作大數據領域的公衆號~數據庫
公衆號大數據技術與架構或者搜索import_bigdata關注，大數據學習路線最新更新，已經有不少小夥伴加入了~緩存

AP：Application 應用系統它就是咱們開發的業務系統，在咱們開發的過程當中，可使用資源管理器提供的事務接口來實現分佈式事務。服務器
TM：Transaction Manager 事務管理器網絡
- 分佈式事務的實現由事務管理器來完成，它會提供分佈式事務的操做接口供咱們的業務系統調用。這些接口稱爲TX接口。
- 事務管理器還管理着全部的資源管理器，經過它們提供的XA接口來同一調度這些資源管理器，以實現分佈式事務。
- DTP只是一套實現分佈式事務的規範，並無定義具體如何實現分佈式事務，TM能夠採用2PC、3PC、Paxos等協議實現分佈式事務。
RM：Resource Manager 資源管理器架構
- 可以提供數據服務的對象均可以是資源管理器，好比：數據庫、消息中間件、緩存等。大部分場景下，數據庫即爲分佈式事務中的資源管理器。
- 資源管理器可以提供單數據庫的事務能力，它們經過XA接口，將本數據庫的提交、回滾等能力提供給事務管理器調用，以幫助事務管理器實現分佈式的事務管理。
- XA是DTP模型定義的接口，用於向事務管理器提供該資源管理器(該數據庫)的提交、回滾等能力。
- DTP只是一套實現分佈式事務的規範，RM具體的實現是由數據庫廠商來完成的。

實際方案：基於XA協議的兩階段提交

XA是一個分佈式事務協議，由Tuxedo提出。XA中大體分爲兩部分：事務管理器和本地資源管理器。其中本地資源管理器每每由數據庫實現，好比Oracle、DB2這些商業數據庫都實現了XA接口，而事務管理器做爲全局的調度者，負責各個本地資源的提交和回滾。XA實現分佈式事務的原理以下：併發

總的來講，XA協議比較簡單，並且一旦商業數據庫實現了XA協議，使用分佈式事務的成本也比較低。可是，XA也有致命的缺點，那就是性能不理想，特別是在交易下單鏈路，每每併發量很高，XA沒法知足高併發場景。XA目前在商業數據庫支持的比較理想，在mysql數據庫中支持的不太理想，mysql的XA實現，沒有記錄prepare階段日誌，主備切換回致使主庫與備庫數據不一致。許多nosql也沒有支持XA，這讓XA的應用場景變得很是狹隘。運維

方案2：基於可靠消息服務的分佈式事務（事務消息中間件）

這種實現分佈式事務的方式須要經過消息中間件來實現。假設有A和B兩個系統，分別能夠處理任務A和任務B。此時系統A中存在一個業務流程，須要將任務A和任務B在同一個事務中處理。下面來介紹基於消息中間件來實現這種分佈式事務。異步

在系統A處理任務A前，首先向消息中間件發送一條消息
消息中間件收到後將該條消息持久化，但並不投遞。此時下游系統B仍然不知道該條消息的存在。
消息中間件持久化成功後，便向系統A返回一個確認應答；
系統A收到確認應答後，則能夠開始處理任務A；
任務A處理完成後，向消息中間件發送Commit請求。該請求發送完成後，對系統A而言，該事務的處理過程就結束了，此時它能夠處理別的任務了。但commit消息可能會在傳輸途中丟失，從而消息中間件並不會向系統B投遞這條消息，從而系統就會出現不一致性。這個問題由消息中間件的事務回查機制完成，下文會介紹。
消息中間件收到Commit指令後，便向系統B投遞該消息，從而觸發任務B的執行；
當任務B執行完成後，系統B向消息中間件返回一個確認應答，告訴消息中間件該消息已經成功消費，此時，這個分佈式事務完成。

上述過程能夠得出以下幾個結論：

消息中間件扮演者分佈式事務協調者的角色。
系統A完成任務A後，到任務B執行完成之間，會存在必定的時間差。在這個時間差內，整個系統處於數據不一致的狀態，但這短暫的不一致性是能夠接受的，由於通過短暫的時間後，系統又能夠保持數據一致性，知足BASE理論。

上述過程當中，若是任務A處理失敗，那麼須要進入回滾流程，以下圖所示：

若系統A在處理任務A時失敗，那麼就會向消息中間件發送Rollback請求。和發送Commit請求同樣，系統A發完以後即可以認爲回滾已經完成，它即可以去作其餘的事情。
消息中間件收到回滾請求後，直接將該消息丟棄，而不投遞給系統B，從而不會觸發系統B的任務B。

此時系統又處於一致性狀態，由於任務A和任務B都沒有執行。

上面所介紹的Commit和Rollback都屬於理想狀況，但在實際系統中，Commit和Rollback指令都有可能在傳輸途中丟失。那麼當出現這種狀況的時候，消息中間件是如何保證數據一致性呢？——答案就是超時詢問機制。

系統A除了實現正常的業務流程外，還需提供一個事務詢問的接口，供消息中間件調用。當消息中間件收到一條事務型消息後便開始計時，若是到了超時時間也沒收到系統A發來的Commit或Rollback指令的話，就會主動調用系統A提供的事務詢問接口詢問該系統目前的狀態。該接口會返回三種結果：

提交若得到的狀態是「提交」，則將該消息投遞給系統B。
回滾若得到的狀態是「回滾」，則直接將條消息丟棄。
處理中若得到的狀態是「處理中」，則繼續等待。

消息中間件的超時詢問機制可以防止上游系統因在傳輸過程當中丟失Commit/Rollback指令而致使的系統不一致狀況，並且能下降上游系統的阻塞時間，上游系統只要發出Commit/Rollback指令後即可以處理其餘任務，無需等待確認應答。而Commit/Rollback指令丟失的狀況經過超時詢問機制來彌補，這樣大大下降上游系統的阻塞時間，提高系統的併發度。

下面來講一說消息投遞過程的可靠性保證。當上遊系統執行完任務並向消息中間件提交了Commit指令後，即可以處理其餘任務了，此時它能夠認爲事務已經完成，接下來消息中間件**必定會保證消息被下游系統成功消費掉！**那麼這是怎麼作到的呢？這由消息中間件的投遞流程來保證。

消息中間件向下遊系統投遞完消息後便進入阻塞等待狀態，下游系統便當即進行任務的處理，任務處理完成後便向消息中間件返回應答。消息中間件收到確認應答後便認爲該事務處理完畢！

若是消息在投遞過程當中丟失，或消息的確認應答在返回途中丟失，那麼消息中間件在等待確認應答超時以後就會從新投遞，直到下游消費者返回消費成功響應爲止。固然，通常消息中間件能夠設置消息重試的次數和時間間隔，好比：當第一次投遞失敗後，每隔五分鐘重試一次，一共重試3次。若是重試3次以後仍然投遞失敗，那麼這條消息就須要人工干預。

有的同窗可能要問：消息投遞失敗後爲何不回滾消息，而是不斷嘗試從新投遞？

這就涉及到整套分佈式事務系統的實現成本問題。咱們知道，當系統A將向消息中間件發送Commit指令後，它便去作別的事情了。若是此時消息投遞失敗，須要回滾的話，就須要讓系統A事先提供回滾接口，這無疑增長了額外的開發成本，業務系統的複雜度也將提升。對於一個業務系統的設計目標是，在保證性能的前提下，最大限度地下降系統複雜度，從而可以下降系統的運維成本。

不知你們是否發現，上游系統A向消息中間件提交Commit/Rollback消息採用的是異步方式，也就是當上遊系統提交完消息後即可以去作別的事情，接下來提交、回滾就徹底交給消息中間件來完成，而且徹底信任消息中間件，認爲它必定能正確地完成事務的提交或回滾。然而，消息中間件向下遊系統投遞消息的過程是同步的。也就是消息中間件將消息投遞給下游系統後，它會阻塞等待，等下游系統成功處理完任務返回確認應答後才取消阻塞等待。爲何這二者在設計上是不一致的呢？

首先，上游系統和消息中間件之間採用異步通訊是爲了提升系統併發度。業務系統直接和用戶打交道，用戶體驗尤其重要，所以這種異步通訊方式可以極大程度地下降用戶等待時間。此外，異步通訊相對於同步通訊而言，沒有了長時間的阻塞等待，所以系統的併發性也大大增長。但異步通訊可能會引發Commit/Rollback指令丟失的問題，這就由消息中間件的超時詢問機制來彌補。

那麼，消息中間件和下游系統之間爲何要採用同步通訊呢？

異步能提高系統性能，但隨之會增長系統複雜度；而同步雖然下降系統併發度，但實現成本較低。所以，在對併發度要求不是很高的狀況下，或者服務器資源較爲充裕的狀況下，咱們能夠選擇同步來下降系統的複雜度。咱們知道，消息中間件是一個獨立於業務系統的第三方中間件，它不和任何業務系統產生直接的耦合，它也不和用戶產生直接的關聯，它通常部署在獨立的服務器集羣上，具備良好的可擴展性，因此沒必要太過於擔憂它的性能，若是處理速度沒法知足咱們的要求，能夠增長機器來解決。並且，即便消息中間件處理速度有必定的延遲那也是能夠接受的，由於前面所介紹的BASE理論就告訴咱們了，咱們追求的是最終一致性，而非實時一致性，所以消息中間件產生的時延致使事務短暫的不一致是能夠接受的。

方案3：最大努力通知（按期校對）也叫本地消息表

最大努力通知也被稱爲按期校對，其實在方案二中已經包含，這裏再單獨介紹，主要是爲了知識體系的完整性。這種方案也須要消息中間件的參與，其過程以下：

上游系統在完成任務後，向消息中間件同步地發送一條消息，確保消息中間件成功持久化這條消息，而後上游系統能夠去作別的事情了；
消息中間件收到消息後負責將該消息同步投遞給相應的下游系統，並觸發下游系統的任務執行；
當下遊系統處理成功後，向消息中間件反饋確認應答，消息中間件即可以將該條消息刪除，從而該事務完成。

上面是一個理想化的過程，但在實際場景中，每每會出現以下幾種意外狀況：

消息中間件向下遊系統投遞消息失敗
上游系統向消息中間件發送消息失敗

對於第一種狀況，消息中間件具備重試機制，咱們能夠在消息中間件中設置消息的重試次數和重試時間間隔，對於網絡不穩定致使的消息投遞失敗的狀況，每每重試幾回後消息即可以成功投遞，若是超過了重試的上限仍然投遞失敗，那麼消息中間件再也不投遞該消息，而是記錄在失敗消息表中，消息中間件須要提供失敗消息的查詢接口，下游系統會按期查詢失敗消息，並將其消費，這就是所謂的「按期校對」。

若是重複投遞和按期校對都不能解決問題，每每是由於下游系統出現了嚴重的錯誤，此時就須要人工干預。

對於第二種狀況，須要在上游系統中創建消息重發機制。能夠在上游系統創建一張本地消息表，並將任務處理過程和向本地消息表中插入消息這兩個步驟放在一個本地事務中完成。若是向本地消息表插入消息失敗，那麼就會觸發回滾，以前的任務處理結果就會被取消。若是這量步都執行成功，那麼該本地事務就完成了。接下來會有一個專門的消息發送者不斷地發送本地消息表中的消息，若是發送失敗它會返回重試。固然，也要給消息發送者設置重試的上限，通常而言，達到重試上限仍然發送失敗，那就意味着消息中間件出現嚴重的問題，此時也只有人工干預才能解決問題。

對於不支持事務型消息的消息中間件，若是要實現分佈式事務的話，就能夠採用這種方式。它可以經過重試機制+按期校對實現分佈式事務，但相比於第二種方案，它達到數據一致性的週期較長，並且還須要在上游系統中實現消息重試發佈機制，以確保消息成功發佈給消息中間件，這無疑增長了業務系統的開發成本，使得業務系統不夠純粹，而且這些額外的業務邏輯無疑會佔用業務系統的硬件資源，從而影響性能。

所以，儘可能選擇支持事務型消息的消息中間件來實現分佈式事務，如RocketMQ。

方案4：TCC（兩階段型、補償型）

跨應用的業務操做原子性要求，實際上是比較常見的。好比在第三方支付場景中的組合支付，用戶在電商網站購物後，要同時使用餘額和紅包支付該筆訂單，而餘額系統和紅包系統分別是不一樣的應用系統，支付系統在調用這兩個系統進行支付時，就須要保證餘額扣減和紅包使用要麼同時成功，要麼同時失敗。

TCC事務的出現正是爲了解決應用拆分帶來的跨應用業務操做原子性的問題。固然，因爲常規的XA事務(2PC，2 Phase Commit, 兩階段提交) 性能上不盡如人意，也有經過TCC事務來解決數據庫拆分的使用場景(如帳務拆分)，這個本文後續部分再詳述。

故從整個系統架構的角度來看，分佈式事務的不一樣方案是存在層次結構的。

TCC的機制

明眼一看就知道，TCC應該是三個英文單詞的首字母縮寫而來。沒錯，TCC分別對應Try、Confirm和Cancel三種操做，這三種操做的業務含義以下：

Try：預留業務資源 Confirm：確認執行業務操做 Cancel：取消執行業務操做

稍稍對照下關係型數據庫事務的三種操做：DML、Commit和Rollback，會發現和TCC有殊途同歸之妙。在一個跨應用的業務操做中， Try操做是先把多個應用中的業務資源預留和鎖定住，爲後續的確認打下基礎，相似的，DML操做要鎖定數據庫記錄行，持有數據庫資源； Confirm操做是在Try操做中涉及的全部應用均成功以後進行確認，使用預留的業務資源，和Commit相似；而Cancel則是當Try操做中涉及的全部應用沒有所有成功，須要將已成功的應用進行取消(即Rollback回滾)。其中Confirm和Cancel操做是一對反向業務操做。

簡而言之，TCC是應用層的2PC(2 Phase Commit, 兩階段提交)，若是你將應用看作資源管理器的話。詳細來講，TCC每項操做須要作的事情以下：

一、Try：嘗試執行業務。完成全部業務檢查(一致性)預留必須業務資源(準隔離性) 二、Confirm：確認執行業務。真正執行業務不作任何業務檢查只使用Try階段預留的業務資源三、Cancel：取消執行業務釋放Try階段預留的業務資源

一個完整的TCC事務參與方包括三部分：

主業務服務：主業務服務爲整個業務活動的發起方，如前面提到的組合支付場景，支付系統便是主業務服務。從業務服務：從業務服務負責提供TCC業務操做，是整個業務活動的操做方。從業務服務必須實現Try、Confirm和Cancel三個接口，供主業務服務調用。因爲Confirm和Cancel操做可能被重複調用，故要求Confirm和Cancel兩個接口必須是冪等的。前面的組合支付場景中的餘額系統和紅包系統即爲從業務服務。業務活動管理器：業務活動管理器管理控制整個業務活動，包括記錄維護TCC全局事務的事務狀態和每一個從業務服務的子事務狀態，並在業務活動提交時確認全部的TCC型操做的confirm操做，在業務活動取消時調用全部TCC型操做的cancel操做。可見整個TCC事務對於主業務服務來講是透明的，其中業務活動管理器和從業務服務各自幹了一部分工做。

TCC的優勢和限制

TCC事務的優勢以下：解決了跨應用業務操做的原子性問題，在諸如組合支付、帳務拆分場景很是實用。 TCC實際上把數據庫層的二階段提交上提到了應用層來實現，對於數據庫來講是一階段提交，規避了數據庫層的2PC性能低下問題。

TCC事務的缺點，主要就一個： TCC的Try、Confirm和Cancel操做功能需業務提供，開發成本高。固然，對TCC事務的這個缺點是不是缺點，是一個見仁見智的事情。

一個案例理解

TCC說實話，TCC的理論有點讓人費解。故接下來將以帳務拆分爲例，對TCC事務的流程作一個描述，但願對理解TCC有所幫助。帳務拆分的業務場景以下，分別位於三個不一樣分庫的賬戶A、B、C，A和B一塊兒向C轉賬共80元：分佈式事務之說說TCC事務

一、Try：嘗試執行業務。完成全部業務檢查(一致性)：檢查A、B、C的賬戶狀態是否正常，賬戶A的餘額是否很多於30元，賬戶B的餘額是否很多於50元。預留必須業務資源(準隔離性)：賬戶A的凍結金額增長30元，賬戶B的凍結金額增長50元，這樣就保證不會出現其餘併發進程扣減了這兩個賬戶的餘額而致使在後續的真正轉賬操做過程當中，賬戶A和B的可用餘額不夠的狀況。

二、Confirm：確認執行業務。真正執行業務：若是Try階段賬戶A、B、C狀態正常，且賬戶A、B餘額夠用，則執行賬戶A給帳戶C轉帳30元、賬戶B給帳戶C轉帳50元的轉賬操做。不作任何業務檢查：這時已經不須要作業務檢查，Try階段已經完成了業務檢查。只使用Try階段預留的業務資源：只須要使用Try階段賬戶A和賬戶B凍結的金額便可。

三、Cancel：取消執行業務釋放Try階段預留的業務資源：若是Try階段部分紅功，好比賬戶A的餘額夠用，且凍結相應金額成功，賬戶B的餘額不夠而凍結失敗，則須要對賬戶A作Cancel操做，將賬戶A被凍結的金額解凍掉。