因爲數據量的巨大,大部分Web應用都須要部署不少個數據庫實例。這樣,有些用戶操做就可能須要去修改多個數據庫實例中的數據。傳統的解決方法是使用分佈式事務保證數據的全局一致性,經典的方法是使用兩階段提交協議。mysql
長期以來,分佈式事務提供的優雅的全局ACID保證麻醉了應用開發者的心靈,不少人都不敢越雷池一步,想像沒有分佈式事務的世界會是怎樣。現在就如MySQL和PostgreSQL這類面向低端用戶的開源數據庫都支持分佈式事務了,開發者更是沉醉其中,不去考慮分佈式事務是否給系統帶來了傷害。sql
事實上,有所得必有所失,分佈式事務提供的ACID保證是以損害系統的可用性、性能與可伸縮性爲代價的。只有在參與分佈式事務的各個數據庫實例都可以正常工做的前提下,分佈式事務纔可以順利完成,只要有一個工做不正常,整個事務就不能完成。這樣,系統的可用性就至關於參加分佈式事務的各實例的可用性之積,實例越多,可用性降低越明顯。從性能和可伸縮性角度看,首先是事務的總持續時間一般是各實例操做時間之和,由於一個事務中的各個操做一般是順序執行的,這樣事務的響應時間就會增長不少;其次是通常Web應用的事務都不大,單機操做時間也就幾毫秒甚至不到1毫秒,一但涉及到分佈式事務,提交時節點間的網絡通訊往返過程也爲毫秒級別,對事務響應時間的影響也不可忽視。因爲事務持續時間延長,事務對相關資源的鎖定時間也相應增長,從而可能嚴重增長了併發衝突,影響到系統吞吐率和可伸縮性。數據庫
正是因爲分佈式事務有以上問題,eBay在設計上就不採用分佈式事務,而是經過其它途徑來解決數據一致性問題。其中使用的最重要的技術就是消息隊列和消息應用狀態表。網絡
舉個例子。假設系統中有如下兩個表
user(id, name, amt_sold, amt_bought)
transaction(xid, seller_id, buyer_id, amount)
其中user表記錄用戶交易彙總信息,transaction表記錄每一個交易的詳細信息。併發
這樣,在進行一筆交易時,若使用事務,就須要對數據庫進行如下操做:
begin;
INSERT INTO transaction VALUES(xid, $seller_id, $buyer_id, $amount);
UPDATE user SET amt_sold = amt_sold + $amount WHERE id = $seller_id;
UPDATE user SET amt_bought = amt_bought + $amount WHERE id = $buyer_id;
commit;
即在transaction表中記錄交易信息,而後更新賣家和買家的狀態。app
假設transaction表和user表存儲在不一樣的節點上,那麼上述事務就是一個分佈式事務。要消除這一分佈式事務,將它拆分紅兩個子事務,一個更新transaction表,一個更新user表是不行的,由於有可能transaction表更新成功後,更新user失敗,系統將不能恢復到一致狀態。異步
解決方案是使用消息隊列。以下所示,先啓動一個事務,更新transaction表後,並不直接去更新user表,而是將要對user表進行的更新插入到消息隊列中。另外有一個異步任務輪詢隊列內容進行處理。
begin;
INSERT INTO transaction VALUES(xid, $seller_id, $buyer_id, $amount);
put_to_queue "update user("seller", $seller_id, amount);
put_to_queue "update user("buyer", $buyer_id, amount);
commit;
for each message in queue
begin;
dequeue message;
if message.type = "seller" then
UPDATE user SET amt_sold = amt_sold + message.amount WHERE id = message.user_id;
else
UPDATE user SET amt_bought = amt_bought + message.amount WHERE id = message.user_id;
end
commit;
end分佈式
上述解決方案看似完美,實際上尚未解決分佈式問題。爲了使第一個事務不涉及分佈式操做,消息隊列必須與transaction表使用同一套存儲資源,但爲了使第二個事務是本地的,消息隊列存儲又必須與user表在一塊兒。這二者是不可能同時知足的。性能
若是消息具備操做冪等性,也就是一個消息被應用屢次與應用一次產生的效果是同樣的話,上述問題是很好解決的,只要將消息隊列放到transaction表一塊兒,而後在第二個事務中,先應用消息,再從消息隊列中刪除。因爲消息隊列存儲與user表不在一塊兒,應用消息後,可能還沒來得及將應用過的消息從隊列中刪除時系統就出故障了。這時系統恢復後會從新應用一次這一消息,因爲冪等性,應用屢次也能產生正確的結果。優化
但實際狀況下,消息很難具備冪等性,好比上述的UPDATE操做,執行一次和執行屢次的結束顯然是不同的。解決這一問題的方法是使用另外一個表記錄已經被成功應用的消息,而且這個表使用與user表相同的存儲。假設增長如下表 message_applied(msg_id)記錄被成功應用的消息,則產生最終的解決方案以下:
begin;
INSERT INTO transaction VALUES(xid, $seller_id, $buyer_id, $amount);
put_to_queue "update user("seller", $seller_id, amount);
put_to_queue "update user("buyer", $buyer_id, amount);
commit;
for each message in queue
begin;
SELECT count(*) as cnt FROM message_applied WHERE msg_id = message.id;
if cnt = 0 then
if message.type = "seller" then
UPDATE user SET amt_sold = amt_sold + message.amount WHERE id = message.user_id;
else
UPDATE user SET amt_bought = amt_bought + message.amount WHERE id = message.user_id;
end
INSERT INTO message_applied VALUES(message.id);
end
commit;
if 上述事務成功
dequeue message
DELETE FROM message_applied WHERE msg_id = message.id;
end
end
咱們來仔細分析一下:
一、消息隊列與transaction使用同一實例,所以第一個事務不涉及分佈式操做;
二、message_applied與user表在同一個實例中,也能保證一致性;
三、第二個事務結束後,dequeue message以前系統可能出故障,出故障後系統會從新從消息隊列中取出這一消息,但經過message_applied表能夠檢查出來這一消息已經被應用過,跳過這一消息實現正確的行爲;
四、最後將已經成功應用,且已經從消息隊列中刪除的消息從message_applied表中刪除,能夠將message_applied表保證在很小的狀態(不清除也是能夠的,不影響系統正確性)。因爲消息隊列與message_applied在不一樣實例上,dequeue message以後,將對應message_applied記錄刪除以前可能出故障。一但這時出現故障,message_applied表中會留下一些垃圾內容,但不影響系統正確性,另外這些垃圾內容也是能夠正確清理的。
雖然因爲沒有分佈式事務的強一致性保證,使用上述方案在系統發生故障時,系統將短期內處於不一致狀態。但基於消息隊列和消息應用狀態表,最終能夠將系統恢復到一致。使用消息隊列方案,解除了兩個數據庫實例之間的緊密耦合,其性能和可伸縮性是分佈式事務不可比擬的。
固然,使用分佈式事務有助於簡化應用開發,使用消息隊列明顯須要更多的工做量,二者各有優缺點。我的觀點是,對於時間緊迫或者對性能要求不高的系統,應採用分佈式事務加快開發效率,對於時間需求不是很緊,對性能要求很高的系統,應考慮使用消息隊列方案。對於原使用分佈式事務,且系統已趨於穩定,性能要求高的系統,則可使用消息隊列方案進行重構來優化性能。