在分佈式系統中著有 CAP 理論,該理論由加州大學伯克利分校的 Eric Brewer 教授提出,闡述了在一個分佈式系統中不可能同時知足 一致性(Consistency)、可用性(Availability),以及 分區容錯性(Partition tolerance)。面試
在分佈式系統中數據每每存在多個副本,一致性描述的是這些副本中的數據在內容和組織上的一致。數據庫
可用性描述了系統對用戶的服務能力,所謂可用是指在用戶容忍的時間範圍內返回用戶指望的結果。設計模式
分佈式系統一般由多個節點構成,因爲網絡是不可靠的,因此存在分佈式集羣中的節點由於網絡通訊故障致使被孤立成一個個小集羣的可能性,即網絡分區,分區容錯性要求在出現網絡分區時系統仍然可以對外提供一致性的可用服務。服務器
對於一個分佈式系統而言,咱們要始終假設網絡是不可靠的,所以分區容錯性是對一個分佈式系統最基本的要求,咱們的切入點更多的是嘗試在可用性和一致性之間尋找一個平衡點,但這也並不是要求咱們在系統設計時一直創建在網絡出現分區的場景之上,而後對一致性和可用性在選擇時非此即彼。實際上 Eric Brewer 在 2012 年就曾指出 CAP 理論證實不能同時知足一致性、可用性,以及分區容錯性的觀點在實際系統設計指導上存在必定的誤導性。傳統對於 CAP 理論的理解認爲在設計分佈式系統時必須知足 P,而後在 C 和 A 之間進行取捨,這是片面的,實際中網絡出現分區的可能性仍是比較小的,尤爲是目前網絡環境正在變得愈來愈好,甚至許多系統都擁有專線支持,因此在網絡未出現分區時,仍是應該兼顧 A 和 C;另外就是對於一致性、可用性,以及分區容錯性三者在度量上也應該有一個評定範圍,最簡單的以可用性來講,當有多少佔比請求出現響應超時才能夠被認爲是不知足可用性,而不是一出現超時就認爲是不可用的;最後咱們須要考慮的一點就是分佈式系統通常都是一個比較大且複雜的系統,咱們應該從更小的粒度上對各個子系統進行評估和設計,而不是簡單的從總體上認爲須要知足 P,而在 A 和 C 之間作取捨,一些子系統可能須要儘量同時知足三者。網絡
讓分佈式集羣始終對外提供可用的一致性服務一直是富有挑戰和趣味的一項任務。暫且拋開可用性,拿一致性來講,對於關係型數據庫咱們一般利用事務來保證數據的強一致性,當咱們的數據量愈來愈大,大到單庫已經沒法承擔時,咱們不得不採起分庫分表的策略對數據庫實現水平拆分,構建分佈式數據庫集羣,這樣能夠將一個數據庫的壓力分攤到多個數據庫,極大的提高了數據庫的存儲和響應能力,可是拆分以後也爲咱們使用數據庫帶來了許多的限制,好比主鍵的全局惟1、聯表查詢、數據聚合等等,另一個至關棘手的問題就是數據庫的事務由原先的單庫事務變成了如今的分佈式事務。分佈式
分佈式事務的實現並非很難,好比下文要展開的兩階段提交(2PC:Two-Phrase Commit)和三階段提交(3PC:Three-Phrase Commit)都給咱們提供了思路,可是若是要保證數據的強一致性,並要求對外提供可用的服務,就變成了一個幾乎不可能的任務(至少目前是),所以不少分佈式系統對於數據強一致性都敬而遠之。性能
兩階段提交協議的目標在於在分佈式系統中保證數據的一致性,許多分佈式系統採用該協議提供對分佈式事務的支持(提供但不必定有人用,呵呵~)。顧名思義,該協議將一個分佈式的事務過程拆分紅兩個階段:投票階段和事務提交階段。爲了讓整個數據庫集羣可以正常的運行,該協議指定了一個「協調者」單點,用於協調整個數據庫集羣的運行,爲了簡化描述,咱們將數據庫裏面的各個節點稱爲「參與者」,三階段提交協議中一樣包含「協調者」和「參與者」這兩個定義。學習
該階段的主要目的在於打探數據庫集羣中的各個參與者是否可以正常的執行事務,具體步驟以下:.net
在第一階段協調者的詢盤以後,各個參與者會回覆本身事務的執行狀況,這時候存在三種可能:設計
對於第一種狀況,協調者將向全部的參與者發出提交事務的通知,具體步驟以下:
對於第2、三種狀況,協調者均認爲參與者沒法正常成功執行事務,爲了整個集羣數據的一致性,因此要向各個參與者發送事務回滾通知,具體步驟以下:
兩階段提交協議解決的是分佈式數據庫數據強一致性問題,其原理簡單,易於實現,可是缺點也是顯而易見的,主要缺點以下:
協調者在整個兩階段提交過程當中扮演着舉足輕重的做用,一旦協調者所在服務器宕機,那麼就會影響整個數據庫集羣的正常運行,好比在第二階段中,若是協調者由於故障不能正常發送事務提交或回滾通知,那麼參與者們將一直處於阻塞狀態,整個數據庫集羣將沒法提供服務。
兩階段提交執行過程當中,全部的參與者都須要遵從協調者的統一調度,期間處於阻塞狀態而不能從事其餘操做,這樣效率及其低下。
兩階段提交協議雖然爲分佈式數據強一致性所設計,但仍然存在數據不一致性的可能,好比在第二階段中,假設協調者發出了事務commit的通知,可是由於網絡問題該通知僅被一部分參與者所收到並執行了commit操做,其他的參與者則由於沒有收到通知一直處於阻塞狀態,這時候就產生了數據的不一致性。
針對兩階段提交存在的問題,三階段提交協議經過引入一個「預詢盤」階段,以及超時策略來減小整個集羣的阻塞時間,提高系統性能。三階段提交的三個階段分別爲:can_commit,pre_commit,do_commit。
該階段協調者會去詢問各個參與者是否可以正常執行事務,參與者根據自身狀況回覆一個預估值,相對於真正的執行事務,這個過程是輕量的,具體步驟以下:
本階段協調者會根據第一階段的詢盤結果採起相應操做,詢盤結果主要有三種:
針對第一種狀況,協調者會向全部參與者發送事務執行請求,具體步驟以下:
在上面的步驟中,若是參與者等待超時,則會中斷事務。 針對第2、三種狀況,協調者認爲事務沒法正常執行,因而向各個參與者發出abort通知,請求退出預備狀態,具體步驟以下:
若是第二階段事務未中斷,那麼本階段協調者將會依據事務執行返回的結果來決定提交或回滾事務,分爲三種狀況:
針對第一種狀況,協調者向各個參與者發起事務提交請求,具體步驟以下:
針對第2、三種狀況,協調者認爲事務沒法正常執行,因而向各個參與者發送事務回滾請求,具體步驟以下:
在本階段若是由於協調者或網絡問題,致使參與者遲遲不能收到來自協調者的commit或rollback請求,那麼參與者將不會如兩階段提交中那樣陷入阻塞,而是等待超時後繼續commit。相對於兩階段提交雖然下降了同步阻塞,但仍然沒法避免數據的不一致性。
在分佈式數據庫中,若是指望達到數據的強一致性,那麼服務基本沒有可用性可言,這也是爲何許多分佈式數據庫提供了跨庫事務,但也只是個擺設的緣由,在實際應用中咱們更多追求的是數據的弱一致性或最終一致性,爲了強一致性而丟棄可用性是不可取的。
來源:https://my.oschina.net/wangzhenchao/blog/736909 歡迎關注公衆號 【碼農開花】一塊兒學習成長 我會一直分享Java乾貨,也會分享免費的學習資料課程和麪試寶典 回覆:【計算機】【設計模式】【面試】有驚喜哦