分佈式事物方案前-BASE理論的介紹

時間 2019-11-08

原文原文鏈接

BASE理論

BASE是Basically Available（基本可用）、Soft state（軟狀態）和Eventually consistent（最終一致性）三個短語的簡寫，BASE是對CAP中一致性和可用性權衡的結果，其來源於對大規模互聯網系統分佈式實踐的結論，是基於CAP定理逐步演化而來的，其核心思想是即便沒法作到強一致性（Strong consistency），但每一個應用均可以根據自身的業務特色，採用適當的方式來使系統達到最終一致性（Eventual consistency）。接下來咱們着重對BASE中的三要素進行詳細講解。數據庫

基本可用

基本可用是指分佈式系統在出現不可預知故障的時候，容許損失部分可用性——但請注意，這毫不等價於系統不可用，如下兩個就是「基本可用」的典型例子。網絡

響應時間上的損失：正常狀況下，一個在線搜索引擎須要0.5秒內返回給用戶相應的查詢結果，但因爲出現異常（好比系統部分機房發生斷電或斷網故障），查詢結果的響應時間增長到了1~2秒。
功能上的損失：正常狀況下，在一個電子商務網站上進行購物，消費者幾乎可以順利地完成每一筆訂單，可是在一些節日大促購物高峯的時候，因爲消費者的購物行爲激增，爲了保護購物系統的穩定性，部分消費者可能會被引導到一個降級頁面。

弱狀態也稱爲軟狀態，和硬狀態相對，是指容許系統中的數據存在中間狀態，並認爲該中間狀態的存在不會影響系統的總體可用性，即容許系統在不一樣節點的數據副本之間進行數據聽不的過程存在延時。架構

最終一致性

最終一致性強調的是系統中全部的數據副本，在通過一段時間的同步後，最終可以達到一個一致的狀態。所以，最終一致性的本質是須要系統保證最終數據可以達到一致，而不須要實時保證系統數據的強一致性異步

亞馬遜首席技術官Werner Vogels在於2008年發表的一篇文章中對最終一致性進行了很是詳細的介紹。他認爲最終一致性時一種特殊的弱一致性：系統可以保證在沒有其餘新的更新操做的狀況下，數據最終必定可以達到一致的狀態，所以全部客戶端對系統的數據訪問都可以胡渠道最新的值。同時，在沒有發生故障的前提下，數據達到一致狀態的時間延遲，取決於網絡延遲，系統負載和數據複製方案設計等因素。分佈式

在實際工程實踐中，最終一致性存在如下五類主要變種。網站

因果一致性：搜索引擎

因果一致性是指，若是進程A在更新完某個數據項後通知了進程B，那麼進程B以後對該數據項的訪問都應該可以獲取到進程A更新後的最新值，而且若是進程B要對該數據項進行更新操做的話，務必基於進程A更新後的最新值，即不能發生丟失更新狀況。與此同時，與進程A無因果關係的進程C的數據訪問則沒有這樣的限制。spa

讀己之所寫：架構設計

讀己之所寫是指，進程A更新一個數據項以後，它本身老是可以訪問到更新過的最新值，而不會看到舊值。也就是說，對於單個數據獲取者而言，其讀取到的數據必定不會比本身上次寫入的值舊。所以，讀己之所寫也能夠看做是一種特殊的因果一致性。設計

會話一致性：

會話一致性將對系統數據的訪問過程框定在了一個會話當中：系統能保證在同一個有效的會話中實現「讀己之所寫」的一致性，也就是說，執行更新操做以後，客戶端可以在同一個會話中始終讀取到該數據項的最新值。

單調讀一致性：

單調讀一致性是指若是一個進程從系統中讀取出一個數據項的某個值後，那麼系統對於該進程後續的任何數據訪問都不該該返回更舊的值。

單調寫一致性：

單調寫一致性是指，一個系統須要可以保證來自同一個進程的寫操做被順序地執行。

以上就是最終一致性的五類常見的變種，在時間系統實踐中，能夠將其中的若干個變種互相結合起來，以構建一個具備最終一致性的分佈式系統。事實上，能夠將其中的若干個變種相互結合起來，以構建一個具備最終一致性特性的分佈式系統。事實上，最終一致性並非只有那些大型分佈式系統才設計的特性，許多現代的關係型數據庫都採用了最終一致性模型。在現代關係型數據庫中，大多都會採用同步和異步方式來實現主備數據複製技術。在同步方式中，數據的複製國恥鞥一般是更新事務的一部分，所以在事務完成後，主備數據庫的數據就會達到一致。而在異步方式中，備庫的更新每每存在延時，這取決於事務日誌在主備數據庫之間傳輸的時間長短，若是傳輸時間過長或者甚至在日誌傳輸過程當中出現異常致使沒法及時將事務應用到備庫上，那麼狠顯然，從備庫中讀取的的數據將是舊的，所以就出現了不一致的狀況。固然，不管是採用屢次重試仍是認爲數據訂正，關係型數據庫仍是能搞保證最終數據達到一致——這就是系統提供最終一致性保證的經典案例。

總的來講，BASE理論面向的是大型高可用可擴展的分佈式系統，和傳統事務的ACID特性使相反的，它徹底不一樣於ACID的強一致性模型，而是提出經過犧牲強一致性來得到可用性，並容許數據在一段時間內是不一致的，但最終達到一致狀態。但同時，在實際的分佈式場景中，不一樣業務單元和組件對數據一致性的要求是不一樣的，所以在具體的分佈式系統架構設計過程當中，ACID特性與BASE理論每每又會結合在一塊兒使用。