一.數據庫事務的隔離級別html
數據庫事務的隔離級別有4個,由低到高依次爲Read uncommitted、Read committed、Repeatable read、Serializable,這四個級別能夠逐個解決髒讀、不可重複讀、幻讀這幾類問題。mysql
√: 可能出現 ×: 不會出現sql
髒讀 | 不可重複讀 | 幻讀 | |
Read uncommitted | √ | √ | √ |
Read committed | × | √ | √ |
Repeatable read | × | × | √ |
Serializable | × | × | × |
注意:咱們討論隔離級別的場景,主要是在多個事務併發的狀況下,所以,接下來的講解都圍繞事務併發。數據庫
公司發工資了,領導把5000元打到singo的帳號上,可是該事務並未提交,而singo正好去查看帳戶,發現工資已經到帳,是5000元整,很是高興。但是不幸的是,領導發現發給singo的工資金額不對,是2000元,因而迅速回滾了事務,修改金額後,將事務提交,最後singo實際的工資只有2000元,singo空歡喜一場。編程
出現上述狀況,即咱們所說的髒讀,兩個併發的事務,「事務A:領導給singo發工資」、「事務B:singo查詢工資帳戶」,事務B讀取了事務A還沒有提交的數據。服務器
當隔離級別設置爲Read uncommitted時,就可能出現髒讀,如何避免髒讀,請看下一個隔離級別。併發
singo拿着工資卡去消費,系統讀取到卡里確實有2000元,而此時她的老婆也正好在網上轉帳,把singo工資卡的2000元轉到另外一帳戶,並在singo以前提交了事務,當singo扣款時,系統檢查到singo的工資卡已經沒有錢,扣款失敗,singo十分納悶,明明卡里有錢,爲什麼......框架
出現上述狀況,即咱們所說的不可重複讀,兩個併發的事務,「事務A:singo消費」、「事務B:singo的老婆網上轉帳」,事務A事先讀取了數據,事務B緊接了更新了數據,並提交了事務,而事務A再次讀取該數據時,數據已經發生了改變。nosql
當隔離級別設置爲Read committed時,避免了髒讀,可是可能會形成不可重複讀。分佈式
大多數數據庫的默認級別就是Read committed,好比Sql Server , Oracle。如何解決不可重複讀這一問題,請看下一個隔離級別。
當隔離級別設置爲Repeatable read時,能夠避免不可重複讀。當singo拿着工資卡去消費時,一旦系統開始讀取工資卡信息(即事務開始),singo的老婆就不可能對該記錄進行修改,也就是singo的老婆不能在此時轉帳。
雖然Repeatable read避免了不可重複讀,但還有可能出現幻讀。
singo的老婆工做在銀行部門,她時常經過銀行內部系統查看singo的信用卡消費記錄。有一天,她正在查詢到singo當月信用卡的總消費金額(select sum(amount) from transaction where month = 本月)爲80元,而singo此時正好在外面胡吃海塞後在收銀臺買單,消費1000元,即新增了一條1000元的消費記錄(insert transaction ... ),並提交了事務,隨後singo的老婆將singo當月信用卡消費的明細打印到A4紙上,卻發現消費總額爲1080元,singo的老婆很詫異,覺得出現了幻覺,幻讀就這樣產生了。
注:Mysql的默認隔離級別就是Repeatable read。
Serializable是最高的事務隔離級別,同時代價也花費最高,性能很低,通常不多使用,在該級別下,事務順序執行,不只能夠避免髒讀、不可重複讀,還避免了幻像讀。
分佈式事務就是指事務的參與者、支持事務的服務器、資源服務器以及事務管理器分別位於不一樣的分佈式系統的不一樣節點之上。簡單的說,就是一次大的操做由不一樣的小操做組成,這些小的操做分佈在不一樣的服務器上,且屬於不一樣的應用,分佈式事務須要保證這些小操做要麼所有成功,要麼所有失敗。本質上來講,分佈式事務就是爲了保證不一樣數據庫的數據一致性。
當數據庫單表一年產生的數據超過1000W,那麼就要考慮分庫分表,具體分庫分表的原理在此不作解釋,之後有空詳細說,簡單的說就是原來的一個數據庫變成了多個數據庫。這時候,若是一個操做既訪問01庫,又訪問02庫,並且要保證數據的一致性,那麼就要用到分佈式事務。
1.二、應用SOA化
所謂的SOA化,就是業務的服務化。好比原來單機支撐了整個電商網站,如今對整個網站進行拆解,分離出了訂單中心、用戶中心、庫存中心。對於訂單中心,有專門的數據庫存儲訂單信息,用戶中心也有專門的數據庫存儲用戶信息,庫存中心也會有專門的數據庫存儲庫存信息。這時候若是要同時對訂單和庫存進行操做,那麼就會涉及到訂單數據庫和庫存數據庫,爲了保證數據一致性,就須要用到分佈式事務。
以上兩種狀況表象不一樣,可是本質相同,都是由於要操做的數據庫變多了!
所謂的原子性就是說,在整個事務中的全部操做,要麼所有完成,要麼所有不作,沒有中間狀態。對於事務在執行中發生錯誤,全部的操做都會被回滾,整個事務就像從沒被執行過同樣。
事務的執行必須保證系統的一致性,就拿轉帳爲例,A有500元,B有300元,若是在一個事務裏A成功轉給B50元,那麼無論併發多少,無論發生什麼,只要事務執行成功了,那麼最後A帳戶必定是450元,B帳戶必定是350元。
所謂的隔離性就是說,事務與事務之間不會互相影響,一個事務的中間狀態不會被其餘事務感知。
所謂的持久性,就是說一單事務完成了,那麼事務對數據所作的變動就徹底保存在了數據庫中,即便發生停電,系統宕機也是如此。
最經典的場景就是支付了,一筆支付,是對買家帳戶進行扣款,同時對賣家帳戶進行加錢,這些操做必須在一個事務裏執行,要麼所有成功,要麼所有失敗。而對於買家帳戶屬於買家中心,對應的是買家數據庫,而賣家帳戶屬於賣家中心,對應的是賣家數據庫,對不一樣數據庫的操做必然須要引入分佈式事務。
買家在電商平臺下單,每每會涉及到兩個動做,一個是扣庫存,第二個是更新訂單狀態,庫存和訂單通常屬於不一樣的數據庫,須要使用分佈式事務保證數據一致性。
XA是一個分佈式事務協議,由Tuxedo提出。XA中大體分爲兩部分:事務管理器和本地資源管理器。其中本地資源管理器每每由數據庫實現,好比Oracle、DB2這些商業數據庫都實現了XA接口,而事務管理器做爲全局的調度者,負責各個本地資源的提交和回滾。XA實現分佈式事務的原理以下:
總的來講,XA協議比較簡單,並且一旦商業數據庫實現了XA協議,使用分佈式事務的成本也比較低。可是,XA也有致命的缺點,那就是性能不理想,特別是在交易下單鏈路,每每併發量很高,XA沒法知足高併發場景。XA目前在商業數據庫支持的比較理想,在mysql數據庫中支持的不太理想,mysql的XA實現,沒有記錄prepare階段日誌,主備切換回致使主庫與備庫數據不一致。許多nosql也沒有支持XA,這讓XA的應用場景變得很是狹隘。
所謂的消息事務就是基於消息中間件的兩階段提交,本質上是對消息中間件的一種特殊利用,它是將本地事務和發消息放在了一個分佈式事務裏,保證要麼本地操做成功成功而且對外發消息成功,要麼二者都失敗,開源的RocketMQ就支持這一特性,具體原理以下:
一、A系統向消息中間件發送一條預備消息
二、消息中間件保存預備消息並返回成功
三、A執行本地事務
四、A發送提交消息給消息中間件
經過以上4步完成了一個消息事務。對於以上的4個步驟,每一個步驟均可能產生錯誤,下面一一分析:
基於消息中間件的兩階段提交每每用在高併發場景下,將一個分佈式事務拆成一個消息事務(A系統的本地操做+發消息)+B系統的本地操做,其中B系統的操做由消息驅動,只要消息事務成功,那麼A操做必定成功,消息也必定發出來了,這時候B會收到消息去執行本地操做,若是本地操做失敗,消息會重投,直到B操做成功,這樣就變相地實現了A與B的分佈式事務。原理以下:
雖然上面的方案可以完成A和B的操做,可是A和B並非嚴格一致的,而是最終一致的,咱們在這裏犧牲了一致性,換來了性能的大幅度提高。固然,這種玩法也是有風險的,若是B一直執行不成功,那麼一致性會被破壞,具體要不要玩,仍是得看業務可以承擔多少風險。
所謂的TCC編程模式,也是兩階段提交的一個變種。TCC提供了一個編程框架,將整個業務邏輯分爲三塊:Try、Confirm和Cancel三個操做。以在線下單爲例,Try階段會去扣庫存,Confirm階段則是去更新訂單狀態,若是更新訂單失敗,則進入Cancel階段,會去恢復庫存。總之,TCC就是經過代碼人爲實現了兩階段提交,不一樣的業務場景所寫的代碼都不同,複雜度也不同,所以,這種模式並不能很好地被複用。
分佈式事務,本質上是對多個數據庫的事務進行統一控制,按照控制力度能夠分爲:不控制、部分控制和徹底控制。不控制就是不引入分佈式事務,部分控制就是各類變種的兩階段提交,包括上面提到的消息事務+最終一致性、TCC模式,而徹底控制就是徹底實現兩階段提交。部分控制的好處是併發量和性能很好,缺點是數據一致性減弱了,徹底控制則是犧牲了性能,保障了一致性,具體用哪一種方式,最終仍是取決於業務場景。做爲技術人員,必定不能忘了技術是爲業務服務的,不要爲了技術而技術,針對不一樣業務進行技術選型也是一種很重要的能力。
三大好處
1:可以提升數據檢索的效率,下降讀取數據庫的IO成本
2:可以提升排序檢索的性能
3:可以提升分組檢索的性能
兩大壞處
1:增長硬盤存儲空間
2:增長增刪改帶來的IO量
建立索引的通常依據:
1:爲較爲頻繁的查詢條件字段建立索引
2:惟一性太差的字段不適合單首創建索引,即便頻繁做爲查詢條件(指類型、狀態這些字段,會增長存儲引擎IO訪問量)
3:更新很是頻繁的字段不適合建立索引
4:不會出如今 WHERE 子句中的字段不應建立索引