事務指的是知足 ACID 特性的一組操做,能夠經過 Commit 提交一個事務,也可使用 Rollback 進行回滾。html
事務被視爲不可分割的最小單元,事務的全部操做要麼所有提交成功,要麼所有失敗回滾。git
回滾能夠用回滾日誌來實現,回滾日誌記錄着事務所執行的修改操做,在回滾時反向執行這些修改操做便可。github
數據庫在事務執行先後都保持一致性狀態。在一致性狀態下,全部事務對一個數據的讀取結果都是相同的。sql
一個事務所作的修改在最終提交之前,對其它事務是不可見的。數據庫
一旦事務提交,則其所作的修改將會永遠保存到數據庫中。即便系統發生崩潰,事務執行的結果也不能丟失,使用重作日誌來保證持久性。併發
事務的 ACID 特性概念簡單,但不是很好理解,主要是由於這幾個特性不是一種平級關係:數據庫設計
MySQL 默認採用自動提交模式。也就是說,若是不顯式使用START TRANSACTION
語句來開始一個事務,那麼每一個查詢都會被當作一個事務自動提交。函數
①併發修改;②修讀撤;③讀修讀1;④讀修讀2;性能
在併發環境下,事務的隔離性很難保證,所以會出現不少併發一致性問題。spa
T1 和 T2 兩個事務都對一個數據進行修改,T1 先修改,T2 隨後修改,T2 的修改覆蓋了 T1 的修改。
T1 修改一個數據,T2 隨後讀取這個數據。若是 T1 撤銷了此次修改,那麼 T2 讀取的數據是髒數據。
T2 讀取一個數據,T1 對該數據作了修改。若是 T2 再次讀取這個數據,此時讀取的結果和第一次讀取的結果不一樣。
T1 讀取某個範圍的數據,T2 在這個範圍內插入新的數據,T1 再次讀取這個範圍的數據,此時讀取的結果和和第一次讀取的結果不一樣。
產生併發不一致性問題主要緣由是破壞了事務的隔離性,解決方法是經過併發控制來保證隔離性。併發控制能夠經過封鎖來實現,可是封鎖操做須要用戶本身控制,至關複雜。數據庫管理系統提供了事務的隔離級別,讓用戶以一種更輕鬆的方式處理併發一致性問題。
MySQL 中提供了兩種封鎖粒度:行級鎖以及表級鎖。
應該儘可能只鎖定須要修改的那部分數據,而不是全部的資源。鎖定的數據量越少,發生鎖爭用的可能就越小,系統的併發程度就越高。【性能角度——優先使用行鎖級】
可是加鎖須要消耗資源,鎖的各類操做(包括獲取鎖、釋放鎖、以及檢查鎖狀態)都會增長系統開銷。所以封鎖粒度越小,系統開銷就越大。【耗能角度——優先使用表鎖級】
在選擇封鎖粒度時,須要在鎖開銷和併發程度之間作一個權衡。【取一個平衡值】
有如下兩個規定:
使用意向鎖(Intention Locks)能夠更容易地支持多粒度封鎖。
在存在行級鎖和表級鎖的狀況下,事務 T 想要對錶 A 加 X 鎖,就須要先檢測是否有其它事務對錶 A 或者表 A 中的任意一行加了鎖,那麼就須要對錶 A 的每一行都檢測一次,這是很是耗時的。
意向鎖在原來的 X/S 鎖之上引入了 IX/IS,IX/IS 都是表鎖,用來表示一個事務想要在表中的某個數據行上加 X 鎖或 S 鎖。有如下兩個規定:
經過引入意向鎖,事務 T 想要對錶 A 加 X 鎖,只須要先檢測是否有其它事務對錶 A 加了 X/IX/S/IS 鎖,若是加了就表示有其它事務正在使用這個表或者表中某一行的鎖,所以事務 T 加 X 鎖失敗。
解釋以下:
①一級封鎖協議【X鎖讀鎖】-丟失修改問題
事務 T 要修改數據 A 時必須加 X 鎖,直到 T 結束才釋放鎖。
能夠解決丟失修改問題,由於不能同時有兩個事務對同一個數據進行修改,那麼事務的修改就不會被覆蓋。
②二級封鎖協議【X鎖住不能讀數據】-讀髒數據
在一級的基礎上,要求讀取數據 A 時必須加 S 鎖,讀取完立刻釋放 S 鎖。
能夠解決讀髒數據問題,由於若是一個事務在對數據 A 進行修改,根據 1 級封鎖協議,會加 X 鎖,那麼就不能再加 S 鎖了,也就是不會讀入數據。
③三級封鎖協議【S鎖住防止數據變化】-不可重複讀
在二級的基礎上,要求讀取數據 A 時必須加 S 鎖,直到事務結束了才能釋放 S 鎖。
能夠解決不可重複讀的問題,由於讀 A 時,其它事務不能對 A 加 X 鎖,從而避免了在讀的期間數據發生改變。
加鎖和解鎖分爲兩個階段進行。
可串行化調度是指,經過併發控制,使得併發執行的事務結果與某個串行執行的事務結果相同。
事務遵循兩段鎖協議是保證可串行化調度的充分條件。例如如下操做知足兩段鎖協議,它是可串行化調度。
lock-x(A)...lock-s(B)...lock-s(C)...unlock(A)...unlock(C)...unlock(B)
但不是必要條件,例如如下操做不知足兩段鎖協議,可是它仍是可串行化調度。
lock-x(A)...unlock(A)...lock-s(B)...unlock(B)...lock-s(C)...unlock(C)
MySQL 的 InnoDB 存儲引擎採用兩段鎖協議,會根據隔離級別在須要的時候自動加鎖,而且全部的鎖都是在同一時刻被釋放,這被稱爲隱式鎖定。
InnoDB 也可使用特定的語句進行顯示鎖定:
SELECT ... LOCK In SHARE MODE; SELECT ... FOR UPDATE;
事務中的修改,即便沒有提交,對其它事務也是可見的。
一個事務只能讀取已經提交的事務所作的修改。換句話說,一個事務所作的修改在提交以前對其它事務是不可見的。
保證在同一個事務中屢次讀取一樣數據的結果是同樣的。
強制事務串行執行。
須要加鎖實現,而其它隔離級別一般不須要。
多版本併發控制(Multi-Version Concurrency Control, MVCC)是 MySQL 的 InnoDB 存儲引擎實現隔離級別的一種具體方式,用於實現提交讀和可重複讀這兩種隔離級別。而未提交讀隔離級別老是讀取最新的數據行,無需使用 MVCC。可串行化隔離級別須要對全部讀取的行都加鎖,單純使用 MVCC 沒法實現。
MVCC 在每行記錄後面都保存着兩個隱藏的列,用來存儲兩個版本號:【系統還原操做的鏡像】
如下實現過程針對可重複讀隔離級別。
當開始一個事務時,該事務的版本號確定大於當前全部數據行快照的建立版本號,理解這一點很關鍵。數據行快照的建立版本號是建立數據行快照時的系統版本號,系統版本號隨着建立事務而遞增,所以新建立一個事務時,這個事務的系統版本號比以前的系統版本號都大,也就是比全部數據行快照的建立版本號都大。
使用 MVCC 讀取的是快照中的數據,這樣能夠減小加鎖所帶來的開銷。
select * from table ...;
讀取的是最新的數據,須要加鎖。如下第一個語句須要加 S 鎖,其它都須要加 X 鎖。
select * from table where ? lock in share mode; select * from table where ? for update; insert; update; delete;
Next-Key Locks 是 MySQL 的 InnoDB 存儲引擎的一種鎖實現。
MVCC 不能解決幻影讀問題,Next-Key Locks 就是爲了解決這個問題而存在的。在可重複讀(REPEATABLE READ)隔離級別下,使用 MVCC + Next-Key Locks 能夠解決幻讀問題。
鎖定一個記錄上的索引,而不是記錄自己。
若是表沒有設置索引,InnoDB 會自動在主鍵上建立隱藏的聚簇索引,所以 Record Locks 依然可使用。
鎖定索引之間的間隙,可是不包含索引自己。例如當一個事務執行如下語句,其它事務就不能在 t.c 中插入 15。
SELECT c FROM t WHERE c BETWEEN 10 and 20 FOR UPDATE;
它是 Record Locks 和 Gap Locks 的結合,不只鎖定一個記錄上的索引,也鎖定索引之間的間隙。例如一個索引包含如下值:10, 11, 13, and 20,那麼就須要鎖定如下區間:
(-∞, 10] (10, 11] (11, 13] (13, 20] (20, +∞)
記 A->B 表示 A 函數決定 B,也能夠說 B 函數依賴於 A。
若是 {A1,A2,... ,An} 是關係的一個或多個屬性的集合,該集合函數決定了關係的其它全部屬性而且是最小的,那麼該集合就稱爲鍵碼。
對於 A->B,若是能找到 A 的真子集 A',使得 A'-> B,那麼 A->B 就是部分函數依賴,不然就是徹底函數依賴。
對於 A->B,B->C,則 A->C 是一個傳遞函數依賴。
如下的學生課程關係的函數依賴爲 {Sno, Cname} -> {Sname, Sdept, Mname, Grade},鍵碼爲 {Sno, Cname}。也就是說,肯定學生和課程以後,就能肯定其它信息。
Sno | Sname | Sdept | Mname | Cname | Grade |
---|---|---|---|---|---|
1 | 學生-1 | 學院-1 | 院長-1 | 課程-1 | 90 |
2 | 學生-2 | 學院-2 | 院長-2 | 課程-2 | 80 |
2 | 學生-2 | 學院-2 | 院長-2 | 課程-1 | 100 |
3 | 學生-3 | 學院-2 | 院長-2 | 課程-2 | 95 |
不符合範式的關係,會產生不少異常,主要有如下四種異常:
學生-2
出現了兩次。課程-1
須要刪除第一行和第三行,那麼 學生-1
的信息就會丟失。範式理論是爲了解決以上提到四種異常。
高級別範式的依賴於低級別的範式,1NF 是最低級別的範式。
第一範式:原子性;第二範式:去除部分依賴;第三範式:去除傳遞依賴;BC範式:去除主屬性內依賴;第四範式:去除多對多關係
第一範式:原子性、不可分【碼爲(id和課名)-部分依賴】
第二範式:在第一範式的基礎上去除部分依賴
第三範式:在第二範式的基礎上去除繼承依賴
Entity-Relationship,有三個組成部分:實體、屬性、聯繫。
用來進行關係型數據庫系統的概念設計。
包含一對一,一對多,多對多三種。
下圖的 Course 和 Student 是一對多的關係。
一個實體在聯繫出現幾回,就要用幾條線鏈接。
下圖表示一個課程的先修關係,先修關係出現兩個 Course 實體,第一個是先修課程,後一個是後修課程,所以須要用兩條線來表示這種關係。
雖然老師能夠開設多門課,而且能夠教授多名學生,可是對於特定的學生和課程,只有一個老師教授,這就構成了一個三元聯繫。
用一個三角形和兩條線來鏈接類和子類,與子類有關的屬性和聯繫都連到子類上,而與父類和子類都有關的連到父類上。
參考連接: