【Mysql技術內幕InnoDB存儲引擎】讀書筆記

時間 2019-11-06

標籤 mysql 技術內幕 innodb 存儲引擎讀書筆記欄目 MySQL 简体版

原文原文鏈接

1、存儲引擎

一、InnoDB引擎

設計目標是面向在線事務（OLTP）處理的應用。php

支持事務、行級鎖、經過多版本併發控制（MVCC）支持高併發、提供一致性非鎖定讀、next-key locking避免幻讀、主鍵彙集索引前端

二、MyISAM引擎

設計目標是面向OLAP應用。mysql

不支持事務、不支持行鎖、表鎖設計、支持全文索引算法

三、其餘存儲引擎

略sql

2、InnoDB體系結構

一、線程模型

InnoDB存儲引擎是多線程模型，後臺有多個不一樣的線程，用於處理不一樣的任務。數據庫

Master Thread：核心線程，將緩衝池中的數據異步刷新到磁盤
IO Thread：負責io請求的回調處理
Purge Thread：負責undo頁的回收
Page Cleaner Thread：負責髒頁的刷新

1.一、Master Thread

內部由多個循環組成。包括主循環（loop），後臺循環（background loop）緩存

主循環每隔一秒的操做數據結構

把日誌緩衝刷新到磁盤，即便這個事務尚未提交。很好的解釋了再大的事務提交時間也很短
合併插入緩衝
至多刷新n（可配置，自動調整，1.2版本以後）個髒頁到磁盤
沒有用戶活動，切換到background loop

主循環每隔10秒的操做多線程

合併最多5個插入緩衝
緩衝日誌刷新到磁盤
刪除無用的undo頁
刷新髒頁到磁盤（超過70%，刷新100頁，沒超過70%，刷新10頁）

二、內存模型

2.一、緩衝池

InnoDB是基於磁盤的存儲系統，爲了彌補cpu和磁盤性能的差距，將從磁盤讀出的數據保存在內存中，下次讀取先從緩衝池中讀取。有數據更新也先更新緩衝池的數據，經過checkpoint機制寫回磁盤。緩衝池中包括索引頁、數據頁、undo頁、插入緩存、鎖信息等架構

2.二、緩衝池管理（LRU List）

最近作少使用算法，最頻繁使用的頁在List前端，最少使用的頁在List末尾。當緩衝池容量不足容納新數據時，先從尾部釋放數據頁。新數據插入在List的midpoint（List的5/8，對樸素LRU的優化，樸素LRU插入List頭部。避免大量一次性查詢把頻繁使用的頁刷出緩衝池）

2.三、髒頁管理（Flush List）

當數據被更新，緩衝池中的數據首先被更新，修改以後的頁稱爲髒頁。髒頁會保存到Flush List中，經過checkpoint機制把髒頁數據寫回磁盤

2.四、重作日誌（redo log）緩衝

首先把重作日誌信息存入緩衝區，而後按照必定頻率同步到重作日誌文件中。如下三種狀況都會觸發重作日誌緩存同步到重作日誌文件：

Master Thread 每隔一秒刷新
每一個事務提交時
重作日誌緩衝池容量達到閾值，通常是1/2

2.五、check point技術

爲了防止宕機致使事務未提交信息丟失，在事務提交時，先把數據保存到重作日誌（redo log）中，再修改頁。保證了持久性（D）

發生宕機，重啓以後自動從重作日誌中恢復數據。

可是這裏有如下問題：

重作日誌過大，宕機重啓恢復數據太慢
重作日誌不能無限擴容，須要循環利用
重作日誌不可用怎麼辦

check point就是爲了解決這些問題：

縮短數據庫恢復時間
重作日誌不可用，刷新髒頁
緩衝池不夠用，將髒頁刷新到磁盤

check point觸發時機：

Master Thread check point。每隔一秒觸發一次
LRU List check point。保證LRU List中有100個空閒頁，若是清理的頁中有髒頁，觸發check point 強制刷新髒頁數據到磁盤
Dirty Page too mush check point。髒頁太多，超過閾值，觸發check point 強制刷新髒頁數據到磁盤

三、關鍵特性

3.一、插入緩存

（1）爲何須要插入緩存？

咱們知道索引分爲彙集索引和非彙集索引。

彙集索引通常是自增的惟一id，頁中的數據記錄按順序存放，寫入的時候不須要隨機讀取其餘頁中的數據，寫入速度很快（若是用UUID做爲主鍵，寫入速度會很慢，每次寫入都須要隨機讀）

實際應用中，一張表每每還有非彙集索引的存在。非彙集索引葉子節點的插入不是順序的，須要離散的訪問非彙集索引頁，隨機讀取致使了插入數據的性能降低。插入緩存就是爲了優化這種場景下的插入速度

（2）什麼場景會觸發插入緩存？

索引是輔助索引
索引不是惟一索引

對於非彙集索引的插入，會先判斷非彙集索引頁是否在緩衝池中，若是在緩衝池中，直接插入索引頁，若是沒在，先放入到insert buffer對象中，而後再以必定的頻率把insert buffer中的數據和非彙集索引的葉子節點進行數據合併

（3）實現原理

insert buffer 的數據結構也是B+樹，有記錄要插入的時候，會對記錄進行封裝，按照記錄的插入順序進行編號，是順序寫入

3.二、兩次寫

（1）爲何須要插入兩次寫？

若是InnoDB正在寫入某個頁的數據到磁盤，正好寫了一部分的時候宕機了。這種狀況稱爲部分寫失效，會致使數據丟失

（2）實現原理

double write由兩部分組成。一部分是double write緩衝，一部分是物理磁盤連續共享空間。在刷新髒頁數據的時候，先複製一份髒頁數據到兩次寫緩存中，在順序寫入共享磁盤中（由於是順序寫性能影響不大）。最後寫入數據存儲磁盤中（離散寫）

3.三、自適應hash索引優化

hash是很是快的查詢方式，時間負責度爲O（1）。而B+樹的查找次數取決於樹的高度。

若是一個頁被頻繁的訪問，並且訪問模式也相同（聯合索引使用最左原則）。會自動針對這頁數據根據緩衝池中的索引創建Hash索引提升查詢速度

3.四、異步IO

能夠在發出一個IO請求後，在發出另外的IO請求，不必等待上一次的IO請求處理完成。把所有IO請求都發出，等待全部IO操做的完成，這就是AIO（Aysnc IO）

3、文件

MySQL據庫和InnoDB存儲引擎有不少類型的文件，每種文件用處不一樣。主要有參數文件、sokcet文件、pid文件、日誌文件、表結構文件、存儲引擎文件

一、日誌文件

錯誤日誌：記錄啓動運行以及關閉遇到的錯誤信息
查詢日誌：記錄全部的查詢記錄
二進制文件（binlog）：記錄全部的數據更改記錄。用於數據恢復和數據複製。事務中未提交的二進制日誌會存放到緩衝中，等事務提交時直接將緩衝中的日誌同步到二進制文件中。經過配置能夠指定寫緩衝多少次以後同步到磁盤，若是值設置大於1，當發生宕機時可能會丟失數據
慢查詢日誌：查詢時間超過指定閾值的記錄