問題背景知識若是沒有Buffer Pool ,那麼查詢流程會如何?Buffer Pool 如何提升寫的效率的髒頁存在的價值?頁的替換規則因此要淘汰哪些頁面呢?結語mysql
在講解Buffer Pool 以前須要知道一些背景知識:web
讓咱們來模擬一個簡單的場景,假設有個表school , 其中有1000條數據,如今執行查詢redis
select * from school where id = 400
複製代碼
咱們須要獲取 id 爲400的學校全部信息。算法
查詢完id =400 後,又來了一條查詢語句:sql
select * from school where id = 401
複製代碼
因而Innodb 又得按照上面流程再走一遍, 從磁盤中找到對應的頁面,放到內存, 找到結果釋放內存。
那麼分析上面的過程,咱們能夠知道每次搜索都會進行磁盤IO,而磁盤IO的速度相對於CPU,內存的計算速度是遠遠不及的。
爲了避免
每一次搜索都須要進行磁盤IO, 那麼InnoDB 引入了 Buffer Pool 來充當緩存``
。
因此查詢流程就變爲:數據庫
Buffer Pool
中查找 id= 400 這條記錄所在的頁,若是該頁存在,則直接查詢到記錄返回,若是該頁不存在,則從磁盤進行讀取,放入Buffer Pool,返回記錄。(這個過程就是咱們平時使用redis充當緩存的過程。先判斷某個key 存不存在,若是存在則讀取記錄返回,若是不存在,則查詢數據庫,將記錄存放到redis ,返回記錄。)緩存
Buffer Pool 的功能就是 緩存「頁」 ,減小磁盤IO,提升讀寫效率。app
如今咱們須要給某個學習修更名稱,假設原來 id=400 的學校名稱爲 「aa"學習
update school set name = 'xs' where id = 400
複製代碼
更新語句的流程爲:spa
從上面流程中發現一個問題沒有, 咱們知道Buffer Pool 是一塊內存空間,咱們修改了Buffer Pool 中的記錄,可是並無把記錄從新寫回到磁盤文件
中。也就是說此時磁盤中記錄的信息 和 Buffer Pool 中記錄的信息是不一致
的。
例子中 這個時候 磁盤中id=400 對應的記錄學校名稱仍是"aa" ,而 Buffer Pool 中對應名稱則爲「xs"。
這種磁盤記錄的信息與Buffer Pool 記錄的信息不一致的頁, 稱爲髒頁
這種磁盤和Buffer Pool 記錄信息不一致的狀況還會有價值? 咱們來想一下這種狀況,好比咱們須要批量更新一批數據。
update school set name = 'xs' where id > 400
複製代碼
這個時候會找到Buffer Pool中對應的頁,而後修改。 例子中600條記錄有大機率是存在在同一頁面中
的。上面提到過頁中的記錄是按索引排序的,並且通常16K大小的頁,能存放的記錄數是幾百上千條。
因爲不是每一條記錄更改都會更新到磁盤,因此上面的更新語句大大節省了時間,畢竟寫數據到磁盤是十分耗時的。
固然髒頁也不可能一直存在在Buffer Pool 中,總要將信息刷新到磁盤中。否則若是程序出問題,或者機器斷電,更新的信息不就丟失了嘛。
那麼何時會把Buffer Pool 中的信息更新到磁盤中呢?
Buffer Pool 是一片內存空間,受制於內存空間大小。 能夠經過innodb_buffer_pool_size 來控制Buffer Pool 的大小。因此Buffer Pool 內存放的頁 數量也是有限的。假設Buffer Pool 中只能存放1000個頁,而且已經存滿。 那麼若是下一次查詢的記錄並不在這1000頁中,須要從磁盤讀取相應頁 加載到Buffer Pool 中。因爲Buffer Pool 已經滿了,因此必需要把其中某一個頁面先移除, 才能把新的頁面放進來。
咱們知道若是查詢或者修改記錄,記錄的頁已經存在在Buffer Pool 中那麼將有效的提升效率。最理想的狀況是每次訪問頁面都已經存在在Buffer Pool 中,咱們稱爲 緩存命中。淘汰頁面的算法,對 緩存命中率 相當重要。
因爲Buffer Pool的緩存淘汰規則比較複雜,後面另開一篇進行講解。核心思想就是把最近最少使用的頁面淘汰,也就是 LRU (Least recently used)算法。
喜歡和支持,請關注下我的公衆號,謝謝。