mysql(一)--mysql架構和執行流程

時間 2019-12-31

標籤 mysql 架構執行流程欄目 MySQL 简体版

原文原文鏈接

1. 一條查詢 SQL 語句是如何執行的？

咱們的程序或者工具要操做數據庫，第一步要作什麼事情？

跟數據庫創建鏈接。

1.1. 通訊協議

首先，MySQL 必需要運行一個服務，監聽默認的 3306 端口。

在咱們開發系統跟第三方對接的時候，必需要弄清楚的有兩件事。

第一個就是通訊協議，好比咱們是用 HTTP 仍是 WebService 仍是 TCP？

第二個是消息格式，好比咱們用 XML 格式，仍是 JSON 格式，仍是定長格式？報文

頭長度多少，包含什麼內容，每一個字段的詳細含義。

好比咱們以前跟銀聯對接，銀聯的銀行卡聯網規範，約定了一種比較複雜的通信協

議叫作：四進四出單工異步長鏈接（爲了保證穩定性和性能）。

1.1.1.通訊協議

MySQL 是支持多種通訊協議的，可使用同步/異步的方式，支持長鏈接/短鏈接。

這裏咱們拆分來看。第一個是通訊類型。

通訊類型：同步或者異步

同步通訊的特色：

一、同步通訊依賴於被調用方，受限於被調用方的性能。也就是說，應用操做數據庫，

線程會阻塞，等待數據庫的返回。

二、通常只能作到一對一，很難作到一對多的通訊

異步跟同步相反：

一、異步能夠避免應用阻塞等待，可是不能節省 SQL 執行的時間。

二、若是異步存在併發，每個 SQL 的執行都要單獨創建一個鏈接，避免數據混亂。

可是這樣會給服務端帶來巨大的壓力（一個鏈接就會建立一個線程，線程間切換會佔用

大量 CPU 資源）。另外異步通訊還帶來了編碼的複雜度，因此通常不建議使用。若是要

異步，必須使用鏈接池，排隊從鏈接池獲取鏈接而不是建立新鏈接。

通常來講咱們鏈接數據庫都是同步鏈接

鏈接方式：長鏈接或者短鏈接

MySQL 既支持短鏈接，也支持長鏈接。短鏈接就是操做完畢之後，立刻 close 掉。

長鏈接能夠保持打開，減小服務端建立和釋放鏈接的消耗，後面的程序訪問的時候還可

以使用這個鏈接。通常咱們會在鏈接池中使用長鏈接。

保持長鏈接會消耗內存。長時間不活動的鏈接，MySQL 服務器會斷開

show global variables like 'wait_timeout'; -- 非交互式超時時間，如 JDBC 程序 
show global variables like 'interactive_timeout'; -- 交互式超時時間，如數據庫工具

默認都是 28800 秒，8 小時。

咱們怎麼查看 MySQL 當前有多少個鏈接？

能夠用 show status 命令：

show global status like 'Thread%';

Threads_cached：緩存中的線程鏈接數。

Threads_connected：當前打開的鏈接數。

Threads_created：爲處理鏈接建立的線程數。

Threads_running：非睡眠狀態的鏈接數，一般指併發鏈接數。

每產生一個鏈接或者一個會話，在服務端就會建立一個線程來處理。反過來，若是要

殺死會話，就是 Kill 線程

有了鏈接數，怎麼知道當前鏈接的狀態？

也可使用 SHOW PROCESSLIST; （root 用戶）查看 SQL 的執行狀態。

https://dev.mysql.com/doc/refman/5.7/en/show-processlist.html

一些常見的狀態： https://dev.mysql.com/doc/refman/5.7/en/thread-commands.htmlhtml

MySQL 服務容許的最大鏈接數是多少呢？

在 5.7 版本中默認是 151 個，最大能夠設置成 16384（2^14）

show variables like 'max_connections';

show 的參數說明：

一、級別：會話 session 級別（默認）；全局 global 級別

二、動態修改：set，重啓後失效；永久生效，修改配置文件/etc/my.cnf

set global max_connections = 1000;

通訊協議

MySQL 支持哪些通訊協議呢？

第一種是 Unix Socket。

好比咱們在 Linux 服務器上，若是沒有指定-h 參數，它就用 socket 方式登陸（省略

了-S /var/lib/mysql/mysql.sock）。

它不用經過網絡協議，也能夠鏈接到 MySQL 的服務器，它須要用到服務器上的一個

物理文件（/var/lib/mysql/mysql.sock）。

select @@socket;

若是指定-h 參數，就會用第二種方式，TCP/IP 協議

mysql -h192.168.8.211 -uroot -p123456

咱們的編程語言的鏈接模塊都是用 TCP 協議鏈接到 MySQL 服務器的，好比

mysql-connector-java-x.x.xx.jar。

另外還有命名管道（Named Pipes）和內存共享（Share Memory）的方式，這兩種

通訊方式只能在 Windows 上面使用，通常用得比較少。

1.1.2.通訊方式

第二個是通訊方式

單工：

在兩臺計算機通訊的時候，數據的傳輸是單向的。生活中的類比：遙控器。

半雙工：

在兩臺計算機之間，數據傳輸是雙向的，你能夠給我發送，我也能夠給你發送，

可是在這個通信鏈接裏面，同一時間只能有一臺服務器在發送數據，也就是你要給我發

的話，也必須等我發給你完了以後才能給我發。生活中的類比：對講機。

全雙工：

數據的傳輸是雙向的，而且能夠同時傳輸。生活中的類比：打電話。

MySQL 使用了半雙工的通訊方式？

要麼是客戶端向服務端發送數據，要麼是服務端向客戶端發送數據，這兩個動做不能

同時發生。因此客戶端發送 SQL 語句給服務端的時候，（在一次鏈接裏面）數據是不能

分紅小塊發送的，無論你的 SQL 語句有多大，都是一次性發送。

好比咱們用 MyBatis 動態 SQL 生成了一個批量插入的語句，插入 10 萬條數據，

values

後面跟了一長串的內容，或者 where 條件 in 裏面的值太多，會出現問題。

這個時候咱們必需要調整 MySQL 服務器配置 max_allowed_packet 參數的值（默認

是 4M），把它調大，不然就會報錯

另外一方面，對於服務端來講，也是一次性發送全部的數據，不能由於你已經取到了想

要的數據就中斷操做，這個時候會對網絡和內存產生大量消耗。

因此，咱們必定要在程序裏面避免不帶 limit 的這種操做，好比一次把全部知足條件

的數據所有查出來，必定要先 count 一下。若是數據量的話，能夠分批查詢。

執行一條查詢語句，客戶端跟服務端創建鏈接以後呢？下一步要作什麼？

1.2. 查詢緩存

MySQL 內部自帶了一個緩存模塊。

緩存的做用咱們應該很清楚了，把數據以 KV 的形式放到內存裏面，能夠加快數據的

讀取速度，也能夠減小服務器處理的時間。可是 MySQL 的緩存咱們好像比較陌生，歷來

沒有去配置過，也不知道它何時生效？

好比 user_innodb 有 500 萬行數據，沒有索引。咱們在沒有索引的字段上執行一樣

的查詢，你們以爲第二次會快嗎？

select * from user_innodb where name='lei1';

緩存沒有生效，爲何？MySQL 的緩存默認是關閉的。

show variables like 'query_cache%';

默認關閉的意思就是不推薦使用，爲何 MySQL 不推薦使用它自帶的緩存呢？

主要是由於 MySQL 自帶的緩存的應用場景有限，第一個是它要求 SQL 語句必須一

模同樣，中間多一個空格，字母大小寫不一樣都被認爲是不一樣的的 SQL。

第二個是表裏面任何一條數據發生變化的時候，這張表全部緩存都會失效，因此對

於有大量數據更新的應用，也不適合。

因此緩存這一塊，咱們仍是交給 ORM 框架（好比 MyBatis 默認開啓了一級緩存），

或者獨立的緩存服務，好比 Redis 來處理更合適。

在 MySQL 8.0 中，查詢緩存已經被移除了

1.3. 語法解析和預處理(Parser & Preprocessor)

咱們沒有使用緩存的話，就會跳過緩存的模塊，下一步咱們要作什麼呢？

OK，這裏我會有一個疑問，爲何個人一條 SQL 語句可以被識別呢？假如我隨便執行一

個字符串 penyuyan，服務器報了一個 1064 的錯

[Err] 1064 - You have an error in your SQL syntax;

check the manual that corresponds to your MySQL server version for the right syntax to use near 'penyuyan' at line 1

它是怎麼知道我輸入的內容是錯誤的？

這個就是 MySQL 的 Parser 解析器和 Preprocessor 預處理模塊。

這一步主要作的事情是對語句基於 SQL 語法進行詞法和語法分析和語義的解析

1.3.1.詞法解析

詞法分析就是把一個完整的 SQL 語句打碎成一個個的單詞。

好比一個簡單的 SQL 語句：

select name from user where id = 1;

它會打碎成 8 個符號，每一個符號是什麼類型，從哪裏開始到哪裏結束

1.3.2.語法解析

第二步就是語法分析，語法分析會對 SQL 作一些語法檢查，好比單引號有沒有閉合，

而後根據 MySQL 定義的語法規則，根據 SQL 語句生成一個數據結構。這個數據結構我

們把它叫作解析樹（select_lex）。

任何數據庫的中間件，好比 Mycat，Sharding-JDBC（用到了 Druid Parser），都

必需要有詞法和語法分析功能，在市面上也有不少的開源的詞法解析的工具（好比 LEX，Yacc）。

1.3.3.預處理器

問題：若是我寫了一個詞法和語法都正確的 SQL，可是表名或者字段不存在，會在

哪裏報錯？是在數據庫的執行層仍是解析器？好比：

select * from penyuyan;

解析器能夠分析語法，可是它怎麼知道數據庫裏面有什麼表，表裏面有什麼字段呢？

實際上仍是在解析的時候報錯，解析 SQL 的環節裏面有個預處理器。

它會檢查生成的解析樹，解決解析器沒法解析的語義。好比，它會檢查表和列名是

否存在，檢查名字和別名，保證沒有歧義。

預處理以後獲得一個新的解析樹

1.4. 查詢優化（Query Optimizer）與查詢執行計劃

1.4.1.什麼是優化器？

獲得解析樹以後，是否是執行 SQL 語句了呢？

這裏咱們有一個問題，一條 SQL 語句是否是隻有一種執行方式？或者說數據庫最終

執行的 SQL 是否是就是咱們發送的 SQL？

這個答案是否認的。一條 SQL 語句是能夠有不少種執行方式的，最終返回相同的結

果，他們是等價的。可是若是有這麼多種執行方式，這些執行方式怎麼獲得的？最終選

擇哪種去執行？根據什麼判斷標準去選擇？

這個就是 MySQL 的查詢優化器的模塊（Optimizer）。

查詢優化器的目的就是根據解析樹生成不一樣的執行計劃（Execution Plan），而後選

擇一種最優的執行計劃，MySQL 裏面使用的是基於開銷（cost）的優化器，那種執行計劃開銷最小，就用哪一種。

可使用這個命令查看查詢的開銷：

show status like 'Last_query_cost';

https://dev.mysql.com/doc/refman/5.7/en/server-status-variables.html#statvar_Last_query_cost

1.4.2.優化器能夠作什麼？

MySQL 的優化器能處理哪些優化類型呢？

舉兩個簡單的例子：

一、當咱們對多張表進行關聯查詢的時候，以哪一個表的數據做爲基準表。

二、有多個索引可使用的時候，選擇哪一個索引。

實際上，對於每一種數據庫來講，優化器的模塊都是必不可少的，他們經過複雜的算法實現儘量優化查詢效率的目標。

若是對於優化器的細節感興趣，能夠看看《數據庫查詢優化器的藝術-原理解析與SQL性能優化》。

可是優化器也不是萬能的，並非再垃圾的 SQL 語句都能自動優化，也不是每次都

能選擇到最優的執行計劃，你們在編寫 SQL 語句的時候仍是要注意。

若是咱們想知道優化器是怎麼工做的，它生成了幾種執行計劃，每種執行計劃的 cost是多少，應該怎麼作？

1.4.3.優化器是怎麼獲得執行計劃的？

https://dev.mysql.com/doc/internals/en/optimizer-tracing.html

首先咱們要啓用優化器的追蹤（默認是關閉的）：

SHOW VARIABLES LIKE 'optimizer_trace'; 
set optimizer_trace='enabled=on';

注意開啓這開關是會消耗性能的，由於它要把優化分析的結果寫到表裏面，因此不

要輕易開啓，或者查看完以後關閉它（改爲 off）。

注意：參數分爲 session 和 global 級別。

接着咱們執行一個 SQL 語句，優化器會生成執行計劃：

select t.tcid from teacher t,teacher_contact tc where t.tcid = tc.tcid;

這個時候優化器分析的過程已經記錄到系統表裏面了，咱們能夠查詢：

select * from information_schema.optimizer_trace\G

它是一個 JSON 類型的數據，主要分紅三部分，準備階段、優化階段和執行階段。

expanded_query 是優化後的 SQL 語句。

considered_execution_plans 裏面列出了全部的執行計劃。

分析完記得關掉它：

set optimizer_trace="enabled=off";
SHOW VARIABLES LIKE 'optimizer_trace';

1.4.4.優化器獲得的結果

優化完以後，獲得一個什麼東西呢？

優化器最終會把解析樹變成一個查詢執行計劃，查詢執行計劃是一個數據結構。

固然，這個執行計劃是否是必定是最優的執行計劃呢？不必定，由於 MySQL 也有可

能覆蓋不到全部的執行計劃。

咱們怎麼查看 MySQL 的執行計劃呢？好比多張表關聯查詢，先查詢哪張表？在執行

查詢的時候可能用到哪些索引，實際上用到了什麼索引？

MySQL 提供了一個執行計劃的工具。咱們在 SQL 語句前面加上 EXPLAIN，就能夠

看到執行計劃的信息

EXPLAIN select name from user where id=1;

*注意 Explain 的結果也不必定最終執行的方式。

1.5. 存儲引擎

獲得執行計劃之後，SQL 語句是否是終於能夠執行了？

問題又來了：

一、從邏輯的角度來講，咱們的數據是放在哪裏的，或者說放在一個什麼結構裏面？

二、執行計劃在哪裏執行？是誰去執行？

1.5.1.存儲引擎基本介紹

咱們先回答第一個問題：在關係型數據庫裏面，數據是放在什麼結構裏面的？

（放在表 Table 裏面的）

咱們能夠把這個表理解成 Excel 電子表格的形式。因此咱們的表在存儲數據的同時，

還要組織數據的存儲結構，這個存儲結構就是由咱們的存儲引擎決定的，因此咱們也能夠把存儲引擎叫作表類型。

在 MySQL 裏面，支持多種存儲引擎，他們是能夠替換的，因此叫作插件式的存儲引擎。爲何要搞這麼多存儲引擎呢？一種還不夠用嗎？

這個問題先留着。

1.5.2.

查看存儲引擎

好比咱們數據庫裏面已經存在的表，咱們怎麼查看它們的存儲引擎呢？

show table status from `lei1`;

或者經過 DDL 建表語句來查看。

在 MySQL 裏面，咱們建立的每一張表均可以指定它的存儲引擎，而不是一個數據庫

只能使用一個存儲引擎。存儲引擎的使用是以表爲單位的。並且，建立表以後還能夠修改存儲引擎。

咱們說一張表使用的存儲引擎決定咱們存儲數據的結構，那在服務器上它們是怎麼

存儲的呢？咱們先要找到數據庫存放數據的路徑：

show variables like 'datadir';

默認狀況下，每一個數據庫有一個本身文件夾，以 gupao 數據庫爲例。

任何一個存儲引擎都有一個 frm 文件，這個是表結構定義文件。

不一樣的存儲引擎存放數據的方式不同，產生的文件也不同，innodb 是 1 個，

memory 沒有，myisam 是兩個。

這些存儲引擎的差異在哪呢？

1.5.3.存儲引擎比較

常見存儲引擎

MyISAM 和 InnoDB 是咱們用得最多的兩個存儲引擎，在 MySQL 5.5 版本以前，

默認的存儲引擎是 MyISAM，它是 MySQL 自帶的。咱們建立表的時候不指定存儲引擎，

它就會使用 MyISAM 做爲存儲引擎。

MyISAM 的前身是 ISAM（Indexed Sequential Access Method：利用索引，順序存取數據的方法）。

5.5 版本以後默認的存儲引擎改爲了 InnoDB，它是第三方公司爲 MySQL 開發的。

爲何要改呢？最主要的緣由仍是 InnoDB 支持事務，支持行級別的鎖，對於業務一致

性要求高的場景來講更適合。

這個裏面又有 Oracle 和 MySQL 公司的一段恩怨情仇。

InnoDB 原本是 InnobaseOy 公司開發的，它和 MySQL AB 公司合做開源了 InnoDB

的代碼。可是沒想到 MySQL 的競爭對手 Oracle 把 InnobaseOy 收購了。

後來 08 年 Sun 公司（開發 Java 語言的 Sun）收購了 MySQL AB，09 年 Sun 公司

又被 Oracle 收購了，因此 MySQL，InnoDB 又是一家了。有人以爲 MySQL 愈來愈像

Oracle，其實也是這個緣由

那麼除了這兩個咱們最熟悉的存儲引擎，數據庫還支持其餘哪些經常使用的存儲引擎呢？

數據庫支持的存儲引擎

咱們能夠用這個命令查看數據庫對存儲引擎的支持狀況：

show engines ;

其中有存儲引擎的描述和對事務、XA 協議和 Savepoints 的支持。XA 協議用來實現分佈式事務（分爲本地資源管理器，事務管理器）。

Savepoints 用來實現子事務（嵌套事務）。建立了一個 Savepoints 以後，事務就能夠回滾到這個點，不會影響到建立 Savepoints 以前的操做。

這些數據庫支持的存儲引擎，分別有什麼特性呢？

https://dev.mysql.com/doc/refman/5.7/en/storage-engines.html

MyISAM（3 個文件）

These tables have a small footprint. Table-level locking limits the performance in read/write workloads, so it is often used

in read-only or read-mostly workloads in Web and data warehousing configurations.

應用範圍比較小。表級鎖定限制了讀/寫的性能，所以在 Web 和數據倉庫配置中，

它一般用於只讀或以讀爲主的工做。

特色：

支持表級別的鎖（插入和更新會鎖表）。不支持事務。

擁有較高的插入（insert）和查詢（select）速度。

存儲了表的行數（count 速度更快）。

（怎麼快速向數據庫插入 100 萬條數據？咱們有一種先用 MyISAM 插入數據，而後

修改存儲引擎爲 InnoDB 的操做。）

適合：只讀之類的數據分析的項目

InnoDB（2 個文件）

https://dev.mysql.com/doc/refman/5.7/en/innodb-storage-engine.html

The default storage engine in MySQL 5.7. InnoDB is a transaction-safe (ACID compliant) storage engine for MySQL that

has commit, rollback, and crash-recovery capabilities to protect user data. InnoDB row-level locking (without escalation to

coarser granularity locks) and Oracle-style consistent nonlocking reads increase multi-user concurrency and performance.

InnoDB stores user data in clustered indexes to reduce I/O for common queries based on primary keys. To maintain data

integrity, InnoDB also supports FOREIGN KEY referential-integrity constraints.

mysql 5.7 中的默認存儲引擎。InnoDB 是一個事務安全（與 ACID 兼容）的 MySQL

存儲引擎，它具備提交、回滾和崩潰恢復功能來保護用戶數據。InnoDB 行級鎖（不升級

爲更粗粒度的鎖）和 Oracle 風格的一致非鎖讀提升了多用戶併發性和性能。InnoDB 將

用戶數據存儲在彙集索引中，以減小基於主鍵的常見查詢的 I/O。爲了保持數據完整性，

InnoDB 還支持外鍵引用完整性約束。

特色：

支持事務，支持外鍵，所以數據的完整性、一致性更高。

支持行級別的鎖和表級別的鎖。

支持讀寫併發，寫不阻塞讀（MVCC）。

特殊的索引存放方式，能夠減小 IO，提高查詢效率。

適合：常常更新的表，存在併發讀寫或者有事務處理的業務系統

Memory（1 個文件）

Stores all data in RAM, for fast access in environments that require quick lookups of non-critical data. This engine was

formerly known as the HEAP engine. Its use cases are decreasing; InnoDB with its buffer pool memory area provides a

general-purpose and durable way to keep most or all data in memory, and NDBCLUSTER provides fast key-value lookups for

huge distributed data sets.

將全部數據存儲在 RAM 中，以便在須要快速查找非關鍵數據的環境中快速訪問。這

個引擎之前被稱爲堆引擎。其使用案例正在減小；InnoDB 及其緩衝池內存區域提供了一

種通用、持久的方法來將大部分或全部數據保存在內存中，而 ndbcluster 爲大型分佈式

數據集提供了快速的鍵值查找。

特色：

把數據放在內存裏面，讀寫的速度很快，可是數據庫重啓或者崩潰，數據會所有消

失。只適合作臨時表。

將表中的數據存儲到內存中。

CSV（3 個文件）

Its tables are really text files with comma-separated values. CSV tables let you import or dump data in CSV format, to

exchange data with scripts and applications that read and write that same format. Because CSV tables are not indexed, you

typically keep the data in InnoDB tables during normal operation, and only use CSV tables during the import or export stage.

它的表其實是帶有逗號分隔值的文本文件。

csv表容許以csv格式導入或轉儲數據，

以便與讀寫相同格式的腳本和應用程序交換數據。由於 csv 表沒有索引，因此一般在正

常操做期間將數據保存在 innodb 表中，而且只在導入或導出階段使用 csv 表。

特色：不容許空行，不支持索引。格式通用，能夠直接編輯，適合在不一樣數據庫之

間導入導出

Archive（2 個文件）

These compact, unindexed tables are intended for storing and retrieving large amounts of seldom-referenced historical,

archived, or security audit information.

這些緊湊的未索引的表用於存儲和檢索大量不多引用的歷史、存檔或安全審計信息。

特色：不支持索引，不支持 update delete。

這是 MySQL 裏面常見的一些存儲引擎，咱們看到了，不一樣的存儲引擎提供的特性都

不同，它們有不一樣的存儲機制、索引方式、鎖定水平等功能。

咱們在不一樣的業務場景中對數據操做的要求不一樣，就能夠選擇不一樣的存儲引擎來滿

足咱們的需求，這個就是 MySQL 支持這麼多存儲引擎的緣由。

1.5.4.如何選擇存儲引擎？

若是對數據一致性要求比較高，須要事務支持，能夠選擇 InnoDB。

若是數據查詢多更新少，對查詢性能要求比較高，能夠選擇 MyISAM。

若是須要一個用於查詢的臨時表，能夠選擇 Memory。

若是全部的存儲引擎都不能知足你的需求，而且技術能力足夠，能夠根據官網內部

手冊用 C 語言開發一個存儲引擎

https://dev.mysql.com/doc/internals/en/custom-engine.html

1.6. 執行引擎（Query Execution Engine），返回結果

OK，存儲引擎分析完了，它是咱們存儲數據的形式，繼續第二個問題，是誰使用執

行計劃去操做存儲引擎呢？

這就是咱們的執行引擎，它利用存儲引擎提供的相應的 API 來完成操做。

爲何咱們修改了表的存儲引擎，操做方式不須要作任何改變？由於不一樣功能的存

儲引擎實現的 API 是相同的。

最後把數據返回給客戶端，即便沒有結果也要返回。

2. MySQL 體系結構總結

基於上面分析的流程，咱們一塊兒來梳理一下 MySQL 的內部模塊。

2.1. 模塊詳解

一、 Connector：用來支持各類語言和 SQL 的交互，好比 PHP，Python，Java 的

JDBC；

二、 Management Serveices & Utilities：系統管理和控制工具，包括備份恢復MySQL 複製、集羣等等；

三、 Connection Pool：鏈接池，管理須要緩衝的資源，包括用戶密碼權限線程等等；

四、 SQL Interface：用來接收用戶的 SQL 命令，返回用戶須要的查詢結果

五、 Parser：用來解析 SQL 語句；

六、 Optimizer：查詢優化器；

七、 Cache and Buffer：查詢緩存，除了行記錄的緩存以外，還有表緩存，Key 緩存，權限緩存等等；

八、 Pluggable Storage Engines：插件式存儲引擎，它提供 API 給服務層使用，跟具體的文件打交道

2.2. 架構分層

整體上，咱們能夠把 MySQL 分紅三層，跟客戶端對接的鏈接層，真正執行操做的服

務層，和跟硬件打交道的存儲引擎層（參考 MyBatis：接口、核心、基礎）。

2.1.1.鏈接層

咱們的客戶端要鏈接到 MySQL 服務器 3306 端口，必需要跟服務端創建鏈接，那麼

管理全部的鏈接，驗證客戶端的身份和權限，這些功能就在鏈接層完成。

2.1.2.服務層

鏈接層會把 SQL 語句交給服務層，這裏面又包含一系列的流程：

好比查詢緩存的判斷、根據 SQL 調用相應的接口，對咱們的 SQL 語句進行詞法和語

法的解析（好比關鍵字怎麼識別，別名怎麼識別，語法有沒有錯誤等等）。

而後就是優化器，MySQL 底層會根據必定的規則對咱們的 SQL 語句進行優化，最

後再交給執行器去執行。

2.1.3.存儲引擎

存儲引擎就是咱們的數據真正存放的地方，在 MySQL 裏面支持不一樣的存儲引擎。

再往下就是內存或者磁盤。

3. 一條更新 SQL 是如何執行的？

講完了查詢流程，咱們是否是再講講更新流程、插入流程和刪除流程？

在數據庫裏面，咱們說的 update 操做其實包括了更新、插入和刪除。若是你們有看

過 MyBatis 的源碼，應該知道 Executor 裏面也只有 doQuery()和 doUpdate()的方法，

沒有 doDelete()和 doInsert()。

更新流程和查詢流程有什麼不一樣呢？

基本流程也是一致的，也就是說，它也要通過解析器、優化器的處理，最後交給執行器。

區別就在於拿到符合條件的數據以後的操做。

3.1. 緩衝池 Buffer Pool

首先，InnnoDB 的數據都是放在磁盤上的，InnoDB 操做數據有一個最小的邏輯單

位，叫作頁（索引頁和數據頁）。咱們對於數據的操做，不是每次都直接操做磁盤，因

爲磁盤的速度太慢了。InnoDB 使用了一種緩衝池的技術，也就是把磁盤讀到的頁放到一

塊內存區域裏面。這個內存區域就叫 Buffer Pool

下一次讀取相同的頁，先判斷是否是在緩衝池裏面，若是是，就直接讀取，不用再

次訪問磁盤。

修改數據的時候，先修改緩衝池裏面的頁。內存的數據頁和磁盤數據不一致的時候，

咱們把它叫作髒頁。InnoDB 裏面有專門的後臺線程把 Buffer Pool 的數據寫入到磁盤，

每隔一段時間就一次性地把多個修改寫入磁盤，這個動做就叫作刷髒。

Buffer Pool 是 InnoDB 裏面很是重要的一個結構，它的內部又分紅幾塊區域。這裏

咱們趁機到官網來認識一下 InnoDB 的內存結構和磁盤結構。

3.3.1.內存結構

Buffer Pool 主要分爲 3 個部分： Buffer Pool、Change Buffer、Adaptive Hash

Index，另外還有一個（redo）log buffer。

一、Buffer Pool

Buffer Pool 緩存的是頁面信息，包括數據頁、索引頁。

查看服務器狀態，裏面有不少跟 Buffer Pool 相關的信息：

SHOW STATUS LIKE '%innodb_buffer_pool%';

這些狀態均可以在官網查到詳細的含義，用搜索功能。

https://dev.mysql.com/doc/refman/5.7/en/server-status-variables.html

Buffer Pool 默認大小是 128M（134217728 字節），能夠調整。

查看參數（系統變量）：

SHOW VARIABLES like '%innodb_buffer_pool%';

這些參數均可以在官網查到詳細的含義，用搜索功能。

https://dev.mysql.com/doc/refman/5.7/en/server-system-variables.html

內存的緩衝池寫滿了怎麼辦？（Redis 設置的內存滿了怎麼辦？）InnoDB 用 LRU

算法來管理緩衝池（鏈表實現，不是傳統的 LRU，分紅了 young 和 old），通過淘汰的

數據就是熱點數據

內存緩衝區對於提高讀寫性能有很大的做用。思考一個問題：

當須要更新一個數據頁時，若是數據頁在 Buffer Pool 中存在，那麼就直接更新好了。

不然的話就須要從磁盤加載到內存，再對內存的數據頁進行操做。也就是說，若是

沒有命中緩衝池，至少要產生一次磁盤 IO，有沒有優化的方式呢？

二、Change Buffer 寫緩衝

若是這個數據頁不是惟一索引，不存在數據重複的狀況，也就不須要從磁盤加載索

引頁判斷數據是否是重複（惟一性檢查）。這種狀況下能夠先把修改記錄在內存的緩衝

池中，從而提高更新語句（Insert、Delete、Update）的執行速度。

這一塊區域就是 Change Buffer。5.5 以前叫 Insert Buffer 插入緩衝，如今也能支

持 delete 和 update。

最後把 Change Buffer 記錄到數據頁的操做叫作 merge。何時發生 merge？

有幾種狀況：在訪問這個數據頁的時候，或者經過後臺線程、或者數據庫 shut down、

redo log 寫滿時觸發。

若是數據庫大部分索引都是非惟一索引，而且業務是寫多讀少，不會在寫數據後立

刻讀取，就可使用 Change Buffer（寫緩衝）。寫多讀少的業務，調大這個值：

SHOW VARIABLES LIKE 'innodb_change_buffer_max_size';

表明 Change Buffer 佔 Buffer Pool 的比例，默認 25%。

三、Adaptive Hash Index

索引應該是放在磁盤的，爲何要專門把一種哈希的索引放到內存？下次課再說。

四、（redo）Log Buffer

思考一個問題：若是 Buffer Pool 裏面的髒頁尚未刷入磁盤時，數據庫宕機或者重

啓，這些數據丟失。若是寫操做寫到一半，甚至可能會破壞數據文件致使數據庫不可用。

爲了不這個問題，InnoDB 把全部對頁面的修改操做專門寫入一個日誌文件，而且

在數據庫啓動時從這個文件進行恢復操做（實現 crash-safe）——用它來實現事務的持

久性。

這個文件就是磁盤的 redo log（叫作重作日誌），對應於/var/lib/mysql/目錄下的

ib_logfile0 和 ib_logfile1，每一個 48M。

這種日志和磁盤配合的整個過程，其實就是 MySQL 裏的 WAL 技術

（Write-Ahead Logging），它的關鍵點就是先寫日誌，再寫磁盤。

show variables like 'innodb_log%';

問題：

一樣是寫磁盤，爲何不直接寫到 db file 裏面去？爲何先寫日誌再寫磁盤？

咱們先來了解一下隨機 I/O 和順序 I/O 的概念。

磁盤的最小組成單元是扇區，一般是 512 個字節。

操做系統和內存打交道，最小的單位是頁 Page。

操做系統和磁盤打交道，讀寫磁盤，最小的單位是塊 Block

若是咱們所須要的數據是隨機分散在不一樣頁的不一樣扇區中，那麼找到相應的數據需

要等到磁臂旋轉到指定的頁，而後盤片尋找到對應的扇區，才能找到咱們所須要的一塊

數據，一次進行此過程直到找完全部數據，這個就是隨機 IO，讀取數據速度較慢。

假設咱們已經找到了第一塊數據，而且其餘所需的數據就在這一塊數據後邊，那麼

就不須要從新尋址，能夠依次拿到咱們所需的數據，這個就叫順序 IO。

刷盤是隨機 I/O，而記錄日誌是順序 I/O，順序 I/O 效率更高。所以先把修改寫入日

志，能夠延遲刷盤時機，進而提高系統吞吐。

固然 redo log 也不是每一次都直接寫入磁盤，在 Buffer Pool 裏面有一塊內存區域

（Log Buffer）專門用來保存即將要寫入日誌文件的數據，默認 16M，它同樣能夠節省

磁盤 IO。

SHOW VARIABLES LIKE 'innodb_log_buffer_size';

須要注意：redo log 的內容主要是用於崩潰恢復。磁盤的數據文件，數據來自 buffer

pool。redo log 寫入磁盤，不是寫入數據文件。

那麼，Log Buffer 何時寫入 log file？

在咱們寫入數據到磁盤的時候，操做系統自己是有緩存的。flush 就是把操做系統緩

衝區寫入到磁盤。

log buffer 寫入磁盤的時機，由一個參數控制，默認是 1。

SHOW VARIABLES LIKE 'innodb_flush_log_at_trx_commit';

https://dev.mysql.com/doc/refman/5.7/en/innodb-parameters.html#sysvar_innodb_flush_log_at_trx_commit

這是內存結構的第 4 塊內容，redo log，它又分紅內存和磁盤兩部分。redo log 有

什麼特色？

一、redo log 是 InnoDB 存儲引擎實現的，並非全部存儲引擎都有。

二、不是記錄數據頁更新以後的狀態，而是記錄這個頁作了什麼改動，屬於物理日誌。

三、redo log 的大小是固定的，前面的內容會被覆蓋。

check point 是當前要覆蓋的位置。若是 write pos 跟 check point 重疊，說明 redo

log 已經寫滿，這時候須要同步 redo log 到磁盤中。

這是 MySQL 的內存結構，總結一下，分爲：

Buffer pool、change buffer、Adaptive Hash Index、 log buffer。

磁盤結構裏面主要是各類各樣的表空間，叫作 Table space。

3.3.2.磁盤結構

表空間能夠看作是 InnoDB 存儲引擎邏輯結構的最高層，全部的數據都存放在表空

間中。InnoDB 的表空間分爲 5 大類。

系統表空間 system tablespace

在默認狀況下 InnoDB 存儲引擎有一個共享表空間（對應文件/var/lib/mysql/

ibdata1），也叫系統表空間。

InnoDB 系統表空間包含 InnoDB 數據字典和雙寫緩衝區，Change Buffer 和 Undo

Logs），若是沒有指定 file-per-table，也包含用戶建立的表和索引數據。

一、undo 在後面介紹，由於有獨立的表空間。

二、數據字典：由內部系統表組成，存儲表和索引的元數據（定義信息）。

三、雙寫緩衝（InnoDB 的一大特性）：

InnoDB 的頁和操做系統的頁大小不一致，InnoDB 頁大小通常爲 16K，操做系統頁

大小爲 4K，InnoDB 的頁寫入到磁盤時，一個頁須要分 4 次寫

若是存儲引擎正在寫入頁的數據到磁盤時發生了宕機，可能出現頁只寫了一部分的

狀況，好比只寫了 4K，就宕機了，這種狀況叫作部分寫失效（partial page write），可

能會致使數據丟失

show variables like 'innodb_doublewrite';

咱們不是有 redo log 嗎？可是有個問題，若是這個頁自己已經損壞了，用它來作崩

潰恢復是沒有意義的。因此在對於應用 redo log 以前，須要一個頁的副本。若是出現了

寫入失效，就用頁的副原本還原這個頁，而後再應用 redo log。這個頁的副本就是 double

write，InnoDB 的雙寫技術。經過它實現了數據頁的可靠性。

跟 redo log 同樣，double write 由兩部分組成，一部分是內存的 double write，

一個部分是磁盤上的 double write。由於 double write 是順序寫入的，不會帶來很大的

開銷。

在默認狀況下，全部的表共享一個系統表空間，這個文件會愈來愈大，並且它的空

間不會收縮。

獨佔表空間 file-per-table tablespaces

咱們可讓每張表獨佔一個表空間。這個開關經過 innodb_file_per_table 設置，默

認開啓

SHOW VARIABLES LIKE 'innodb_file_per_table';

開啓後，則每張表會開闢一個表空間，這個文件就是數據目錄下的 ibd 文件（例如

/var/lib/mysql/gupao/user_innodb.ibd），存放表的索引和數據。

可是其餘類的數據，如回滾（undo）信息，插入緩衝索引頁、系統事務信息，二次

寫緩衝（Double write buffer）等仍是存放在原來的共享表空間內。

通用表空間 general tablespaces

通用表空間也是一種共享的表空間，跟 ibdata1 相似。

能夠建立一個通用的表空間，用來存儲不一樣數據庫的表，數據路徑和文件能夠自定

義。語法：

create tablespace ts2673 add datafile '/var/lib/mysql/ts2673.ibd' file_block_size=16K engine=innodb;

在建立表的時候能夠指定表空間，用 ALTER 修改表空間能夠轉移表空間。

create table t2673(id integer) tablespace ts2673;

不一樣表空間的數據是能夠移動的。

刪除表空間須要先刪除裏面的全部表：

drop table t2673; 
drop tablespace ts2673;

臨時表空間 temporary tablespaces

存儲臨時表的數據，包括用戶建立的臨時表，和磁盤的內部臨時表。對應數據目錄

下的 ibtmp1 文件。當數據服務器正常關閉時，該表空間被刪除，下次從新產生。

Redo log

磁盤結構裏面的 redo log，在前面已經介紹過了。

undo log tablespace

https://dev.mysql.com/doc/refman/5.7/en/innodb-undo-tablespaces.html

https://dev.mysql.com/doc/refman/5.7/en/innodb-undo-logs.html

undo log（撤銷日誌或回滾日誌）記錄了事務發生以前的數據狀態（不包括 select）。

若是修改數據時出現異常，能夠用 undo log 來實現回滾操做（保持原子性）。

在執行 undo 的時候，僅僅是將數據從邏輯上恢復至事務以前的狀態，而不是從物

理頁面上操做實現的，屬於邏輯格式的日誌。

redo Log 和 undo Log 與事務密切相關，統稱爲事務日誌。

undo Log 的數據默認在系統表空間 ibdata1 文件中，由於共享表空間不會自動收

縮，也能夠單首創建一個 undo 表空間。

show global variables like '%undo%';

有了這些日誌以後，咱們來總結一下一個更新操做的流程，這是一個簡化的過程。

name 原值是 lei1。

update user set name = 'penyuyan' where id=1;

一、事務開始，從內存或磁盤取到這條數據，返回給 Server 的執行器；

二、執行器修改這一行數據的值爲 penyuyan；

三、記錄 name=qingshan 到 undo log；

四、記錄 name=penyuyan 到 redo log；

五、調用存儲引擎接口，在內存（Buffer Pool）中修改 name=penyuyan；

六、事務提交。

內存和磁盤之間，工做着不少後臺線程。

3.3.3.後臺線程

（供瞭解）

後臺線程的主要做用是負責刷新內存池中的數據和把修改的數據頁刷新到磁盤。後

臺線程分爲：master thread，IO thread，purge thread，page cleaner thread。

master thread 負責刷新緩存數據到磁盤並協調調度其它後臺進程。

IO thread 分爲 insert buffer、log、read、write 進程。分別用來處理 insert buffer、

重作日誌、讀寫請求的 IO 回調。purge thread 用來回收 undo 頁。

page cleaner thread 用來刷新髒頁。

除了 InnoDB 架構中的日誌文件，MySQL 的 Server 層也有一個日誌文件，叫作

binlog，它能夠被全部的存儲引擎使用。

3.3. Binlog

https://dev.mysql.com/doc/refman/5.7/en/binary-log.html

binlog 以事件的形式記錄了全部的 DDL 和 DML 語句（由於它記錄的是操做而不是

數據值，屬於邏輯日誌），能夠用來作主從複製和數據恢復。

跟 redo log 不同，它的文件內容是能夠追加的，沒有固定大小限制。

在開啓了 binlog 功能的狀況下，咱們能夠把 binlog 導出成 SQL 語句，把全部的操

做重放一遍，來實現數據的恢復。

binlog 的另外一個功能就是用來實現主從複製，它的原理就是從服務器讀取主服務器

的 binlog，而後執行一遍。

配置方式和主從複製的實現原理在 Mycat 第二節課中有講述。

有了這兩個日誌以後，咱們來看一下一條更新語句是怎麼執行的：

例如一條語句：update teacher set name='盆魚宴' where id=1;

一、先查詢到這條數據，若是有緩存，也會用到緩存。

二、把 name 改爲盆魚宴，而後調用引擎的 API 接口，寫入這一行數據到內存，同時

記錄 redo log。這時 redo log 進入 prepare 狀態，而後告訴執行器，執行完成了，能夠隨時提交。

三、執行器收到通知後記錄 binlog，而後調用存儲引擎接口，設置 redo log爲 commit狀態。

四、更新完成。

這張圖片的重點（不必背下來）：

一、先記錄到內存，再寫日誌文件

二、記錄 redo log 分爲兩個階段。

三、存儲引擎和 Server 記錄不一樣的日誌。

三、先記錄 redo，再記錄 binlog。

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。