MySQL8.0 DDL原子性特性

1. DDL原子性概述

8.0以前並無統一的數據字典dd,server層和引擎層各有一套元數據,sever層的元數據包括(.frm,.opt,.par,.trg等),用於存儲表定義,分區表定義,觸發器定義等信息;innodb層也有本身一套元數據,包括表信息,索引信息等,這兩套元數據並無機制保證一致性,這就致使了在異常狀況下可能存在元數據不一致問題,一種典型場景下,刪表操做,sever層的frm已經成功刪除了,但引擎層數據字典並無更新,致使再建重名錶失敗的問題。一樣的,好比drop table t1,t2;可能出現只刪除了t1,而t2仍然存在等問題。mysql

8.0的一個重要工做是將數據字典統一,獨立了DD(數據字典)模塊,廢棄了server層的元數據,將innodb的元數據抽象出一條DD接口供server層和innnodb層公用。在DD的基礎上,引入了DDL的原子性特性,確保DDL操做要麼全作,要麼全不作的能力。實現這一套邏輯的關鍵點在於將ddl涉及到的修改,包括dd數據字典修改,引擎層的修改(建立文件,初始化tablespace,建立btree等)和寫binlog做爲一個「事務」利用事務的原子性特色來保證ddl操做的原子性。sql

2.DDL原子性實現原理

實現原子性的關鍵在於確保dd數據字典修改,引擎層的修改和寫binlog是一個事務。MySQL已有的XA事務機制能有效保證DML事務和binlog的一致性。而ddl數據字典也是經過innodb引擎存儲,所以作到dd數據字典修改和binlog一致是容易的;那麼還須要解決的一個問題是,dd數據字典和引擎層修改的一致性,引擎層的修改並不都是記redo的,好比建立文件,rename文件名,或者清理cache等,沒法簡單地經過XA機制解決問題,所以8.0還引入了一套DDL_LOG機制。具體而言,就是將不記redo的一些操做,經過記日誌的方式寫入到ddl_log表中,而這個表是innodb引擎表,經過保證ddl_log數據與dd數據字典修改達成一致,而最終解決dd數據字典修改,引擎層的修改和寫binlog一致性問題。bash

3.DD引入先後對比

   

                                                                    

4.DDL操做實現邏輯post

引入ddl_log表後,ddl操做在原有的基礎上有一些變化,主要有兩點,一點是在執行ddl的過程當中,會記錄ddl操做到ddl_log表中;另外一點是新增了一個post_ddl階段,ddl事務提交後,作一些ddl的收尾動做,好比drop-table,真正的刪除物理文件是在post-ddl階段作的。post-ddl作的事情主要就是,讀取ddl-log內容,進行回放執行。ddl操做類型以下:ui

enum class Log_Type : uint32_t {

/** Smallest log type */
SMALLEST_LOG = 1,

/** Drop an index tree */
FREE_TREE_LOG = 1,

/** Delete a file */
DELETE_SPACE_LOG,

/** Rename a file */
RENAME_SPACE_LOG,

/** Drop the entry in innodb_dynamic_metadata */
DROP_LOG,

/** Rename table in dict cache. */
RENAME_TABLE_LOG,

/** Remove a table from dict cache */
REMOVE_CACHE_LOG,

/** Alter Encrypt a tablespace */
ALTER_ENCRYPT_TABLESPACE_LOG,

/** Biggest log type */
BIGGEST_LOG = ALTER_ENCRYPT_TABLESPACE_LOG
};

經過innodb_print_ddl_logs開關,能夠看到ddl過程當中寫入到innodb_ddl_log表中的內容。下面會以幾個典型的ddl操做產生的ddl_log來講明如何保證ddl的原子性。spa

4.1 create table3d

語句:create table dd_tt(id int primary key, c1 int);  日誌

 [InnoDB] DDL log insert : [DDL record: DELETE SPACE, id=352, thread_id=23, space_id=71, old_file_path=./mysql/dd_tt.ibd]
 [InnoDB] DDL log delete : 352
 [InnoDB] DDL log insert : [DDL record: REMOVE CACHE, id=353, thread_id=23, table_id=1128, new_file_path=mysql/dd_tt]
 [InnoDB] DDL log delete : 353
 [InnoDB] DDL log insert : [DDL record: FREE, id=354, thread_id=23, space_id=71, index_id=231, page_no=4]
 [InnoDB] DDL log delete : 354
 [InnoDB] DDL log post ddl : begin for thread id : 23
 [InnoDB] DDL log post ddl : end for thread id : 23 

說明:code

1.全部insert操做都是一個單獨的事務,對應的逆向delete操做是整個ddl事務的一部分。orm

2.insert操做記錄的是文件操做的逆向操做,好比建table_space,逆向操做就是delete_space_log。

3.若是ddl事務最終成功,那麼全部逆向delete操做也最終生效,ddl_log日誌被正常清理;若是ddl事務執行過程當中失敗(好比實例crash),那麼delete操做回滾,ddl_log表中殘留3條insert_log,recover時,replay這些ddl_log,便可以清理ddl過程當中產生的垃圾。

4.crash-recovery時,若binlog已經落盤,則對應的ddl事務處於prepare狀態,那麼最終事務要提交,ddl_log被清理乾淨;若binlog沒有落盤,則ddl事務須要回滾,ddl_log表中殘留3條記錄,在故障恢復結束後,須要replay這些記錄,實際上就是建文件,建立btree等逆向操做,確保回滾後是乾淨的。

4.2 drop table

語句:drop table dd_tt;

[InnoDB] DDL log insert : [DDL record: DROP, id=355, thread_id=23, table_id=1128]
[InnoDB] DDL log insert : [DDL record: DELETE SPACE, id=356, thread_id=23, space_id=71, old_file_path=./mysql/dd_tt.ibd]
[InnoDB] DDL log post ddl : begin for thread id : 23
[InnoDB] DDL log replay : [DDL record: DELETE SPACE, id=356, thread_id=23, space_id=71, old_file_path=./mysql/dd_tt.ibd]
[InnoDB] DDL log replay : [DDL record: DROP, id=355, thread_id=23, table_id=1128]
[InnoDB] DDL log post ddl : end for thread id : 23

說明:對於drop操做而言,執行過程當中只是操做ddl_log,並不作真正的drop物理表操做。在post-ddl階段,會讀取ddl_log表中的記錄並replay,作真正的刪除動做。若是執行過程當中crash了,那麼整個ddl事務會回滾,這其中也包含ddl_log中的內容也會回滾,那麼整個drop操做就至關於沒發生同樣。

4.3  add index

語句:alter table dd_tt add index idx_c1(c1);

[InnoDB] DDL log insert : [DDL record: FREE, id=360, thread_id=23, space_id=72, index_id=233, page_no=5]         
[InnoDB] DDL log delete : 360
[InnoDB] DDL log post ddl : begin for thread id : 23                                                             
[InnoDB] DDL log post ddl : end for thread id : 23   

說明: 建索引與建表相似,insert操做部分是一個事務,單獨提交,配套會記錄一個delete操做,這個操做是整個ddl事務的一部分,事務若是最終提交,那麼ddl-log內容被刪除;若是事務最終回滾,那麼ddl-log中會殘留一條FREE-log,經過replay則能夠清理建好的索引,達到回滾的效果。  

4.4  drop index

語句:alter table dd_tt drop index idx_c1; 

[InnoDB] DDL log insert : [DDL record: FREE, id=361, thread_id=23, space_id=72, index_id=233, page_no=5]
[InnoDB] DDL log post ddl : begin for thread id : 23
[InnoDB] DDL log replay : [DDL record: FREE, id=361, thread_id=23, space_id=72, index_id=233, page_no=5]
[InnoDB] DDL log post ddl : end for thread id : 23 

說明:

與drop table相似,執行過程當中只記錄日誌,在post-ddl階段才進行真正的刪除操做。

4.5 add column

語句:alter table dd_tt add column c2 int;

[InnoDB] DDL log post ddl : begin for thread id : 23
[InnoDB] DDL log post ddl : end for thread id : 23

說明:

8.0加列是instant-ddl,只修改元數據,與dml事務相似,不依賴ddl-log保證原子性。

4.6 drop column

語句:alter table dd_tt drop column c2;

語句分解:

1.prepare階段:

create table #sql-ib1129-2815969725;

[InnoDB] DDL log insert : [DDL record: DELETE SPACE, id=362, thread_id=23, space_id=73, old_file_path=./mysql/#sql-ib1129-2815969725.ibd] 
[InnoDB] DDL log delete : 362
[InnoDB] DDL log insert : [DDL record: REMOVE CACHE, id=363, thread_id=23, table_id=1130, new_file_path=mysql/#sql-ib1129-2815969725]     
[InnoDB] DDL log delete : 363
[InnoDB] DDL log insert : [DDL record: FREE, id=364, thread_id=23, space_id=73, index_id=234, page_no=4]                                  
[InnoDB] DDL log delete : 364

2.peform階段:nothing about ddl-log

3.commit階段:

3.1 alter table dd_tt rename to #sql-ib1130-2815969726;

[InnoDB] DDL log insert : [DDL record: DROP, id=365, thread_id=23, table_id=1129]                  
[InnoDB] DDL log insert : [DDL record: RENAME SPACE, id=366, thread_id=23, space_id=72, old_file_path=./mysql/#sql-ib1130-2815969726.ibd, new_file_path=./mysql/dd_tt.ibd] [InnoDB] DDL log delete : 366 [InnoDB] DDL log insert : [DDL record: RENAME TABLE, id=367, thread_id=23, table_id=1129, old_file_path=mysql/#sql-ib1130-2815969726, new_file_path=mysql/dd_tt] [InnoDB] DDL log delete : 367

逆向操做:alter table mysql/#sql-ib1130-2815969726 rename to dd_tt;

3.2 alter table #sql-ib1129-2815969725 rename to dd_tt;

[InnoDB] DDL log insert : [DDL record: RENAME SPACE, id=368, thread_id=23, space_id=73, old_file_path=./mysql/dd_tt.ibd, new_file_path=./mysql/#sql-ib1129-2815969725.ibd]
[InnoDB] DDL log delete : 368
[InnoDB] DDL log insert : [DDL record: RENAME TABLE, id=369, thread_id=23, table_id=1130, old_file_path=mysql/dd_tt, new_file_path=mysql/#sql-ib1129-2815969725]
[InnoDB] DDL log delete : 369

逆向操做:alter table dd_tt rename to mysql/#sql-ib1129-2815969725;

[InnoDB] DDL log insert : [DDL record: RENAME SPACE, id=368, thread_id=23, space_id=73, old_file_path=./mysql/dd_tt.ibd, new_file_path=./mysql/#sql-ib1129-2815969725.ibd]
[InnoDB] DDL log delete : 368
[InnoDB] DDL log insert : [DDL record: RENAME TABLE, id=369, thread_id=23, table_id=1130, old_file_path=mysql/dd_tt, new_file_path=mysql/#sql-ib1129-2815969725]
[InnoDB] DDL log delete : 369

僅僅記錄操做,在post-ddl階段才作清理。                                                               

post-ddl階段: 

drop table #sql-ib1130-2815969726;

[InnoDB] DDL log insert : [DDL record: RENAME SPACE, id=368, thread_id=23, space_id=73, old_file_path=./mysql/dd_tt.ibd, new_file_path=./mysql/#sql-ib1129-2815969725.ibd]
[InnoDB] DDL log delete : 368
[InnoDB] DDL log insert : [DDL record: RENAME TABLE, id=369, thread_id=23, table_id=1130, old_file_path=mysql/dd_tt, new_file_path=mysql/#sql-ib1129-2815969725]
[InnoDB] DDL log delete : 369

說明:drop column是copy類型的ddl,基本邏輯是新建一張臨時表,拷貝數據,最後再進行一次rename操做。主要包括4個階段:

1.prepare階段:建臨時表的過程與建表過程的ddl-log操做相似,insert-log做爲單獨事務直接提交,delete-log是整個事務的一部分。

這個階段若是出現異常,ddl-log表中殘留了逆操做記錄,crash-recovery時,能夠在replay實現清理。

2.peform階段: 拷貝數據結束,實現online-ddl邏輯。

3.拷貝數據結束後,須要進行rename交換表名操做。

   1)DROP,刪除臨時表

   2)RENAME SPACE/TABLE 將./mysql/#sql-ib1130-2815969726.ibd 重命名爲dd_tt.idb

   3)REANAME SPACE/TABLE 將dd_tt.idb重名爲/#sql-ib1129-2815969725.idb

   4)記錄刪除舊錶sql-ib1130-2815969726.ibd操做,post-ddl階段作真正的刪除。

若是這個階段出現異常,一樣的insert-log單獨一個事務,delete做爲整個事務的一部分,insert-log會殘留在ddl-log表中,經過replay能夠作清理,還原dd_tt的數據,並清理臨時表#sql-ib1130-2815969726.ibd。

4.post-ddl階段:

  1).物理刪除舊文件./mysql/#sql-ib1130-2815969726.ibd

  2).清理mysql.innodb_dynamic_metadata中相關信息。

須要注意的是,因爲ddl-log表存放的內容實際上逆向操做,因此蒐集ddl-log時,其實是逆序蒐集回放的。

4.7 truncate table

語句:truncate table  dd_tt;

語句分解:

1.rename dd_tt to #sql-ib1130-2815969727;

[InnoDB] DDL log insert : [DDL record: RENAME SPACE, id=372, thread_id=23, space_id=73, old_file_path=./mysql/#sql-ib1130-2815969727.ibd, new_file_path=./mysql/dd_tt.ibd
[InnoDB] DDL log delete : 372

2.drop table #sql-ib1130-2815969727;

[InnoDB] DDL log insert : [DDL record: DROP, id=373, thread_id=23, table_id=1130]                 
[InnoDB] DDL log insert : [DDL record: DELETE SPACE, id=374, thread_id=23, space_id=73, old_file_path=./mysql/#sql-ib1130-2815969727.ibd] 

3.create table dd_tt;

[InnoDB] DDL log insert : [DDL record: DELETE SPACE, id=375, thread_id=23, space_id=74, old_file_path=./mysql/dd_tt.ibd]                  
[InnoDB] DDL log delete : 375
[InnoDB] DDL log insert : [DDL record: REMOVE CACHE, id=376, thread_id=23, table_id=1131, new_file_path=mysql/dd_tt]                      
[InnoDB] DDL log delete : 376
[InnoDB] DDL log insert : [DDL record: FREE, id=377, thread_id=23, space_id=74, index_id=235, page_no=4]                                  
[InnoDB] DDL log delete : 377
[InnoDB] DDL log post ddl : begin for thread id : 23                                                                                      
[InnoDB] DDL log replay : [DDL record: DELETE SPACE, id=374, thread_id=23, space_id=73, old_file_path=./mysql/#sql-ib1130-2815969727.ibd] 
[InnoDB] DDL log replay : [DDL record: DROP, id=373, thread_id=23, table_id=1130]               
[InnoDB] DDL log post ddl : end for thread id : 23 

說明: 

1.將dd_tt重命名爲sql-ib1130-2815969727

2.標記sql-ib1130-2815969727表刪除,post-ddl階段才真正刪除

3.新建表dd_tt,一樣的insert操做是做爲單獨事務提交,delete操做是整個事務的一部分,若是回滾,最終殘留了insert操做,經過replay動做清理。  

5.DDL操做代碼堆棧

5.1 create-table

Sql_cmd_create_table::execute
-->mysql_create_table
  -->mysql_create_table_no_lock
     -->create_table_impl
        -->rea_create_base_table
           -->ha_create_table
              -->ha_create
                 -->ha_innobase::create
                    -->innobase_basic_ddl::create_impl
                       -->create_table_info_t::create_table
                       {
                          ......
                       }

  -->trans_commit_implicit
     -->ha_commit_trans
        -->MYSQL_BIN_LOG::prepare
           -->ha_prepare_low  //全部事務引擎prepare
              {
                binlog_prepare
                innobase_xa_prepare
              }
        -->MYSQL_BIN_LOG::commit
           -->MYSQL_BIN_LOG::ordered_commit
              -->MYSQL_BIN_LOG::process_flush_stage_queue
                 -->MYSQL_BIN_LOG::flush_thread_caches
                    -->binlog_cache_mngr::flush
                       -->binlog_cache_data::flush
                          -->MYSQL_BIN_LOG::write_gtid
                             -->Log_event::write
                                -->MYSQL_BIN_LOG::Binlog_ofile::write  //寫binlog-gtid

                          -->MYSQL_BIN_LOG::write_cache
                             --> MYSQL_BIN_LOG::do_write_cache
                                 -->Binlog_cache_storage::copy_to
                                    -->stream_copy
                                       -->Binlog_event_writer::write
                                          -->MYSQL_BIN_LOG::Binlog_ofile::write //寫binlog-ddl語句
              -->MYSQL_BIN_LOG::sync_binlog_file
              -->MYSQL_BIN_LOG::process_commit_stage_queue
                 -->ha_commit_low
                    {
                       binlog_commit
                       innobase_commit
                       -->trx_commit_for_mysql
                          -->trx_commit
                              -->trx_commit_low
                                 -->trx_commit_in_memory
                                    -->trx_undo_insert_cleanup
                    }

  -->innobase_post_ddl(ht->post_ddl(thd))
     -->Log_DDL::post_ddl
        -->replay_by_thread_id
-->create_table_info_t::create_table
  -->create_table_def
     -->dict_mem_table_create //構造innodb內存是字典內存對象
     -->row_create_table_for_mysql
        -->dict_build_table_def
           -->dict_build_tablespace_for_table
              -->新建xxx.idb文件
              -->Log_DDL::write_delete_space_log
              {
                 -->Log_DDL::insert_delete_space_log
                    -->trx_start_internal //內部開啓事務,單獨提交。
                    -->構造DDL_Record(DELETE_SPACE_LOG)
                    -->DDL_Log_Table::insert(寫入物理B-Tree)
                 -->Log_DDL:delete_by_id //刪除ddl_log操做,做爲ddl事務的一部分。
               }
              -->fil_ibd_create
              -->初始化segment,extent,page
     -->Log_DDL::write_remove_cache_log
        -->Log_DDL::insert_remove_cache_log
        -->Log_DDL::delete_by_id
  -->create_index(主表,二級索引)
     -->dict_create_index_tree_in_mem
        -->btr_create
        -->Log_DDL::write_free_tree_log
           -->Log_DDL::insert_free_tree_log
           -->Log_DDL:delete_by_id
crash-recovery -->ha_post_recover -->post_recover_handlerton -->innobase_post_recover -->Log_DDL::recover -->Log_DDL::replay_all -->Log_DDL::replay { replay_delete_space_log replay_remove_cache_log replay_free_tree_log ...... } -->delete_by_ids -->DDL_Log_Table::remove

5.2 drop table

mysql_rm_table
    -->mysql_rm_table_no_locks
       -->drop_base_table
           -->ha_delete_table
              -—>handler::ha_delete_table
                 -->ha_innobase::delete_table
                   -->innobase_basic_ddl::delete_impl
                      -->row_drop_table_for_mysql
                         -->Log_DDL::write_drop_log     // 記錄刪innodb_dynamic_metadata日誌
                         -—>Log_DDL::write_delete_space_log       // 記錄刪ibd日誌
           -->dd::drop_table
               -->dd::cache::Dictionary_client::drop<dd::Table>
                   -->dd::cache::Storage_adapter::drop<dd::Table>
                        -->dd::sdi::drop
       -->innobase_post_ddl
           -->Log_DDL::post_ddl
              -->Log_DDL::replay_by_thread_id
                   -->Log_DDL::replay
                      —>Log_DDL::replay_delete_space_log // post-ddl 真正刪除innodb_dynamic_metadata
                      —>Log_DDL::replay_drop_log         // post-ddl 真正刪除ibd
                   -->delete_by_ids
                      -->DDL_Log_Table::remove

drop table時,只記錄刪除動做日誌,這些日誌做爲事務的總體的一部分,若是最終事務提交,那麼post_ddl階段會讀取日誌真正刪除;若是事務回滾,那麼ddl_log也會做爲事務的一部分而回滾。

參考文檔

https://dev.mysql.com/worklog/task/?id=9045

https://dev.mysql.com/worklog/task/?id=9173

https://dev.mysql.com/worklog/task/?id=9175

https://dev.mysql.com/worklog/task/?id=9525

https://dev.mysql.com/worklog/task/?id=9536

相關文章
相關標籤/搜索