MySQL在線DDL gh-ost 使用說明

背景:

      做爲一個DBA,大表的DDL的變動大部分都是使用Percona的pt-online-schema-change,本文說明下另外一種工具gh-ost的使用:不依賴於觸發器,是由於他是經過模擬從庫,在row binlog中獲取增量變動,再異步應用到ghost表的。在使用gh-ost以前,能夠先看GitHub 開源的 MySQL 在線更改 Schema 工具【轉】文章或則官網瞭解其特性和原理。本文只對使用進行說明。html

說明:

1)下載安裝:https://github.com/github/gh-ost/tagspython

2)參數說明:gh-ost --help
Usage of gh-ost:
  --aliyun-rds:是否在阿里雲數據庫上執行。true
  --allow-master-master:是否容許gh-ost運行在雙主複製架構中,通常與-assume-master-host參數一塊兒使用
  --allow-nullable-unique-key:容許gh-ost在數據遷移依賴的惟一鍵能夠爲NULL,默認爲不容許爲NULL的惟一鍵。若是數據遷移(migrate)依賴的惟一鍵容許NULL值,則可能形成數據不正確,請謹慎使用。
  --allow-on-master:容許gh-ost直接運行在主庫上。默認gh-ost鏈接的從庫。
  --alter string:DDL語句
  --approve-renamed-columns ALTER:若是你修改一個列的名字,gh-ost將會識別到而且須要提供重命名列名的緣由,默認狀況下gh-ost是不繼續執行的,除非提供-approve-renamed-columns ALTER。
  --ask-pass:MySQL密碼
  --assume-master-host string:爲gh-ost指定一個主庫,格式爲」ip:port」或者」hostname:port」。在這主主架構裏比較有用,或則在gh-ost發現不到主的時候有用。
  --assume-rbr:確認gh-ost鏈接的數據庫實例的binlog_format=ROW的狀況下,能夠指定-assume-rbr,這樣能夠禁止從庫上運行stop slave,start slave,執行gh-ost用戶也不須要SUPER權限。
  --check-flag
  --chunk-size int:在每次迭代中處理的行數量(容許範圍:100-100000),默認值爲1000。
  --concurrent-rowcount:該參數若是爲True(默認值),則進行row-copy以後,估算統計行數(使用explain select count(*)方式),並調整ETA時間,不然,gh-ost首先預估統計行數,而後開始row-copy。
  --conf string:gh-ost的配置文件路徑。
  --critical-load string:一系列逗號分隔的status-name=values組成,當MySQL中status超過對應的values,gh-ost將會退出。-critical-load Threads_connected=20,Connections=1500,指的是當MySQL中的狀態值Threads_connected>20,Connections>1500的時候,gh-ost將會因爲該數據庫嚴重負載而中止並退出。
        Comma delimited status-name=threshold, same format as --max-load. When status exceeds threshold, app panics and quits
  --critical-load-hibernate-seconds int :負載達到critical-load時,gh-ost在指定的時間內進入休眠狀態。 它不會讀/寫任何來自任何服務器的任何內容。
  --critical-load-interval-millis int:當值爲0時,當達到-critical-load,gh-ost當即退出。當值不爲0時,當達到-critical-load,gh-ost會在-critical-load-interval-millis秒數後,再次進行檢查,再次檢查依舊達到-critical-load,gh-ost將會退出。
  --cut-over string:選擇cut-over類型:atomic/two-step,atomic(默認)類型的cut-over是github的算法,two-step採用的是facebook-OSC的算法。
  --cut-over-exponential-backoff
  --cut-over-lock-timeout-seconds int:gh-ost在cut-over階段最大的鎖等待時間,當鎖超時時,gh-ost的cut-over將重試。(默認值:3)
  --database string:數據庫名稱。
  --debug:debug模式。
  --default-retries int:各類操做在panick前重試次數。(默認爲60)
  --discard-foreign-keys:該參數針對一個有外鍵的表,在gh-ost建立ghost表時,並不會爲ghost表建立外鍵。該參數很適合用於刪除外鍵,除此以外,請謹慎使用。
  --dml-batch-size int:在單個事務中應用DML事件的批量大小(範圍1-100)(默認值爲10)
  --exact-rowcount:準確統計表行數(使用select count(*)的方式),獲得更準確的預估時間。
  --execute:實際執行alter&migrate表,默認爲noop,不執行,僅僅作測試並退出,若是想要ALTER TABLE語句真正落實到數據庫中去,須要明確指定-execute
  --exponential-backoff-max-interval int
  --force-named-cut-over:若是爲true,則'unpostpone | cut-over'交互式命令必須命名遷移的表
  --force-table-names string:在臨時表上使用的表名前綴
  --heartbeat-interval-millis int:gh-ost心跳頻率值,默認爲500
  --help
  --hooks-hint string:任意消息經過GH_OST_HOOKS_HINT注入到鉤子
  --hooks-path string:hook文件存放目錄(默認爲empty,即禁用hook)。hook會在這個目錄下尋找符合約定命名的hook文件來執行。
  --host string :MySQL IP/hostname
  --initially-drop-ghost-table:gh-ost操做以前,檢查並刪除已經存在的ghost表。該參數不建議使用,請手動處理原來存在的ghost表。默認不啓用該參數,gh-ost直接退出操做。
  --initially-drop-old-table:gh-ost操做以前,檢查並刪除已經存在的舊錶。該參數不建議使用,請手動處理原來存在的ghost表。默認不啓用該參數,gh-ost直接退出操做。
  --initially-drop-socket-file:gh-ost強制刪除已經存在的socket文件。該參數不建議使用,可能會刪除一個正在運行的gh-ost程序,致使DDL失敗。
  --master-password string :MySQL 主密碼
  --master-user string:MysQL主帳號
  --max-lag-millis int:主從複製最大延遲時間,當主從複製延遲時間超過該值後,gh-ost將採起節流(throttle)措施,默認值:1500s。
  --max-load string:逗號分隔狀態名稱=閾值,如:'Threads_running=100,Threads_connected=500'. When status exceeds threshold, app throttles writes
  --migrate-on-replica:gh-ost的數據遷移(migrate)運行在從庫上,而不是主庫上。 
  --nice-ratio float:每次chunk時間段的休眠時間,範圍[0.0…100.0]。0:每一個chunk時間段不休眠,即一個chunk接着一個chunk執行;1:每row-copy 1毫秒,則另外休眠1毫秒;0.7:每row-copy 10毫秒,則另外休眠7毫秒。
  --ok-to-drop-table:gh-ost操做結束後,刪除舊錶,默認狀態是不刪除舊錶,會存在_tablename_del表。
  --panic-flag-file string:當這個文件被建立,gh-ost將會當即退出。
  --password string :MySQL密碼
 --port int :MySQL端口,最好用從庫
  --postpone-cut-over-flag-file string:當這個文件存在的時候,gh-ost的cut-over階段將會被推遲,數據仍然在複製,直到該文件被刪除。
  --quiet:靜默模式。
  --replica-server-id uint : gh-ost的server_id
  --replication-lag-query string:棄用
  --serve-socket-file string:gh-ost的socket文件絕對路徑。
  --serve-tcp-port int:gh-ost使用端口,默認爲關閉端口。
  --skip-foreign-key-checks:肯定你的表上沒有外鍵時,設置爲'true',而且但願跳過gh-ost驗證的時間-skip-renamed-columns ALTER
  --skip-renamed-columns ALTER:若是你修改一個列的名字(如change column),gh-ost將會識別到而且須要提供重命名列名的緣由,默認狀況下gh-ost是不繼續執行的。該參數告訴gh-ost跳該列的數據遷移,讓gh-ost把重命名列做爲可有可無的列。該操做很危險,你會損失該列的全部值。
  --stack:添加錯誤堆棧追蹤。
  --switch-to-rbr:讓gh-ost自動將從庫的binlog_format轉換爲ROW格式。
  --table string:表名
  --test-on-replica:在從庫上測試gh-ost,包括在從庫上數據遷移(migration),數據遷移完成後stop slave,原表和ghost表馬上交換然後馬上交換回來。繼續保持stop slave,使你能夠對比兩張表。
  --test-on-replica-skip-replica-stop:當-test-on-replica執行時,該參數表示該過程當中不用stop slave。
  --throttle-additional-flag-file string:當該文件被建立後,gh-ost操做當即中止。該參數能夠用在多個gh-ost同時操做的時候,建立一個文件,讓全部的gh-ost操做中止,或者刪除這個文件,讓全部的gh-ost操做恢復。
  --throttle-control-replicas string:列出全部須要被檢查主從複製延遲的從庫。
  --throttle-flag-file string:當該文件被建立後,gh-ost操做當即中止。該參數適合控制單個gh-ost操做。-throttle-additional-flag-file string適合控制多個gh-ost操做。
  --throttle-http string
  --throttle-query string:節流查詢。每秒鐘執行一次。當返回值=0時不須要節流,當返回值>0時,須要執行節流操做。該查詢會在數據遷移(migrated)服務器上操做,因此請確保該查詢是輕量級的。
  --timestamp-old-table:在舊錶名中使用時間戳。 這會使舊錶名稱具備惟一且無衝突的交叉遷移
  --tungsten:告訴gh-ost你正在運行的是一個tungsten-replication拓撲結構。
  --user string :MYSQL用戶
  --verbose
  --version
View Code

3)使用說明:條件是操做的MySQL上須要的binlog模式是ROW。若是在一個從上測試也必須是ROW模式,還要開啓log_slave_updates。根據上面的參數說明按照需求進行調整。mysql

     環境:主庫:192.168.163.131;從庫:192.168.163.130git

DDL過程github

① 檢查有沒有外鍵和觸發器。
② 檢查表的主鍵信息。
③ 檢查是否主庫或從庫,是否開啓log_slave_updates,以及binlog信息  
④ 檢查gho和del結尾的臨時表是否存在
⑤ 建立ghc結尾的表,存數據遷移的信息,以及binlog信息等    
---以上校驗階段
⑥ 初始化stream的鏈接,添加binlog的監聽
---如下遷移階段
⑥ 建立gho結尾的臨時表,執行DDL在gho結尾的臨時表上
⑦ 開啓事務,按照主鍵id把源表數據寫入到gho結尾的表上,再提交,以及binlog apply。
---如下cut-over階段
⑧ lock源表,rename 表:rename 源表 to 源_del表,gho表 to 源表。
⑨ 清理ghc表。

1. 單實例上DDL: 單個實例至關於主庫,須要開啓--allow-on-master參數和ROW模式。算法

gh-ost --user="root" --password="root" --host=192.168.163.131  --database="test" --table="t1"  --alter="ADD COLUMN cc2 varchar(10),add column cc3 int not null default 0 comment 'test' " --allow-on-master  --execute

2. 主從上DDLsql

有2個選擇,一是按照1直接在主上執行同步到從上,另外一個鏈接到從庫,在主庫作遷移(只要保證從庫的binlog爲ROW便可,主庫不須要保證):shell

gh-ost --user="root" --password="root" --host=192.168.163.130  --database="test" --table="t" --initially-drop-old-table --alter="ADD COLUMN y1 varchar(10),add column y2 int not null default 0 comment 'test' "  --execute

此時的操做大體是:數據庫

  • 行數據在主庫上讀寫segmentfault

  • 讀取從庫的二進制日誌,將變動應用到主庫

  • 在從庫收集表格式,字段&索引,行數等信息

  • 在從庫上讀取內部的變動事件(如心跳事件)

  • 在主庫切換表

在執行DDL中,從庫會執行一次stop/start slave,要是肯定從的binlog是ROW的話能夠添加參數:--assume-rbr。若是從庫的binlog不是ROW,能夠用參數--switch-to-rbr來轉換成ROW,此時須要注意的是執行完畢以後,binlog模式不會被轉換成原來的值。--assume-rbr和--switch-to-rbr參數不能一塊兒使用。

3. 在從上進行DDL測試

gh-ost --user="root" --password="root" --host=192.168.163.130  --database="test" --table="t"  --alter="ADD COLUMN abc1 varchar(10),add column abc2 int not null default 0 comment 'test' " --test-on-replica  --switch-to-rbr --execute

參數--test-on-replica:在從庫上測試gh-ost,包括在從庫上數據遷移(migration),數據遷移完成後stop slave,原表和ghost表馬上交換然後馬上交換回來。繼續保持stop slave,使你能夠對比兩張表。若是不想stop slave,則能夠再添加參數:--test-on-replica-skip-replica-stop

上面三種是gh-ost操做模式,上面的操做中,到最後不會清理臨時表,須要手動清理,再下次執行以前果真臨時表還存在,則會執行失敗,能夠經過參數進行刪除:

--initially-drop-ghost-table:gh-ost操做以前,檢查並刪除已經存在的ghost表。該參數不建議使用,請手動處理原來存在的ghost表。默認不啓用該參數,gh-ost直接退出操做。

--initially-drop-old-table:gh-ost操做以前,檢查並刪除已經存在的舊錶。該參數不建議使用,請手動處理原來存在的ghost表。默認不啓用該參數,gh-ost直接退出操做。

--initially-drop-socket-file:gh-ost強制刪除已經存在的socket文件。該參數不建議使用,可能會刪除一個正在運行的gh-ost程序,致使DDL失敗。

--ok-to-drop-table:gh-ost操做結束後,刪除舊錶,默認狀態是不刪除舊錶,會存在_tablename_del表。

還有其餘的一些參數,好比:--exact-rowcount、--max-lag-millis、--max-load等等,能夠看上面的說明,具體大部分經常使用的參數命令以下:

gh-osc --user= --password= --host= --database= --table= --max-load=Threads_running=30, --chunk-size=1000 --serve-socket-file=/tmp/gh-ost.test.sock --exact-rowcount --allow-on-master/--test-on-replica --initially-drop-ghost-table/--initially-drop-old-table/--initially-drop-socket-file --max-lag-millis= --max-load='Threads_running=100,Threads_connected=500' --ok-to-drop-table

4)額外說明:終止、暫停、限速

gh-ost --user="root" --password="root" --host=192.168.163.131  --database="test" --table="t1"  --alter="ADD COLUMN o2 varchar(10),add column o1 int not null default 0 comment 'test' " --exact-rowcount --serve-socket-file=/tmp/gh-ost.t1.sock --panic-flag-file=/tmp/gh-ost.panic.t1.flag  --postpone-cut-over-flag-file=/tmp/ghost.postpone.t1.flag --allow-on-master  --execute

① 標示文件終止運行--panic-flag-file

建立文件終止運行,例子中建立/tmp/gh-ost.panic.t1.flag文件,終止正在運行的gh-ost,臨時文件清理須要手動進行。

表示文件禁止cut-over進行,即禁止表名切換,數據複製正常進行。--postpone-cut-over-flag-file

建立文件延遲cut-over進行,即推遲切換操做。例子中建立/tmp/ghost.postpone.t1.flag文件,gh-ost 會完成行復制,但並不會切換表,它會持續的將原表的數據更新操做同步到臨時表中。

③ 使用socket監聽請求,操做者能夠在命令運行後更改相應的參數。--serve-socket-file,--serve-tcp-port(默認關閉)

建立socket文件進行監聽,經過接口進行參數調整,當執行操做的過程當中發現負載、延遲上升了,不得不終止操做,從新配置參數,如 chunk-size,而後從新執行操做命令,能夠經過scoket接口進行動態調整。如:

暫停操做:

#暫停
echo throttle | socat - /tmp/gh-ost.test.t1.sock
#恢復
echo no-throttle | socat - /tmp/gh-ost.test.t1.sock

修改限速參數:

echo chunk-size=100 | socat - /tmp/gh-ost.t1.sock

echo max-lag-millis=200 | socat - /tmp/gh-ost.t1.sock

echo max-load=Thread_running=3 | socat - /tmp/gh-ost.t1.sock

 4)和pt-online-schema-change對比測試

 1. 表沒有寫入而且參數爲默認的狀況下,兩者DDL操做時間差很少,畢竟都是copy row操做。

 2. 表有大量寫入(sysbench)的狀況下,由於pt-osc是多線程處理的,很快就能執行完成,而gh-ost是模擬「從」單線程應用的,極端的狀況下,DDL操做很是困難的執行完畢。

 結論:雖然gh-ost不須要觸發器,對於主庫的壓力和性能影響也小不少,可是針對高併發的場景進行DDL效率仍是比pt-osc低,因此仍是須要在業務低峯的時候處理。相關的測試能夠看gh-ost和pt-osc性能對比

 5)封裝腳本:

環境:M:192.168.163.131(ROW),S:192.168.163.130/132

封裝腳本:gh-ost.py

#!/bin/env python
# -*- encoding: utf-8 -*-
#----------------------------------------------
# Purpose:     gh-ost
# Created:     2018-06-16
#----------------------------------------------

import MySQLdb
import re
import sys
import time
import subprocess
import os
from optparse import OptionParser

def calc_time(func):
    def _deco(*args, **kwargs):
        begin_time = time.time()
        func(*args, **kwargs)
        cost_time = time.time() - begin_time
        print 'cost time: %ss' % round(cost_time,2)
    return _deco

def get_table_count(conn,dbname,tbname):
    query  = ''' SELECT count(*) FROM %s.%s ''' %(dbname,tbname)
    cursor = conn.cursor()
    cursor.execute(query)
    row_nums = cursor.fetchone()
    cursor.close()
    conn.close() 
    return row_nums

def online_ddl(conn,ddl_cmd):
    cursor = conn.cursor()
    cursor.execute(ddl_cmd)
    conn.commit()
    cursor.close()
    conn.close()  

#@calc_time
def run_cmd(cmd):
    p = subprocess.Popen(cmd, shell=True)
    return p,p.pid

def drop_ghost_table(conn,ghost_name_list):
    try:
        cursor = conn.cursor()
        query  = ''' DROP TABLE IF EXISTS %s; ''' %(ghost_name_list)
        cursor.execute(query)
        conn.commit()
        cursor.close()
        conn.close()
    except Exception,e:
        print e

if __name__ == "__main__":
    parser = OptionParser()
    parser.add_option("-P", "--Port", help="Port for search", dest="port")
    parser.add_option("-D", "--Dbname", help="the Dbname to use", dest="dbname")
    parser.add_option("-T", "--Table", help="the Table to use", dest="tablename")

    (options, args) = parser.parse_args()

    if not options.port:
        print 'params port need to apply'
        exit()

    if not options.dbname:
        print 'params dbname need to apply'
        exit()

    if not options.tablename:
        print 'params tablename need to apply'
        exit()

    gh_ost_socket   = '/tmp/gh-ost.%s.%s.sock' %(options.dbname,options.tablename)
    #終止標誌
    panic_flag      = '/tmp/gh-ost.panic.%s.%s.flag' %(options.dbname,options.tablename)
    # postpone_flag   =  '/tmp/gh-ost.postpone.%s.%s.flag' %(options.dbname,options.tablename)
    #暫停標誌
    throttle_flag   = '/tmp/gh-ost.throttle.%s.%s' %(options.dbname,options.tablename)
#    socket = '/data/%s/tmp/mysql.sock' %(options.port)
    socket = '/var/run/mysqld/mysqld.sock'

    

    get_conn = MySQLdb.connect(host='192.168.163.131', port=int(options.port), user='root', passwd='root', db=options.dbname, unix_socket=socket,charset='utf8')
    conn     = MySQLdb.connect(host='192.168.163.131', port=int(options.port), user='root', passwd='root', db=options.dbname, unix_socket=socket,charset='utf8')
    
    (table_count,) = get_table_count(get_conn,options.dbname,options.tablename)
    print ("\033[0;32m%s\033[0m" % "表的數量:%s" %table_count)

    DDL_CMD    = raw_input('Enter DDL CMD   : ').replace('`','')

    gh_command_list = re.split('[ ]+',DDL_CMD)
    if gh_command_list[0].upper() == 'CHANGE' and gh_command_list[1] != gh_command_list[2]:
        print ("\033[0;31m%s\033[0m" % "renamed columns' data will be lost,pt-osc exit...")
        exit()

    if table_count <= 10000:
        ddl = ''' ALTER TABLE %s %s ''' %(options.tablename,DDL_CMD)
        print ("\033[0;36m%s\033[0m" %ddl)
        print ("\033[0;32m%s\033[0m" % "online ddl ...")
        online_ddl(conn,ddl)
        print ("\033[0;32m%s\033[0m" % "執行完成 ...")
        exit()

    else:
        MAX_LOAD   = raw_input('Enter Max Threads_running【25】 : ')
        if not MAX_LOAD:
            Threads_running = 25 
        else:
            try:
                Threads_running = int(MAX_LOAD)
            except ValueError:
                print ("\033[0;31m%s\033[0m" % "輸入類型錯誤,退出...")
                exit()

        CHUNK_SIZE = raw_input('Enter Max chunk-size【1000】    : ')
        if not CHUNK_SIZE:
            chunk_size = 1000
        else:
            try:
                chunk_size = int(CHUNK_SIZE)
            except ValueError:
                print ("\033[0;31m%s\033[0m" % "輸入類型錯誤,退出...")
                exit()

        print ("\033[0;32m%s\033[0m" % "gh-ost ddl ...")
        #--postpone-cut-over-flag-file=%s 
        gh_command = '''/usr/bin/gh-ost --user="root" --password="root" --host=192.168.163.131 --port=%s --database="%s" --table="%s" --allow-on-master  --max-load='Threads_running=%d' --chunk-size=%d --serve-socket-file=%s --panic-flag-file=%s --throttle-additional-flag-file=%s --alter="%s"  --execute ''' %(options.port,options.dbname,options.tablename,Threads_running,chunk_size,gh_ost_socket,panic_flag,throttle_flag,DDL_CMD)
        print ("\033[0;36m%s\033[0m" %gh_command)

    
        child,pid = run_cmd(gh_command)
        print ("\033[0;31mgh-ost's PID:%s\033[0m" %pid)
        print ("\033[0;33m建立:【touch %s】文件,暫停DDL ...\033[0m" %throttle_flag)
        try:
            child.wait()
        except:
            child.terminate()
            #clean
            ghost_name_list = '_%s_ghc,_%s_gho'  %(options.tablename,options.tablename)
            drop_ghost_table(conn,ghost_name_list)
            if os.path.exists(gh_ost_socket):
                os.system('rm -r %s' %gh_ost_socket)
                print ("\033[0;32m%s\033[0m" % "清理完成 ...")
                exit()
            print ("\033[0;32m%s\033[0m" % "清理完成 ...")
            exit()
        finally :
            pass
View Code

運行:

root@test2:~# python gh-ost.py -P3306 -Dtest -Tzjy
表的數量:1310720
Enter DDL CMD   : ADD COLUMN q1 varchar(10),ADD COLUMN q2 varchar(10)
Enter Max Threads_running【25】 : 10
Enter Max chunk-size【1000】    : 200
gh-ost ddl ...
/usr/bin/gh-ost --user="root" --password="root" --host=192.168.163.131 --port=3306 --database="test" --table="zjy" --allow-on-master  --max-load='Threads_running=10' --chunk-size=200 --serve-socket-file=/tmp/gh-ost.test.zjy.sock --panic-flag-file=/tmp/gh-ost.panic.test.zjy.flag --throttle-additional-flag-file=/tmp/gh-ost.throttle.test.zjy --alter="ADD COLUMN q1 varchar(10),ADD COLUMN q2 varchar(10)"  --execute 
gh-ost's PID:2105
建立:【touch /tmp/gh-ost.throttle.test.zjy】文件,暫停DDL ...
2018/06/17 14:37:37 binlogsyncer.go:79: [info] create BinlogSyncer with config {99999 mysql 192.168.163.131 3306 root   false false <nil>}
2018/06/17 14:37:37 binlogsyncer.go:246: [info] begin to sync binlog from position (mysql-bin.000013, 31197930)
2018/06/17 14:37:37 binlogsyncer.go:139: [info] register slave for master server 192.168.163.131:3306
2018/06/17 14:37:37 binlogsyncer.go:573: [info] rotate to (mysql-bin.000013, 31197930)
# Migrating `test`.`zjy`; Ghost table is `test`.`_zjy_gho`
# Migrating test2:3306; inspecting test2:3306; executing on test2
# Migration started at Sun Jun 17 14:37:37 +0800 2018
# chunk-size: 200; max-lag-millis: 1500ms; dml-batch-size: 10; max-load: Threads_running=10; critical-load: ; nice-ratio: 0.000000
# throttle-additional-flag-file: /tmp/gh-ost.throttle.test.zjy 
# panic-flag-file: /tmp/gh-ost.panic.test.zjy.flag
# Serving on unix socket: /tmp/gh-ost.test.zjy.sock
Copy: 0/1305600 0.0%; Applied: 0; Backlog: 0/1000; Time: 0s(total), 0s(copy); streamer: mysql-bin.000013:31199542; State: migrating; ETA: N/A
Copy: 0/1305600 0.0%; Applied: 0; Backlog: 0/1000; Time: 1s(total), 1s(copy); streamer: mysql-bin.000013:31202866; State: migrating; ETA: N/A
Copy: 44400/1305600 3.4%; Applied: 0; Backlog: 0/1000; Time: 2s(total), 2s(copy); streamer: mysql-bin.000013:33352548; State: migrating; ETA: 56s
Copy: 91200/1305600 7.0%; Applied: 0; Backlog: 0/1000; Time: 3s(total), 3s(copy); streamer: mysql-bin.000013:35598132; State: migrating; ETA: 39s
Copy: 135200/1305600 10.4%; Applied: 0; Backlog: 0/1000; Time: 4s(total), 4s(copy); streamer: mysql-bin.000013:37727925; State: migrating; ETA: 34s
Copy: 174000/1305600 13.3%; Applied: 0; Backlog: 0/1000; Time: 5s(total), 5s(copy); streamer: mysql-bin.000013:39588956; State: migrating; ETA: 32s
Copy: 212200/1305600 16.3%; Applied: 0; Backlog: 0/1000; Time: 6s(total), 6s(copy); streamer: mysql-bin.000013:41430090; State: migrating; ETA: 30s
Copy: 254800/1305600 19.5%; Applied: 0; Backlog: 0/1000; Time: 7s(total), 7s(copy); streamer: mysql-bin.000013:43483555; State: migrating; ETA: 28s
Copy: 303600/1305600 23.3%; Applied: 0; Backlog: 0/1000; Time: 8s(total), 8s(copy); streamer: mysql-bin.000013:45834978; State: migrating; ETA: 26s
Copy: 351200/1305600 26.9%; Applied: 0; Backlog: 0/1000; Time: 9s(total), 9s(copy); streamer: mysql-bin.000013:48128675; State: migrating; ETA: 24s
Copy: 401400/1305600 30.7%; Applied: 0; Backlog: 0/1000; Time: 10s(total), 10s(copy); streamer: mysql-bin.000013:50547454; State: migrating; ETA: 22s
Copy: 451200/1305600 34.6%; Applied: 0; Backlog: 0/1000; Time: 11s(total), 11s(copy); streamer: mysql-bin.000013:52946991; State: migrating; ETA: 20s
Copy: 490000/1305600 37.5%; Applied: 0; Backlog: 0/1000; Time: 12s(total), 12s(copy); streamer: mysql-bin.000013:54817320; State: migrating; ETA: 19s
Copy: 529600/1305600 40.6%; Applied: 0; Backlog: 0/1000; Time: 13s(total), 13s(copy); streamer: mysql-bin.000013:56735431; State: migrating; ETA: 19s
Copy: 589200/1305600 45.1%; Applied: 0; Backlog: 0/1000; Time: 14s(total), 14s(copy); streamer: mysql-bin.000013:59606450; State: migrating; ETA: 17s
Copy: 639400/1305600 49.0%; Applied: 0; Backlog: 0/1000; Time: 15s(total), 15s(copy); streamer: mysql-bin.000013:62025561; State: migrating; ETA: 15s
Copy: 695200/1305600 53.2%; Applied: 0; Backlog: 0/1000; Time: 16s(total), 16s(copy); streamer: mysql-bin.000013:64704138; State: migrating; ETA: 14s
Copy: 751200/1305600 57.5%; Applied: 0; Backlog: 0/1000; Time: 17s(total), 17s(copy); streamer: mysql-bin.000013:67401961; State: migrating; ETA: 12s
Copy: 803800/1305600 61.6%; Applied: 0; Backlog: 0/1000; Time: 18s(total), 18s(copy); streamer: mysql-bin.000013:69935884; State: migrating; ETA: 11s
Copy: 856400/1305600 65.6%; Applied: 0; Backlog: 0/1000; Time: 19s(total), 19s(copy); streamer: mysql-bin.000013:72470455; State: migrating; ETA: 9s
Copy: 907400/1305600 69.5%; Applied: 0; Backlog: 0/1000; Time: 20s(total), 20s(copy); streamer: mysql-bin.000013:74927401; State: migrating; ETA: 8s
Copy: 958800/1305600 73.4%; Applied: 0; Backlog: 0/1000; Time: 21s(total), 21s(copy); streamer: mysql-bin.000013:77404243; State: migrating; ETA: 7s
Copy: 999200/1305600 76.5%; Applied: 0; Backlog: 0/1000; Time: 22s(total), 22s(copy); streamer: mysql-bin.000013:79351223; State: migrating; ETA: 6s
Copy: 1009600/1305600 77.3%; Applied: 0; Backlog: 0/1000; Time: 23s(total), 23s(copy); streamer: mysql-bin.000013:79855229; State: migrating; ETA: 6s
Copy: 1059600/1305600 81.2%; Applied: 0; Backlog: 0/1000; Time: 24s(total), 24s(copy); streamer: mysql-bin.000013:82264712; State: migrating; ETA: 5s
Copy: 1107200/1305600 84.8%; Applied: 0; Backlog: 0/1000; Time: 25s(total), 25s(copy); streamer: mysql-bin.000013:84558411; State: migrating; ETA: 4s
Copy: 1147000/1305600 87.9%; Applied: 0; Backlog: 0/1000; Time: 26s(total), 26s(copy); streamer: mysql-bin.000013:86486148; State: migrating; ETA: 3s
Copy: 1198000/1305600 91.8%; Applied: 0; Backlog: 0/1000; Time: 27s(total), 27s(copy); streamer: mysql-bin.000013:88943747; State: migrating; ETA: 2s
Copy: 1245400/1305600 95.4%; Applied: 0; Backlog: 0/1000; Time: 28s(total), 28s(copy); streamer: mysql-bin.000013:91218202; State: migrating; ETA: 1s
Copy: 1286600/1305600 98.5%; Applied: 0; Backlog: 0/1000; Time: 29s(total), 29s(copy); streamer: mysql-bin.000013:93203991; State: migrating; ETA: 0s
Copy: 1310720/1310720 100.0%; Applied: 0; Backlog: 0/1000; Time: 29s(total), 29s(copy); streamer: mysql-bin.000013:94366846; State: migrating; ETA: due
Copy: 1310720/1310720 100.0%; Applied: 0; Backlog: 1/1000; Time: 30s(total), 29s(copy); streamer: mysql-bin.000013:94369042; State: migrating; ETA: due
# Migrating `test`.`zjy`; Ghost table is `test`.`_zjy_gho`
# Migrating test2:3306; inspecting test2:3306; executing on test2
# Migration started at Sun Jun 17 14:37:37 +0800 2018
# chunk-size: 200; max-lag-millis: 1500ms; dml-batch-size: 10; max-load: Threads_running=10; critical-load: ; nice-ratio: 0.000000
# throttle-additional-flag-file: /tmp/gh-ost.throttle.test.zjy 
# panic-flag-file: /tmp/gh-ost.panic.test.zjy.flag
# Serving on unix socket: /tmp/gh-ost.test.zjy.sock
Copy: 1310720/1310720 100.0%; Applied: 0; Backlog: 0/1000; Time: 30s(total), 29s(copy); streamer: mysql-bin.000013:94371928; State: migrating; ETA: due
2018/06/17 14:38:08 binlogsyncer.go:107: [info] syncer is closing... 
2018/06/17 14:38:08 binlogstreamer.go:47: [error] close sync with err: sync is been closing... (這裏的error不影響使用,重複關閉了sync,等做者修復)
2018/06/17 14:38:08 binlogsyncer.go:122: [info] syncer is closed 
# Done
View Code

總結:

gh-ost 放棄了觸發器,使用 binlog 來同步。gh-ost 做爲一個假裝的備庫,能夠從主庫/備庫上拉取 binlog,過濾以後從新應用到主庫上去,至關於主庫上的增量操做經過 binlog 又應用回主庫自己,不過是應用在幽靈表上。

gh-ost 首先鏈接到主庫上,根據 alter 語句建立幽靈表,而後做爲一個」備庫「鏈接到其中一個真正的備庫上,一邊在主庫上拷貝已有的數據到幽靈表,一邊從備庫上拉取增量數據的 binlog,而後不斷的把 binlog 應用回主庫。圖中 cut-over 是最後一步,鎖住主庫的源表,等待 binlog 應用完畢,而後替換 gh-ost 表爲源表。gh-ost 在執行中,會在本來的 binlog event 裏面增長如下 hint 和心跳包,用來控制整個流程的進度,檢測狀態等。這種架構帶來諸多好處,例如:

  • 整個流程異步執行,對於源表的增量數據操做沒有額外的開銷,高峯期變動業務對性能影響小。
  • 下降寫壓力,觸發器操做都在一個事務內,gh-ost 應用 binlog 是另一個鏈接在作。
  • 可中止,binlog 有位點記錄,若是變動過程發現主庫性能受影響,能夠馬上中止拉binlog,中止應用 binlog,穩定以後繼續應用。
  • 可測試,gh-ost 提供了測試功能,能夠鏈接到一個備庫上直接作 Online DDL,在備庫上觀察變動結果是否正確,再對主庫操做,內心更有底。

 

參考文檔:

https://github.com/github/gh-ost

GitHub 開源的 MySQL 在線更改 Schema 工具

Online DDL 工具 gh-ost 支持阿里雲 RDS

gh-ost:不同的在線表結構變動

GitHub開源MySQL Online DDL工具gh-ost參數解析 

相關文章
相關標籤/搜索