一.Mysql Binlog格式介紹 mysql
Mysql binlog日誌有三種格式,分別爲Statement,MiXED,以及ROW!sql
1.Statement:每一條會修改數據的sql都會記錄在binlog中。數據庫
優勢:不須要記錄每一行的變化,減小了binlog日誌量,節約了IO,提升性能。(相比row能節約多少性能與日誌量,這個取決於應用的SQL狀況,正常同一條記錄修改或者插入row格式所產生的日誌量還小於Statement產生的日誌量,可是考慮到若是帶條件的update操做,以及整表刪除,alter表等操做,ROW格式會產生大量日誌,所以在考慮是否使用ROW格式日誌時應該跟據應用的實際狀況,其所產生的日誌量會增長多少,以及帶來的IO性能問題。)函數
缺點:因爲記錄的只是執行語句,爲了這些語句能在slave上正確運行,所以還必須記錄每條語句在執行的時候的一些相關信息,以保證全部語句能在slave獲得和在master端執行時候相同 的結果。另外mysql 的複製,像一些特定函數功能,slave可與master上要保持一致會有不少相關問題(如sleep()函數, last_insert_id(),以及user-defined functions(udf)會出現問題).性能
使用如下函數的語句也沒法被複制:優化
* LOAD_FILE()spa
* UUID()unix
* USER()日誌
* FOUND_ROWS()code
* SYSDATE() (除非啓動時啓用了 --sysdate-is-now 選項)
同時在INSERT ...SELECT 會產生比 RBR 更多的行級鎖
2.Row:不記錄sql語句上下文相關信息,僅保存哪條記錄被修改。
優勢: binlog中能夠不記錄執行的sql語句的上下文相關的信息,僅須要記錄那一條記錄被修改爲什麼了。因此rowlevel的日誌內容會很是清楚的記錄下每一行數據修改的細節。並且不會出現某些特定狀況下的存儲過程,或function,以及trigger的調用和觸發沒法被正確複製的問題
缺點:全部的執行的語句當記錄到日誌中的時候,都將以每行記錄的修改來記錄,這樣可能會產生大量的日誌內容,好比一條update語句,修改多條記錄,則binlog中每一條修改都會有記錄,這樣形成binlog日誌量會很大,特別是當執行alter table之類的語句的時候,因爲表結構修改,每條記錄都發生改變,那麼該表每一條記錄都會記錄到日誌中。
3.Mixedlevel: 是以上兩種level的混合使用,通常的語句修改使用statment格式保存binlog,如一些函數,statement沒法完成主從複製的操做,則採用row格式保存binlog,MySQL會根據執行的每一條具體的sql語句來區分對待記錄的日誌形式,也就是在Statement和Row之間選擇一種.新版本的MySQL中隊row level模式也被作了優化,並非全部的修改都會以row level來記錄,像遇到表結構變動的時候就會以statement模式來記錄。至於update或者delete等修改數據的語句,仍是會記錄全部行的變動。
二.Binlog基本配製與格式設定
1.基本配製
Mysql BInlog日誌格式能夠經過mysql的my.cnf文件的屬性binlog_format指定。如如下:
binlog_format = MIXED //binlog日誌格式
log_bin =目錄/mysql-bin.log //binlog日誌名
expire_logs_days = 7 //binlog過時清理時間
max_binlog_size 100m //binlog每一個日誌文件大小
binlog-do-db=須要備份的數據庫名,若是備份多個數據庫,重複設置這個選項便可
binlog-ignore-db=不須要備份的數據庫苦命,若是備份多個數據庫,重複設置這個選項便可
2.Binlog日誌格式選擇
Mysql默認是使用Statement日誌格式,推薦使用MIXED.
因爲一些特殊使用,能夠考慮使用ROWED,如本身經過binlog日誌來同步數據的修改,這樣會節省不少相關操做。對於binlog數據處理會變得很是輕鬆,相對mixed,解析也會很輕鬆(固然前提是增長的日誌量所帶來的IO開銷在容忍的範圍內便可)。
3.mysqlbinlog格式選擇
mysql對於日誌格式的選定原則:若是是採用 INSERT,UPDATE,DELETE 等直接操做表的狀況,則日誌格式根據 binlog_format 的設定而記錄,若是是採用 GRANT,REVOKE,SET PASSWORD 等管理語句來作的話,那麼不管如何 都採用 SBR 模式記錄
三.Mysql Binlog日誌分析
經過MysqlBinlog指令查看具體的mysql日誌,以下:
///////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////
SET TIMESTAMP=1350355892/*!*/;
BEGIN
/*!*/;
# at 1643330
#121016 10:51:32 server id 1 end_log_pos 1643885 Query thread_id=272571 exec_time=0 error_code=0
SET TIMESTAMP=1350355892/*!*/;
Insert into T_test….)
/*!*/;
# at 1643885
#121016 10:51:32 server id 1 end_log_pos 1643912 Xid = 0
COMMIT/*!*/;
///////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////
1.開始事物的時間:
SET TIMESTAMP=1350355892/*!*/;
BEGIN
2.sqlevent起點
#at 1643330 :爲事件的起點,是以1643330字節開始。
3.sqlevent 發生的時間點
#121016 10:51:32:是事件發生的時間,
4.serverId
server id 1 :爲master 的serverId
5.sqlevent終點及花費時間,錯誤碼
end_log_pos 1643885:爲事件的終點,是以1643885 字節結束。
execTime 0: 花費的時間
error_code=0:錯誤碼
Xid:事件指示提交的XA事務
Mixed日誌說明:
在slave日誌同步過程當中,對於使用now這樣的時間函數,MIXED日誌格式,會在日誌中產生對應的unix_timestamp()*1000的時間字符串,slave在完成同步時,取用的是sqlEvent發生的時間來保證數據的準確性。另外對於一些功能性函數slave能完成相應的數據同步,而對於上面指定的一些相似於UDF函數,致使Slave沒法知曉的狀況,則會採用ROW格式存儲這些Binlog,以保證產生的Binlog能夠供Slave完成數據同步。