1 複製概述
Mysql內建的複製功能是構建大型,高性能應用程序的基礎。將Mysql的數據分佈到多個系統上去,這種分佈的機制,是經過將Mysql的某一臺主機的數據複製到其它主機(slaves)上,並從新執行一遍來實現的。複製過程當中一個服務器充當主服務器,而一個或多個其它服務器充當從服務器。主服務器將更新寫入二進制日誌文件,並維護文件的一個索引以跟蹤日誌循環。這些日誌能夠記錄發送到從服務器的更新。當一個從服務器鏈接主服務器時,它通知主服務器從服務器在日誌中讀取的最後一次成功更新的位置。從服務器接收從那時起發生的任何更新,而後封鎖並等待主服務器通知新的更新。mysql
請注意當你進行復制時,全部對複製中的表的更新必須在主服務器上進行。不然,你必需要當心,以免用戶對主服務器上的表進行的更新與對從服務器上的表所進行的更新之間的衝突。sql
1.1 mysql支持的複製類型:
(1):基於語句的複製: 在主服務器上執行的SQL語句,在從服務器上執行一樣的語句。MySQL默認採用基於語句的複製,效率比較高。
一旦發現無法精確複製時, 會自動選着基於行的複製。
(2):基於行的複製:把改變的內容複製過去,而不是把命令在從服務器上執行一遍. 從mysql5.0開始支持
(3):混合類型的複製: 默認採用基於語句的複製,一旦發現基於語句的沒法精確的複製時,就會採用基於行的複製。數據庫
1.2 . 複製解決的問題
MySQL複製技術有如下一些特色:
(1) 數據分佈 (Data distribution )
(2) 負載平衡(load balancing)
(3) 備份(Backups)
(4) 高可用性和故障切換
(4) MySQL升級測試 使用一個更高版本的MySQL做爲備庫,保證在升級所有實例前,查詢可以在備庫按照預期執行。緩存
1.3 複製如何工做
總體上來講,複製有3個步驟:服務器
(1) master將改變記錄到二進制日誌(binary log)中(這些記錄叫作二進制日誌事件,binary log events);網絡
(2) slave將master的binary log events拷貝到它的中繼日誌(relay log);session
(3) slave重作中繼日誌中的事件,將改變反映它本身的數據。架構
下圖描述了複製的過程:異步
該過程的第一部分就是master記錄二進制日誌。在每一個事務更新數據完成以前,master在二日誌記錄這些改變。MySQL將事務串行的寫入二進制日誌,即便事務中的語句都是交叉執行的。在事件寫入二進制日誌完成後,master通知存儲引擎提交事務。
下一步就是slave將master的binary log拷貝到它本身的中繼日誌。首先,slave開始一個工做線程——I/O線程。I/O線程在master上打開一個普通的鏈接,而後開始binlog dump process。Binlog dump process從master的二進制日誌中讀取事件,若是已經跟上master,它會睡眠並等待master產生新的事件。I/O線程將這些事件寫入中繼日誌。
SQL slave thread(SQL從線程)處理該過程的最後一步。SQL線程從中繼日誌讀取事件,並重放其中的事件而更新slave的數據,使其與master中的數據一致。只要該線程與I/O線程保持一致,中繼日誌一般會位於OS的緩存中,因此中繼日誌的開銷很小。
此外,在master中也有一個工做線程:和其它MySQL的鏈接同樣,slave在master中打開一個鏈接也會使得master開始一個線程。複製過程有一個很重要的限制——複製在slave上是串行化的,也就是說master上的並行更新操做不能在slave上並行操做。函數
2 、複製配置
因爲場景不一樣,基本的步驟仍是有差別的,最基本的場景是新安裝的主庫和備庫,總的來講分爲如下幾步:
1.在每臺服務器上建立複製帳號。
2.配置主庫和備庫。
3.通知備庫鏈接到主庫並從主庫複製數據。
2.一、建立複製帳號
MySQL會賦予一些特殊權限給複製線程。在備庫運行的I/O線程會創建一個到主庫的TCP/IP鏈接,這意味着必須在主庫建立一個用戶,並賦予去合適的權限。備庫I/O線程以該用戶名鏈接到主庫並讀取其二進制日誌。經過以下語句建立用戶帳號:
主庫和備庫都建立該帳號。
2.二、配置主庫和備庫
主庫打開二進制日誌並指定一個獨一無二的服務器,在主庫my.cnf文件中增長火修改以下內容:
log_bin = mysql-bin
server_id =10
若是以前沒有在MySQL的配置文件中指定log-bin選項,就須要從新啓動MySQL。爲肯定二進制日誌文件是否已經在主庫上建立,使用SHOW MASTER STATUS命令,檢查輸出是否與以下的一致。MySQL會爲文件名增長一些數字,因此這裏看到的文件名和你定義的會有點不同。、
2.三、啓動複製
開始複製的基本命令
SHOW SLAVE STATUS語句來檢查複製是否正確執行。
2.4從另外一個服務器開始複製
有幾種方法來初始化備庫或者從其餘服務器克隆數據到備庫。包括從主庫複製數據、從另一臺備庫克隆數據,以及使用最近的一次備份來啓動備庫,須要有三個條件來讓主庫和備庫保持同步:
下面是從別的服務器克隆備庫的方法:
使用冷備份
最基本的方法是關閉主庫,把數據複製到備庫。重啓主庫後,會使用一個新的二進制日誌文件,咱們在備庫經過執行CHANGE MASTER TO指向這個文件的起始處。
使用熱備份
若是僅使用了MyISAM表,能夠在主庫運行時使用mysqlhotcopy貨rsync來複制數據。
使用mysqldump
若是隻包含InnoDB表,那麼可使用一下命令來轉儲主庫數據並將其加載到備庫
使用快照或備份
使用另外的備庫
三、複製的原理
已經討論了關於複製的一些基本東西,下面深刻討論一下複製。
3.一、基於語句的複製(Statement-Based Replication)
MySQL 5.0及以前的版本僅支持基於語句的複製(也叫作邏輯複製,logical replication),這在數據庫並不常見。master記錄下改變數據的查詢,而後,slave從中繼日誌中讀取事件,並執行它,這些SQL語句與master執行的語句同樣。
這種方式的優勢就是實現簡單。此外,基於語句的複製的二進制日誌能夠很好的進行壓縮,並且日誌的數據量也較小,佔用帶寬少——例如,一個更新GB的數據的查詢僅須要幾十個字節的二進制日誌。而mysqlbinlog對於基於語句的日誌處理十分方便。
可是,基於語句的複製並非像它看起來那麼簡單,由於一些查詢語句依賴於master的特定條件,例如,master與slave可能有不一樣的時間。因此,MySQL的二進制日誌的格式不只僅是查詢語句,還包括一些元數據信息,例如,當前的時間戳。即便如此,仍是有一些語句,好比,CURRENT USER函數,不能正確的進行復制。此外,存儲過程和觸發器也是一個問題。
另一個問題就是基於語句的複製必須是串行化的。這要求大量特殊的代碼,配置,例如InnoDB的next-key鎖等。並非全部的存儲引擎都支持基於語句的複製。
3.二、基於行的複製(Row-Based Replication)
MySQL增長基於記錄的複製,在二進制日誌中記錄下實際數據的改變,這與其它一些DBMS的實現方式相似。這種方式有優勢,也有缺點。優勢就是能夠對任何語句都能正確工做,一些語句的效率更高。主要的缺點就是二進制日誌可能會很大,並且不直觀,因此,你不能使用mysqlbinlog來查看二進制日誌。
對於一些語句,基於記錄的複製可以更有效的工做,如:
mysql> INSERT INTO summary_table(col1, col2, sum_col3)
-> SELECT col1, col2, sum(col3)
-> FROM enormous_table
-> GROUP BY col1, col2;
假設,只有三種惟一的col1和col2的組合,可是,該查詢會掃描原表的許多行,卻僅返回三條記錄。此時,基於記錄的複製效率更高。
另外一方面,下面的語句,基於語句的複製更有效:
mysql> UPDATE enormous_table SET col1 = 0;
此時使用基於記錄的複製代價會很是高。因爲兩種方式不能對全部狀況都能很好的處理,因此,MySQL 5.1支持在基於語句的複製和基於記錄的複製以前動態交換。你能夠經過設置session變量binlog_format來進行控制。
3.三、複製相關的文件
除了二進制日誌和中繼日誌文件外,還有其它一些與複製相關的文件。以下:
(1)mysql-bin.index
服務器一旦開啓二進制日誌,會產生一個與二日誌文件同名,可是以.index結尾的文件。它用於跟蹤磁盤上存在哪些二進制日誌文件。MySQL用它來定位二進制日誌文件。它的內容以下(個人機器上):
(2)mysql-relay-bin.index
該文件的功能與mysql-bin.index相似,可是它是針對中繼日誌,而不是二進制日誌。內容以下:
.\mysql-02-relay-bin.000017
.\mysql-02-relay-bin.000018
(3)master.info
保存master的相關信息。不要刪除它,不然,slave重啓後不能鏈接master。內容以下(個人機器上):
I/O線程更新master.info文件,內容以下(個人機器上):
.\mysql-02-relay-bin.000019
254
mysql-01-bin.000010
286
0
52813
(4)relay-log.info
包含slave中當前二進制日誌和中繼日誌的信息。
3.四、發送複製事件到其它備庫
當設置log_slave_updates時,你可讓slave扮演其它slave的master。此時,slave把SQL線程執行的事件寫進行本身的二進制日誌(binary log),而後,它的slave能夠獲取這些事件並執行它。以下:
3.五、複製過濾(Replication Filters)
複製過濾可讓你只複製服務器中的一部分數據,有兩種複製過濾:在master上過濾二進制日誌中的事件;在slave上過濾中繼日誌中的事件。以下:
四、複製的經常使用拓撲結構
複製的體系結構有如下一些基本原則:
(1) 每一個slave只能有一個master;
(2) 每一個slave只能有一個惟一的服務器ID;
(3) 每一個master能夠有不少slave;
(4) 若是你設置log_slave_updates,slave能夠是其它slave的master,從而擴散master的更新。
MySQL不支持多主服務器複製(Multimaster Replication)——即一個slave能夠有多個master。可是,經過一些簡單的組合,咱們卻能夠創建靈活而強大的複製體系結構。
4.一、單一master和多slave
由一個master和一個slave組成複製系統是最簡單的狀況。Slave之間並不相互通訊,只能與master進行通訊。
在實際應用場景中,MySQL複製90%以上都是一個Master複製到一個或者多個Slave的架構模式,主要用於讀壓力比較大的應用的數據庫端廉價擴展解決方案。由於只要Master和Slave的壓力不是太大(尤爲是Slave端壓力)的話,異步複製的延時通常都不多不多。尤爲是自從Slave端的複製方式改爲兩個線程處理以後,更是減少了Slave端的延時問題。而帶來的效益是,對於數據實時性要求不是特別Critical的應用,只須要經過廉價的pcserver來擴展Slave的數量,將讀壓力分散到多臺Slave的機器上面,便可經過分散單臺數據庫服務器的讀壓力來解決數據庫端的讀性能瓶頸,畢竟在大多數數據庫應用系統中的讀壓力仍是要比寫壓力大不少。這在很大程度上解決了目前不少中小型網站的數據庫壓力瓶頸問題,甚至有些大型網站也在使用相似方案解決數據庫瓶頸。
以下:
若是寫操做較少,而讀操做很時,能夠採起這種結構。你能夠將讀操做分佈到其它的slave,從而減少master的壓力。可是,當slave增長到必定數量時,slave對master的負載以及網絡帶寬都會成爲一個嚴重的問題。
這種結構雖然簡單,可是,它卻很是靈活,足夠知足大多數應用需求。一些建議:
(1) 不一樣的slave扮演不一樣的做用(例如使用不一樣的索引,或者不一樣的存儲引擎);
(2) 用一個slave做爲備用master,只進行復制;
(3) 用一個遠程的slave,用於災難恢復;
你們應該都比較清楚,從一個Master節點能夠複製出多個Slave節點,可能有人會想,那一個Slave節點是否能夠從多個Master節點上面進行復制呢?至少在目前來看,MySQL是作不到的,之後是否會支持就不清楚了。
MySQL不支持一個Slave節點從多個Master節點來進行復制的架構,主要是爲了不衝突的問題,防止多個數據源之間的數據出現衝突,而形成最後數據的不一致性。不過據說已經有人開發了相關的patch,讓MySQL支持一個Slave節點從多個Master結點做爲數據源來進行復制,這也正是MySQL開源的性質所帶來的好處。
4.二、主動模式的Master-Master(Master-Master in Active-Active Mode)
Master-Master複製的兩臺服務器,既是master,又是另外一臺服務器的slave。這樣,任何一方所作的變動,都會經過複製應用到另一方的數據庫中。
可能有些讀者朋友會有一個擔憂,這樣搭建複製環境以後,難道不會形成兩臺MySQL之間的循環複製麼?實際上MySQL本身早就想到了這一點,因此在MySQL的BinaryLog中記錄了當前MySQL的server-id,並且這個參數也是咱們搭建MySQLReplication的時候必須明確指定,並且Master和Slave的server-id參數值比須要不一致才能使MySQLReplication搭建成功。一旦有了server-id的值以後,MySQL就很容易判斷某個變動是從哪個MySQLServer最初產生的,因此就很容易避免出現循環複製的狀況。並且,若是咱們不打開記錄Slave的BinaryLog的選項(--log-slave-update)的時候,MySQL根本就不會記錄複製過程當中的變動到BinaryLog中,就更不用擔憂可能會出現循環複製的情形了。
如圖:
主動的Master-Master複製有一些特殊的用處。例如,地理上分佈的兩個部分都須要本身的可寫的數據副本。這種結構最大的問題就是更新衝突。假設一個表只有一行(一列)的數據,其值爲1,若是兩個服務器分別同時執行以下語句:
在第一個服務器上執行:
mysql> UPDATE tbl SET col=col + 1;
在第二個服務器上執行:
mysql> UPDATE tbl SET col=col * 2;
那麼結果是多少呢?一臺服務器是4,另外一個服務器是3,可是,這並不會產生錯誤。
實際上,MySQL並不支持其它一些DBMS支持的多主服務器複製(Multimaster Replication),這是MySQL的複製功能很大的一個限制(多主服務器的難點在於解決更新衝突),可是,若是你實在有這種需求,你能夠採用MySQL Cluster,以及將Cluster和Replication結合起來,能夠創建強大的高性能的數據庫平臺。可是,能夠經過其它一些方式來模擬這種多主服務器的複製。
4.三、主動-被動模式的Master-Master(Master-Master in Active-Passive Mode)
這是master-master結構變化而來的,它避免了M-M的缺點,實際上,這是一種具備容錯和高可用性的系統。它的不一樣點在於其中一個服務只能進行只讀操做。如圖:
4.4 級聯複製架構 Master –Slaves - Slaves
在有些應用場景中,可能讀寫壓力差異比較大,讀壓力特別的大,一個Master可能須要上10臺甚至更多的Slave纔可以支撐注讀的壓力。這時候,Master就會比較吃力了,由於僅僅連上來的SlaveIO線程就比較多了,這樣寫的壓力稍微大一點的時候,Master端由於複製就會消耗較多的資源,很容易形成複製的延時。
遇到這種狀況如何解決呢?這時候咱們就能夠利用MySQL能夠在Slave端記錄複製所產生變動的BinaryLog信息的功能,也就是打開—log-slave-update選項。而後,經過二級(或者是更多級別)複製來減小Master端由於複製所帶來的壓力。也就是說,咱們首先經過少數幾臺MySQL從Master來進行復制,這幾臺機器咱們姑且稱之爲第一級Slave集羣,而後其餘的Slave再從第一級Slave集羣來進行復制。從第一級Slave進行復制的Slave,我稱之爲第二級Slave集羣。若是有須要,咱們能夠繼續往下增長更多層次的複製。這樣,咱們很容易就控制了每一臺MySQL上面所附屬Slave的數量。這種架構我稱之爲Master-Slaves-Slaves架構
這種多層級聯複製的架構,很容易就解決了Master端由於附屬Slave太多而成爲瓶頸的風險。下圖展現了多層級聯複製的Replication架構。
固然,若是條件容許,我更傾向於建議你們經過拆分紅多個Replication集羣來解決
上述瓶頸問題。畢竟Slave並無減小寫的量,全部Slave實際上仍然仍是應用了全部的數據變動操做,沒有減小任何寫IO。相反,Slave越多,整個集羣的寫IO總量也就會越多,咱們沒有很是明顯的感受,僅僅只是由於分散到了多臺機器上面,因此不是很容易表現出來。
此外,增長複製的級聯層次,同一個變動傳到最底層的Slave所須要通過的MySQL也會更多,一樣可能形成延時較長的風險。
而若是咱們經過分拆集羣的方式來解決的話,可能就會要好不少了,固然,分拆集羣也須要更復雜的技術和更復雜的應用系統架構。
4.五、帶從服務器的Master-Master結構(Master-Master with Slaves)
這種結構的優勢就是提供了冗餘。在地理上分佈的複製結構,它不存在單一節點故障問題,並且還能夠將讀密集型的請求放到slave上。
級聯複製在必定程度上面確實解決了Master由於所附屬的Slave過多而成爲瓶頸的問題,可是他並不能解決人工維護和出現異常須要切換後可能存在從新搭建Replication的問題。這樣就很天然的引伸出了DualMaster與級聯複製結合的Replication架構,我稱之爲Master-Master-Slaves架構
和Master-Slaves-Slaves架構相比,區別僅僅只是將第一級Slave集羣換成了一臺單獨的Master,做爲備用Master,而後再從這個備用的Master進行復制到一個Slave集羣。
這種DualMaster與級聯複製結合的架構,最大的好處就是既能夠避免主Master的寫入操做不會受到Slave集羣的複製所帶來的影響,同時主Master須要切換的時候也基本上不會出現重搭Replication的狀況。可是,這個架構也有一個弊端,那就是備用的Master有可能成爲瓶頸,由於若是後面的Slave集羣比較大的話,備用Master可能會由於過多的SlaveIO線程請求而成爲瓶頸。固然,該備用Master不提供任何的讀服務的時候,瓶頸出現的可能性並非特別高,若是出現瓶頸,也能夠在備用Master後面再次進行級聯複製,架設多層Slave集羣。固然,級聯複製的級別越多,Slave集羣可能出現的數據延時也會更爲明顯,因此考慮使用多層級聯複製以前,也須要評估數據延時對應用系統的影響。