Rsync+sersync實現實時同步

介紹:

sersync主要用於服務器同步,web鏡像等功能。基於boost1.43.0,inotify api,rsync command.開發。目前使用的比較多的同步解決方案是inotify-tools+rsync ,另一個是google開源項目Openduckbill(依賴於inotify- tools),這兩個都是基於腳本語言編寫的。相比較上面兩個項目,本項目優勢是:php

  • sersync是使用c++編寫,並且對linux系統文件系統產生的臨時文件和重複的文件操做進行過濾,因此在結合rsync同步的時候,節省了運行時耗和網絡資源。所以更快。
  • sersync配置起來很簡單,其中bin目錄下已經有基本上靜態編譯的2進制文件,配合bin目錄下的xml配置文件直接使用便可。
  • 使用多線程進行同步,尤爲在同步較大文件時,可以保證多個服務器實時保持同步狀態。
  • 有出錯處理機制,經過失敗隊列對出錯的文件從新同步,若是仍舊失敗,則按設定時長對同步失敗的文件從新同步。
  • 自帶crontab功能,只需在xml配置文件中開啓,便可按要求隔一段時間總體同步一次。無需再額外配置crontab功能。
  • 可以實現socket與http插件擴展。

Rsync+Inotify-tools與Rsync+sersync這兩種架構有什麼區別?

Rsync+Inotify-tools:linux

  • Inotify-tools只能記錄下被監聽的目錄發生了變化(包括增長、刪除、修改),並無把具體是哪一個文件或者哪一個目錄發生了變化記錄下來;
  • rsync在同步的時候,並不知道具體是哪一個文件或者哪一個目錄發生了變化,每次都是對整個目錄進行同步,當數據量很大時,整個目錄同步很是耗時(rsync要對整個目錄遍歷查找對比文件),所以,效率很低。

Rsync+sersync:c++

  • sersync能夠記錄下被監聽目錄中發生變化的(包括增長、刪除、修改)具體某一個文件或某一個目錄的名字;
  • rsync在同步的時候,只同步發生變化的這個文件或者這個目錄(每次發生變化的數據相對整個同步目錄數據來講是很小的,rsync在遍歷查找比對文件時,速度很快),所以,效率很高。

總結:git

當同步的目錄數據量不大時,建議使用Rsync+Inotify-tools;當數據量很大(幾百G甚至1T以上)、文件不少時,建議使用Rsync+sersync。github

邏輯圖

當前版本的sersync依賴於rsync進行數據同步web

原理步驟:算法

  • 在同步服務器(Master)上開啓sersync服務,sersync負載監控配置路徑中的文件系統事件變化;
  • 調用rsync命令把更新的文件同步到目標服務器(S1 和 S2);
  • 須要在主服務器配置sersync,在同步目標服務器配置rsync server(注意:是rsync服務)

同步原理:shell

  • 用戶實時的往sersync服務器(M)上寫入更新文件數據;
  • 此時須要在同步主服務器(M)上配置sersync服務;
  • 在S1 和S2上開啓rsync守護進程服務,以同步拉取來自sersync服務器(M)上的數據;

經過rsync的守護進程服務後能夠發現,實際上sersync就是監控本地的數據寫入或更新事件;而後,在調用rsync客戶端的命令,將寫入或更新事件對應的文件經過rsync推送到目標服務器(S1 和S2)express

系統環境

[root@wcy ~]# cat /etc/redhat-release 
CentOS release 6.9 (Final)
[root@wcy ~]# uname -a
Linux wcy.admin 2.6.32-696.30.1.el6.x86_64 #1 SMP Tue May 22 03:28:18 UTC 2018 x86_64 x86_64 x86_64 GNU/Linux

拓撲列表

角色 IP 主機名
sersync 192.168.233.10 M1
rsync 192.168.233.20 S1
rsync 192.168.233.30 S2

S1與S2配置相同,下面僅配置S1,有配置不一樣的地址會指出vim

slave上配置rsync

[root@S1 ~]# yum -y install rsync

查看安裝的版本,若是使用yum安裝的不是3.0版本以上的建議使用源碼編譯安裝3.0以上的rsync

[root@S1 ~]# rsync --version
rsync version 3.0.6 protocol version 30

默認rsync沒有配置文件,須要手動建立一個,下面的#後的漢字爲說明文件,已經註釋掉了

[root@S1 ~]# cat /etc/rsyncd.conf 
#Rsync server
uid = root
gid = root
port = 873
use chroot = no # 安全相關,增長對目錄文件軟鏈接的備份
max connections = 2000 # 併發鏈接數
timeout = 600 # 超時時間(秒)
pid file = /var/run/rsyncd.pid # 指定rsync的pid目錄
lock file = /var/run/rsync.lock # 指定rsync的鎖文件【重要】
log file = /var/log/rsyncd.log # 指定rsync的日誌目錄
ignore errors # 忽略一些I/O錯誤
read only = false # 設置rsync服務端文件爲讀寫權限
list = false # 不顯示rsync服務端資源列表
hosts allow = 192.168.233.10 # 容許進行數據同步的客戶端IP地址,能夠設置多個,用英文狀態下逗號隔開
hosts deny = 0.0.0.0/32 # 禁止數據同步的客戶端IP地址,能夠設置多個,用英文狀態下逗號隔開
auth users = rsync # 執行數據同步的用戶名,能夠設置多個,用英文狀態下逗號隔開
secrets file = /etc/rsync.passwd #用戶認證配置文件,裏面保存用戶名稱和密碼
[www] # 自定義模塊名稱,能夠向下添加多個模塊,就是同步多個
comment = www
path = /data/www/ # 將同步過來的文件分別放入對應的path指定的目錄

無註釋代碼

#Rsync server
uid = root
gid = root
port = 873
use chroot = no
max connections = 2000
timeout = 600
pid file = /var/run/rsyncd.pid
lock file = /var/run/rsync.lock
log file = /var/log/rsyncd.log
ignore errors
read only = false
list = false
hosts allow = 192.168.233.10
hosts deny = 0.0.0.0/32
auth users = rsync
secrets file = /etc/rsync.passwd
[www]
comment = www
path = /data/www/

上面rsync服務的配置文件,表面容許sersync主服務器(ip:192.168.233.10)訪問rsync同步模塊名爲[www]將同步過來的文件分別放入對應的path指定的目錄/data/www下面; 若是有多臺目標服務器,則每一臺都須要進行相似的rsync服務配置,上面的uid、gid要換成您服務器的相應的同步用戶;注意,rsync服務帳戶(本文用的是root)要有對被同步目錄(/data/)的寫入更新權限;

建立用戶認證文件:

[root@S1 ~]# echo "rsync:123456">/etc/rsync.passwd

設置文件權限:

[root@S1 ~]# chmod 600 /etc/rsync.passwd

啓動守護進程並加入開機自啓:

[root@S1 ~]# rsync --daemon
[root@S1 ~]# netstat -anpt | grep rsync
tcp 0 0 0.0.0.0:873 0.0.0.0:* LISTEN 1768/rsync 
tcp 0 0 :::873 :::* LISTEN 1768/rsync
[root@S1 ~]# tail -1 /etc/rc.local
/usr/bin/rsync --daemon

建立相關目錄:

[root@S1 ~]# mkdir -p /data/www

master M1上配置rsync

[root@M1 ~]# yum -y install rsync
[root@M1 ~]# echo "123456">/etc/rsync.passwd
[root@M1 ~]# chmod 600 /etc/rsync.passwd 
[root@M1 ~]# mkdir -p /data/www
[root@M1 ~]# touch /data/www/www.log

 執行同步,推送的命令是在master端執行的

[root@M1 ~]# rsync -avH --port=873 --progress --delete /data/www/ rsync@192.168.233.20::www --password-file=/etc/rsync.passwd
sending incremental file list
./
www.log
0 100% 0.00kB/s 0:00:00 (xfer#1, to-check=0/2)

sent 84 bytes received 30 bytes 20.73 bytes/sec
total size is 0 speedup is 0.00

顯示如上則是同步成功,在S1上查看一下

[root@S1 ~]# ls /data/www/
www.log

提示:
在後面進行部署sersync以前,sersync主服務器上必需要確保手工能夠把文件推送到S1,S2上,這樣後續sersync才能調用這些命令來自動推送
在推送前關閉iptables

rsync參數說明

-v, --verbose 詳細模式輸出
-q, --quiet 精簡輸出模式
-c, --checksum 打開校驗開關,強制對文件傳輸進行校驗
-a, --archive 歸檔模式,表示以遞歸方式傳輸文件,並保持全部文件屬性,等於-rlptgoD
-r, --recursive 對子目錄以遞歸模式處理
-R, --relative 使用相對路徑信息
-b, --backup 建立備份,也就是對於目的已經存在有一樣的文件名時,將老的文件從新命名爲~filename。可使用--suffix選項來指定不一樣的備份文件前綴。
--backup-dir 將備份文件(如~filename)存放在在目錄下。
-suffix=SUFFIX 定義備份文件前綴
-u, --update 僅僅進行更新,也就是跳過全部已經存在於DST,而且文件時間晚於要備份的文件。(不覆蓋更新的文件)
-l, --links 保留軟鏈結
-L, --copy-links 想對待常規文件同樣處理軟鏈結
--copy-unsafe-links 僅僅拷貝指向SRC路徑目錄樹之外的鏈結
--safe-links 忽略指向SRC路徑目錄樹之外的鏈結
-H, --hard-links 保留硬鏈結
-p, --perms 保持文件權限
-o, --owner 保持文件屬主信息
-g, --group 保持文件屬組信息
-D, --devices 保持設備文件信息
-t, --times 保持文件時間信息
-S, --sparse 對稀疏文件進行特殊處理以節省DST的空間
-n, --dry-run現實哪些文件將被傳輸
-W, --whole-file 拷貝文件,不進行增量檢測
-x, --one-file-system 不要跨越文件系統邊界
-B, --block-size=SIZE 檢驗算法使用的塊尺寸,默認是700字節
-e, --rsh=COMMAND 指定使用rsh、ssh方式進行數據同步
--rsync-path=PATH 指定遠程服務器上的rsync命令所在路徑信息
-C, --cvs-exclude 使用和CVS同樣的方法自動忽略文件,用來排除那些不但願傳輸的文件
--existing 僅僅更新那些已經存在於DST的文件,而不備份那些新建立的文件
--delete 刪除那些DST中SRC沒有的文件
--delete-excluded 一樣刪除接收端那些被該選項指定排除的文件
--delete-after 傳輸結束之後再刪除
--ignore-errors 及時出現IO錯誤也進行刪除
--max-delete=NUM 最多刪除NUM個文件
--partial 保留那些因故沒有徹底傳輸的文件,以是加快隨後的再次傳輸
--force 強制刪除目錄,即便不爲空
--numeric-ids 不將數字的用戶和組ID匹配爲用戶名和組名
--timeout=TIME IP超時時間,單位爲秒
-I, --ignore-times 不跳過那些有一樣的時間和長度的文件
--size-only 當決定是否要備份文件時,僅僅察看文件大小而不考慮文件時間
--modify-window=NUM 決定文件是否時間相同時使用的時間戳窗口,默認爲0
-T --temp-dir=DIR 在DIR中建立臨時文件
--compare-dest=DIR 一樣比較DIR中的文件來決定是否須要備份
-P 等同於 --partial
--progress 顯示備份過程
-z, --compress 對備份的文件在傳輸時進行壓縮處理
--exclude=PATTERN 指定排除不須要傳輸的文件模式
--include=PATTERN 指定不排除而須要傳輸的文件模式
--exclude-from=FILE 排除FILE中指定模式的文件
--include-from=FILE 不排除FILE指定模式匹配的文件
--version 打印版本信息
--address 綁定到特定的地址
--config=FILE 指定其餘的配置文件,不使用默認的rsyncd.conf文件
--port=PORT 指定其餘的rsync服務端口
--blocking-io 對遠程shell使用阻塞IO
-stats 給出某些文件的傳輸狀態
--progress 在傳輸時現實傳輸過程
--log-format=formAT 指定日誌文件格式
--password-file=FILE 從FILE中獲得密碼
--bwlimit=KBPS 限制I/O帶寬,KBytes per second
-h, --help 顯示幫助信息

在M1上開始安裝部署sersync服務

列出一下內容說明服務器內核支持inotify

[root@S1 ~]# ll /proc/sys/fs/inotify
總用量 0
-rw-r--r-- 1 root root 0 2月 25 23:23 max_queued_events
-rw-r--r-- 1 root root 0 2月 25 23:23 max_user_instances
-rw-r--r-- 1 root root 0 2月 25 23:23 max_user_watches

查看系統默認參數值

[root@S1 ~]# sysctl -a | grep max_queued_events
fs.inotify.max_queued_events = 16384
[root@S1 ~]# sysctl -a | grep max_user_instances
fs.inotify.max_user_instances = 128
[root@S1 ~]# sysctl -a | grep max_user_watches
fs.inotify.max_user_watches = 8192

修改參數,若是修改過如下參數則不用再次修改

[root@S1 ~]# echo "fs.inotify.max_queued_events = 99999999" >> /etc/sysctl.conf
[root@S1 ~]# echo "fs.inotify.max_user_watches = 99999999" >> /etc/sysctl.conf
[root@S1 ~]# echo "fs.inotify.max_user_instances = 65535" >> /etc/sysctl.conf
[root@S1 ~]# sysctl -p

參數說明

max_queued_events:
inotify隊列最大長度,若是值過小,會出現"** Event Queue Overflow **"錯誤,致使監控文件不許確
max_user_watches:
要同步的文件包含多少目錄,能夠用:find /home/wwwroot/ -type d | wc -l 統計,必須保證max_user_watches值大於統計結果(這裏/home/wwwroot/爲同步文件目錄)
max_user_instances:
每一個用戶建立inotify實例最大值

下載sersync

https://sersync.googlecode.com/files/sersync2.5.4_64bit_binary_stable_final.tar.gz

由於sersync託管在google code,須要fanqiang才能下載

因此能夠上github上找到,以下,直接下載便可

wget --no-check-certificate https://raw.githubusercontent.com/orangle/sersync/master/release/sersync2.5.4_64bit_binary_stable_final.tar.gz

配置sersync

[root@M1 ~]# tar xf sersync2.5.4_64bit_binary_stable_final.tar.gz 
[root@M1 ~]# mv GNU-Linux-x86/ /usr/local/sersync
[root@M1 ~]# cd /usr/local/sersync/
[root@M1 sersync]# cp confxml.xml confxml.xml_bak

修改配置文件  若是有多個同步模塊,則按下面格式依次去寫,僅更改

<localpath watch="/data/www">
[root@M1 sersync]# vim confxml.xml

24 <localpath watch="/data/www">
25 <remote ip="192.168.233.20" name="www"/>
26 <remote ip="192.168.233.30" name="www"/>
27 <!--<remote ip="192.168.8.39" name="tongbu"/>-->
28 <!--<remote ip="192.168.8.40" name="tongbu"/>-->
29 </localpath>

認證部分更改同步使用帳號和密碼:

30 <rsync>
31 <commonParams params="-artuz"/>
32 <auth start="true" users="rsync" passwordfile="/etc/rsync.passwd"/>
33 <userDefinedPort start="false" port="874"/><!-- port=874 -->
34 <timeout start="true" time="100"/><!-- timeout=100 -->
35 <ssh start="false"/>
36 </rsync>

修改同步失敗日誌位置,而且每60分鐘對失敗的log進行從新同步

 37         <failLog path="/usr/local/sersync/logs/rsync_fail_log.sh" timeToExecute="60"/><!--default ev    ery 60mins execute once-->

所有的配置文件以下:

<?xml version="1.0" encoding="ISO-8859-1"?>
<head version="2.5">
<host hostip="localhost" port="8008"></host>
<debug start="false"/>
<fileSystem xfs="false"/>
<filter start="false">
<exclude expression="(.*)\.svn"></exclude>
<exclude expression="(.*)\.gz"></exclude>
<exclude expression="^info/*"></exclude>
<exclude expression="^static/*"></exclude>
</filter>
<inotify>
<delete start="true"/>
<createFolder start="true"/>
<createFile start="false"/>
<closeWrite start="true"/>
<moveFrom start="true"/>
<moveTo start="true"/>
<attrib start="false"/>
<modify start="false"/>
</inotify>

<sersync>
<localpath watch="/data/www">
<remote ip="192.168.233.20" name="www"/>
<remote ip="192.168.233.30" name="www"/>
<!--<remote ip="192.168.8.39" name="tongbu"/>-->
<!--<remote ip="192.168.8.40" name="tongbu"/>-->
</localpath>
<rsync>
<commonParams params="-artuz"/>
<auth start="true" users="rsync" passwordfile="/etc/rsync.passwd"/>
<userDefinedPort start="false" port="874"/><!-- port=874 -->
<timeout start="true" time="100"/><!-- timeout=100 -->
<ssh start="false"/>
</rsync>
<failLog path="/usr/local/sersync/logs/rsync_fail_log.sh" timeToExecute="60"/><!--default every 60mins execute once-->
<crontab start="false" schedule="600"><!--600mins-->
<crontabfilter start="false">
<exclude expression="*.php"></exclude>
<exclude expression="info/*"></exclude>
</crontabfilter>
</crontab>
<plugin start="false" name="command"/>
</sersync>

<plugin name="command">
<param prefix="/bin/sh" suffix="" ignoreError="true"/>    <!--prefix /opt/tongbu/mmm.sh suffix-->
<filter start="false">
<include expression="(.*)\.php"/>
<include expression="(.*)\.sh"/>
</filter>
</plugin>

<plugin name="socket">
<localpath watch="/opt/tongbu">
<deshost ip="192.168.138.20" port="8009"/>
</localpath>
</plugin>
<plugin name="refreshCDN">
<localpath watch="/data0/htdocs/cms.xoyo.com/site/">
<cdninfo domainname="ccms.chinacache.com" port="80" username="xxxx" passwd="xxxx"/>
<sendurl base="http://pic.xoyo.com/cms"/>
<regexurl regex="false" match="cms.xoyo.com/site([/a-zA-Z0-9]*).xoyo.com/images"/>
</localpath>
</plugin>
</head>

建立相關文件:

[root@M1 sersync]# mkdir logs
[root@M1 sersync]# touch /usr/local/sersync/logs/rsync_fail_log.sh

啓動命令

[root@M1 sersync]# /usr/local/sersync/sersync2 -d -r -o /usr/local/sersync/confxml.xml [root@M1 sersync]# echo "PATH=$PATH:/usr/local/sersync/" >> /etc/profile [root@M1 sersync]# source /etc/profile

配置多實例

配置多實例只需對應不一樣的配置文件便可

/usr/local/sersync/sersync2  -d -o /usr/local/sersync/www_confxml.xml
/usr/local/sersync/sersync2  -d -o /usr/local/sersync/bbs_confxml.xml
/usr/local/sersync/sersync2  -d -o /usr/local/sersync/blog_confxml.xml 

其餘架構

相關文章
相關標籤/搜索