(轉)Rsync+sersync實現實時同步

Rsync+sersync實現實時同步

介紹:

sersync主要用於服務器同步,web鏡像等功能。基於boost1.43.0,inotify api,rsync command.開發。目前使用的比較多的同步解決方案是inotify-tools+rsync ,另一個是google開源項目Openduckbill(依賴於inotify- tools),這兩個都是基於腳本語言編寫的。相比較上面兩個項目,本項目優勢是:php

  • sersync是使用c++編寫,並且對linux系統文件系統產生的臨時文件和重複的文件操做進行過濾,因此在結合rsync同步的時候,節省了運行時耗和網絡資源。所以更快。
  • sersync配置起來很簡單,其中bin目錄下已經有基本上靜態編譯的2進制文件,配合bin目錄下的xml配置文件直接使用便可。
  • 使用多線程進行同步,尤爲在同步較大文件時,可以保證多個服務器實時保持同步狀態。
  • 有出錯處理機制,經過失敗隊列對出錯的文件從新同步,若是仍舊失敗,則按設定時長對同步失敗的文件從新同步。
  • 自帶crontab功能,只需在xml配置文件中開啓,便可按要求隔一段時間總體同步一次。無需再額外配置crontab功能。
  • 可以實現socket與http插件擴展。

Rsync+Inotify-tools與Rsync+sersync這兩種架構有什麼區別?

Rsync+Inotify-tools:html

  • Inotify-tools只能記錄下被監聽的目錄發生了變化(包括增長、刪除、修改),並無把具體是哪一個文件或者哪一個目錄發生了變化記錄下來;
  • rsync在同步的時候,並不知道具體是哪一個文件或者哪一個目錄發生了變化,每次都是對整個目錄進行同步,當數據量很大時,整個目錄同步很是耗時(rsync要對整個目錄遍歷查找對比文件),所以,效率很低。

Rsync+sersync:linux

  • sersync能夠記錄下被監聽目錄中發生變化的(包括增長、刪除、修改)具體某一個文件或某一個目錄的名字;
  • rsync在同步的時候,只同步發生變化的這個文件或者這個目錄(每次發生變化的數據相對整個同步目錄數據來講是很小的,rsync在遍歷查找比對文件時,速度很快),所以,效率很高。

總結:c++

當同步的目錄數據量不大時,建議使用Rsync+Inotify-tools;當數據量很大(幾百G甚至1T以上)、文件不少時,建議使用Rsync+sersync。git

邏輯圖

當前版本的sersync依賴於rsync進行數據同步github

原理步驟:web

  • 在同步服務器(Master)上開啓sersync服務,sersync負載監控配置路徑中的文件系統事件變化;
  • 調用rsync命令把更新的文件同步到目標服務器(S1 和 S2);
  • 須要在主服務器配置sersync,在同步目標服務器配置rsync server(注意:是rsync服務)

同步原理:算法

  • 用戶實時的往sersync服務器(M)上寫入更新文件數據;
  • 此時須要在同步主服務器(M)上配置sersync服務;
  • 在S1 和S2上開啓rsync守護進程服務,以同步拉取來自sersync服務器(M)上的數據;

經過rsync的守護進程服務後能夠發現,實際上sersync就是監控本地的數據寫入或更新事件;而後,在調用rsync客戶端的命令,將寫入或更新事件對應的文件經過rsync推送到目標服務器(S1 和S2)shell

系統環境

[root@wcy ~]# cat /etc/redhat-release CentOS release 6.9 (Final) [root@wcy ~]# uname -a Linux wcy.admin 2.6.32-696.30.1.el6.x86_64 #1 SMP Tue May 22 03:28:18 UTC 2018 x86_64 x86_64 x86_64 GNU/Linux

拓撲列表

角色 IP 主機名
sersync 192.168.233.10 M1
rsync 192.168.233.20 S1
rsync 192.168.233.30 S2

S1與S2配置相同,下面僅配置S1,有配置不一樣的地址會指出express

slave上配置rsync

[root@S1 ~]# yum -y install rsync

查看安裝的版本,若是使用yum安裝的不是3.0版本以上的建議使用源碼編譯安裝3.0以上的rsync

[root@S1 ~]# rsync --version rsync version 3.0.6 protocol version 30

默認rsync沒有配置文件,須要手動建立一個,下面的#後的漢字爲說明文件,已經註釋掉了

複製代碼
[root@S1 ~]# cat /etc/rsyncd.conf #Rsync server uid = root gid = root port = 873 use chroot = no # 安全相關,增長對目錄文件軟鏈接的備份 max connections = 2000 # 併發鏈接數 timeout = 600 # 超時時間(秒) pid file = /var/run/rsyncd.pid # 指定rsync的pid目錄 lock file = /var/run/rsync.lock # 指定rsync的鎖文件【重要】 log file = /var/log/rsyncd.log # 指定rsync的日誌目錄 ignore errors # 忽略一些I/O錯誤 read only = false # 設置rsync服務端文件爲讀寫權限 list = false # 不顯示rsync服務端資源列表 hosts allow = 192.168.233.10 # 容許進行數據同步的客戶端IP地址,能夠設置多個,用英文狀態下逗號隔開 hosts deny = 0.0.0.0/32 # 禁止數據同步的客戶端IP地址,能夠設置多個,用英文狀態下逗號隔開 auth users = rsync # 執行數據同步的用戶名,能夠設置多個,用英文狀態下逗號隔開 secrets file = /etc/rsync.passwd #用戶認證配置文件,裏面保存用戶名稱和密碼 [www] # 自定義模塊名稱,能夠向下添加多個模塊,就是同步多個 comment = www path = /data/www/ # 將同步過來的文件分別放入對應的path指定的目錄
複製代碼

無註釋代碼

複製代碼
#Rsync server uid = root gid = root port = 873 use chroot = no max connections = 2000 timeout = 600 pid file = /var/run/rsyncd.pid lock file = /var/run/rsync.lock log file = /var/log/rsyncd.log ignore errors read only = false list = false hosts allow = 192.168.233.10 hosts deny = 0.0.0.0/32 auth users = rsync secrets file = /etc/rsync.passwd [www] comment = www path = /data/www/
複製代碼

上面rsync服務的配置文件,表面容許sersync主服務器(ip:192.168.233.10)訪問rsync同步模塊名爲[www]將同步過來的文件分別放入對應的path指定的目錄/data/www下面; 若是有多臺目標服務器,則每一臺都須要進行相似的rsync服務配置,上面的uid、gid要換成您服務器的相應的同步用戶;注意,rsync服務帳戶(本文用的是root)要有對被同步目錄(/data/)的寫入更新權限;

建立用戶認證文件:

[root@S1 ~]# echo "rsync:123456">/etc/rsync.passwd

設置文件權限:

[root@S1 ~]# chmod 600 /etc/rsync.passwd

啓動守護進程並加入開機自啓:

複製代碼
[root@S1 ~]# rsync --daemon [root@S1 ~]# netstat -anpt | grep rsync tcp 0 0 0.0.0.0:873 0.0.0.0:* LISTEN 1768/rsync tcp 0 0 :::873 :::* LISTEN 1768/rsync [root@S1 ~]# tail -1 /etc/rc.local /usr/bin/rsync --daemon
複製代碼

建立相關目錄:

[root@S1 ~]# mkdir -p /data/www

master M1上配置rsync

[root@M1 ~]# yum -y install rsync [root@M1 ~]# echo "123456">/etc/rsync.passwd [root@M1 ~]# chmod 600 /etc/rsync.passwd [root@M1 ~]# mkdir -p /data/www [root@M1 ~]# touch /data/www/www.log

 執行同步,推送的命令是在master端執行的

複製代碼
[root@M1 ~]# rsync -avH --port=873 --progress --delete /data/www/ rsync@192.168.233.20::www --password-file=/etc/rsync.passwd sending incremental file list ./ www.log 0 100% 0.00kB/s 0:00:00 (xfer#1, to-check=0/2) sent 84 bytes received 30 bytes 20.73 bytes/sec total size is 0 speedup is 0.00
複製代碼

顯示如上則是同步成功,在S1上查看一下

[root@S1 ~]# ls /data/www/ www.log

提示:
在後面進行部署sersync以前,sersync主服務器上必需要確保手工能夠把文件推送到S1,S2上,這樣後續sersync才能調用這些命令來自動推送
在推送前關閉iptables

rsync參數說明

複製代碼
-v, --verbose 詳細模式輸出 -q, --quiet 精簡輸出模式 -c, --checksum 打開校驗開關,強制對文件傳輸進行校驗 -a, --archive 歸檔模式,表示以遞歸方式傳輸文件,並保持全部文件屬性,等於-rlptgoD -r, --recursive 對子目錄以遞歸模式處理 -R, --relative 使用相對路徑信息 -b, --backup 建立備份,也就是對於目的已經存在有一樣的文件名時,將老的文件從新命名爲~filename。可使用--suffix選項來指定不一樣的備份文件前綴。 --backup-dir 將備份文件(如~filename)存放在在目錄下。 -suffix=SUFFIX 定義備份文件前綴 -u, --update 僅僅進行更新,也就是跳過全部已經存在於DST,而且文件時間晚於要備份的文件。(不覆蓋更新的文件) -l, --links 保留軟鏈結 -L, --copy-links 想對待常規文件同樣處理軟鏈結 --copy-unsafe-links 僅僅拷貝指向SRC路徑目錄樹之外的鏈結 --safe-links 忽略指向SRC路徑目錄樹之外的鏈結 -H, --hard-links 保留硬鏈結 -p, --perms 保持文件權限 -o, --owner 保持文件屬主信息 -g, --group 保持文件屬組信息 -D, --devices 保持設備文件信息 -t, --times 保持文件時間信息 -S, --sparse 對稀疏文件進行特殊處理以節省DST的空間 -n, --dry-run現實哪些文件將被傳輸 -W, --whole-file 拷貝文件,不進行增量檢測 -x, --one-file-system 不要跨越文件系統邊界 -B, --block-size=SIZE 檢驗算法使用的塊尺寸,默認是700字節 -e, --rsh=COMMAND 指定使用rsh、ssh方式進行數據同步 --rsync-path=PATH 指定遠程服務器上的rsync命令所在路徑信息 -C, --cvs-exclude 使用和CVS同樣的方法自動忽略文件,用來排除那些不但願傳輸的文件 --existing 僅僅更新那些已經存在於DST的文件,而不備份那些新建立的文件 --delete 刪除那些DST中SRC沒有的文件 --delete-excluded 一樣刪除接收端那些被該選項指定排除的文件 --delete-after 傳輸結束之後再刪除 --ignore-errors 及時出現IO錯誤也進行刪除 --max-delete=NUM 最多刪除NUM個文件 --partial 保留那些因故沒有徹底傳輸的文件,以是加快隨後的再次傳輸 --force 強制刪除目錄,即便不爲空 --numeric-ids 不將數字的用戶和組ID匹配爲用戶名和組名 --timeout=TIME IP超時時間,單位爲秒 -I, --ignore-times 不跳過那些有一樣的時間和長度的文件 --size-only 當決定是否要備份文件時,僅僅察看文件大小而不考慮文件時間 --modify-window=NUM 決定文件是否時間相同時使用的時間戳窗口,默認爲0 -T --temp-dir=DIR 在DIR中建立臨時文件 --compare-dest=DIR 一樣比較DIR中的文件來決定是否須要備份 -P 等同於 --partial --progress 顯示備份過程 -z, --compress 對備份的文件在傳輸時進行壓縮處理 --exclude=PATTERN 指定排除不須要傳輸的文件模式 --include=PATTERN 指定不排除而須要傳輸的文件模式 --exclude-from=FILE 排除FILE中指定模式的文件 --include-from=FILE 不排除FILE指定模式匹配的文件 --version 打印版本信息 --address 綁定到特定的地址 --config=FILE 指定其餘的配置文件,不使用默認的rsyncd.conf文件 --port=PORT 指定其餘的rsync服務端口 --blocking-io 對遠程shell使用阻塞IO -stats 給出某些文件的傳輸狀態 --progress 在傳輸時現實傳輸過程 --log-format=formAT 指定日誌文件格式 --password-file=FILE 從FILE中獲得密碼 --bwlimit=KBPS 限制I/O帶寬,KBytes per second -h, --help 顯示幫助信息
複製代碼

在M1上開始安裝部署sersync服務

列出一下內容說明服務器內核支持inotify

[root@S1 ~]# ll /proc/sys/fs/inotify 總用量 0 -rw-r--r-- 1 root root 0 2月 25 23:23 max_queued_events -rw-r--r-- 1 root root 0 2月 25 23:23 max_user_instances -rw-r--r-- 1 root root 0 2月 25 23:23 max_user_watches

查看系統默認參數值

複製代碼
[root@S1 ~]# sysctl -a | grep max_queued_events fs.inotify.max_queued_events = 16384 [root@S1 ~]# sysctl -a | grep max_user_instances fs.inotify.max_user_instances = 128 [root@S1 ~]# sysctl -a | grep max_user_watches fs.inotify.max_user_watches = 8192
複製代碼

修改參數,若是修改過如下參數則不用再次修改

[root@S1 ~]# echo "fs.inotify.max_queued_events = 99999999" >> /etc/sysctl.conf [root@S1 ~]# echo "fs.inotify.max_user_watches = 99999999" >> /etc/sysctl.conf [root@S1 ~]# echo "fs.inotify.max_user_instances = 65535" >> /etc/sysctl.conf [root@S1 ~]# sysctl -p

參數說明

複製代碼
max_queued_events: inotify隊列最大長度,若是值過小,會出現"** Event Queue Overflow **"錯誤,致使監控文件不許確 max_user_watches: 要同步的文件包含多少目錄,能夠用:find /home/wwwroot/ -type d | wc -l 統計,必須保證max_user_watches值大於統計結果(這裏/home/wwwroot/爲同步文件目錄) max_user_instances: 每一個用戶建立inotify實例最大值
複製代碼

下載sersync

https://sersync.googlecode.com/files/sersync2.5.4_64bit_binary_stable_final.tar.gz

由於sersync託管在google code,須要fanqiang才能下載

因此能夠上github上找到,以下,直接下載便可

wget --no-check-certificate https://raw.githubusercontent.com/orangle/sersync/master/release/sersync2.5.4_64bit_binary_stable_final.tar.gz

配置sersync

[root@M1 ~]# tar xf sersync2.5.4_64bit_binary_stable_final.tar.gz [root@M1 ~]# mv GNU-Linux-x86/ /usr/local/sersync [root@M1 ~]# cd /usr/local/sersync/ [root@M1 sersync]# cp confxml.xml confxml.xml_bak

修改配置文件  若是有多個同步模塊,則按下面格式依次去寫,僅更改

<localpath watch="/data/www">
複製代碼
[root@M1 sersync]# vim confxml.xml 24 <localpath watch="/data/www"> 25 <remote ip="192.168.233.20" name="www"/> 26 <remote ip="192.168.233.30" name="www"/> 27 <!--<remote ip="192.168.8.39" name="tongbu"/>--> 28 <!--<remote ip="192.168.8.40" name="tongbu"/>--> 29 </localpath>
複製代碼

認證部分更改同步使用帳號和密碼:

複製代碼
30 <rsync> 31 <commonParams params="-artuz"/> 32 <auth start="true" users="rsync" passwordfile="/etc/rsync.passwd"/> 33 <userDefinedPort start="false" port="874"/><!-- port=874 --> 34 <timeout start="true" time="100"/><!-- timeout=100 --> 35 <ssh start="false"/> 36 </rsync>
複製代碼

修改同步失敗日誌位置,而且每60分鐘對失敗的log進行從新同步

37 <failLog path="/usr/local/sersync/logs/rsync_fail_log.sh" timeToExecute="60"/><!--default ev ery 60mins execute once-->

所有的配置文件以下:

複製代碼
<?xml version="1.0" encoding="ISO-8859-1"?> <head version="2.5"> <host hostip="localhost" port="8008"></host> <debug start="false"/> <fileSystem xfs="false"/> <filter start="false"> <exclude expression="(.*)\.svn"></exclude> <exclude expression="(.*)\.gz"></exclude> <exclude expression="^info/*"></exclude> <exclude expression="^static/*"></exclude> </filter> <inotify> <delete start="true"/> <createFolder start="true"/> <createFile start="false"/> <closeWrite start="true"/> <moveFrom start="true"/> <moveTo start="true"/> <attrib start="false"/> <modify start="false"/> </inotify> <sersync> <localpath watch="/data/www"> <remote ip="192.168.233.20" name="www"/> <remote ip="192.168.233.30" name="www"/> <!--<remote ip="192.168.8.39" name="tongbu"/>--> <!--<remote ip="192.168.8.40" name="tongbu"/>--> </localpath> <rsync> <commonParams params="-artuz"/> <auth start="true" users="rsync" passwordfile="/etc/rsync.passwd"/> <userDefinedPort start="false" port="874"/><!-- port=874 --> <timeout start="true" time="100"/><!-- timeout=100 --> <ssh start="false"/> </rsync> <failLog path="/usr/local/sersync/logs/rsync_fail_log.sh" timeToExecute="60"/><!--default every 60mins execute once--> <crontab start="false" schedule="600"><!--600mins--> <crontabfilter start="false"> <exclude expression="*.php"></exclude> <exclude expression="info/*"></exclude> </crontabfilter> </crontab> <plugin start="false" name="command"/> </sersync> <plugin name="command"> <param prefix="/bin/sh" suffix="" ignoreError="true"/> <!--prefix /opt/tongbu/mmm.sh suffix--> <filter start="false"> <include expression="(.*)\.php"/> <include expression="(.*)\.sh"/> </filter> </plugin> <plugin name="socket"> <localpath watch="/opt/tongbu"> <deshost ip="192.168.138.20" port="8009"/> </localpath> </plugin> <plugin name="refreshCDN"> <localpath watch="/data0/htdocs/cms.xoyo.com/site/"> <cdninfo domainname="ccms.chinacache.com" port="80" username="xxxx" passwd="xxxx"/> <sendurl base="http://pic.xoyo.com/cms"/> <regexurl regex="false" match="cms.xoyo.com/site([/a-zA-Z0-9]*).xoyo.com/images"/> </localpath> </plugin> </head>
複製代碼

建立相關文件:

[root@M1 sersync]# mkdir logs [root@M1 sersync]# touch /usr/local/sersync/logs/rsync_fail_log.sh

啓動命令

[root@M1 sersync]# /usr/local/sersync/sersync2 -d -r -o /usr/local/sersync/confxml.xml [root@M1 sersync]# echo "PATH=$PATH:/usr/local/sersync/" >> /etc/profile [root@M1 sersync]# source /etc/profile

配置多實例

配置多實例只需對應不一樣的配置文件便可

/usr/local/sersync/sersync2  -d -o /usr/local/sersync/www_confxml.xml /usr/local/sersync/sersync2 -d -o /usr/local/sersync/bbs_confxml.xml /usr/local/sersync/sersync2 -d -o /usr/local/sersync/blog_confxml.xml 

其餘架構

相關文章
相關標籤/搜索