真正的inotify+rsync實時同步 完全告別同步慢

 

真正的inotify+rsync實時同步 完全告別同步慢
 
 
 
http://www.ttlsa.com/web/let-infotify-rsync-fast/

 

 
 

 

背景

咱們公司在用inotify+rsync作實時同步,來解決分佈式集羣文件一致性的問題。但當web文件愈來愈多(百萬級數量html,jpg等小 文件),同步就愈來愈慢,根本作不到實時,按照網上的調優方法都嘗試過,問題根本沒有解決。通過我一翻細緻研究,終於把慢的核心問題研究明白,先總結一句 inotifywait響應不會有延遲,rsync也很快。你們一樣有慢的煩惱,那是由於網上的inotify+rsync的教程都是坑。下面咱們來分 析。html

inotifywait 單獨分析

 

執行上面命令,是讓inotifywait監聽/data/目錄,當監聽到有發生modify,create,delete,attrib等事件發生時,按%Xe %w%f的格式輸出。linux

在/data/目錄touch幾個文件web

觀看inotify輸出bash

知道上面的輸出效果以後 咱們應該想獲得,能夠用rsync獲取inotifywait監控到的文件列表來作指定的文件同步,而不是每次都由rsync作全目錄掃描來判斷文件是否存在差別。服務器

網上的inotify+rsync分析

咱們來看網上的教程,我加了註釋。(網上全部的教程基本都如出一轍,儘管寫法不同,致命點都是同樣的)異步

#注意看 這裏的rsync 每次都是全量的同步(這就坑爹了),並且 file列表是循環形式觸發rsync ,等於有10個文件發生更改,就觸發10次rsync全量同步(簡直就是噩夢),那還不如直接寫個死循環的rsync全量同步得了。分佈式

#有不少人會說 日誌輸出那裏明明只有差別文件的同步記錄。其實這是rsync的功能,他原本就只會輸出有差別須要同步的文件信息。不信你直接拿這句rsync來跑試試。ide

#這種在須要同步的源目錄文件量很大的狀況下,簡直是不堪重負。不只耗CPU還耗時,根本不能夠作到實時同步。優化

備註:backup爲rsync server配置module,除了編寫腳本之外,還須要配置一個rsync server,rsync server配置參考《http://www.ttlsa.com/linux/rsync-install-on-linux/ui

改良方法

要作到實時,就必需要減小rsync對目錄的遞歸掃描判斷,儘量的作到只同步inotify監控到已發生更改的文件。結合rsync的特性,因此這裏要分開判斷來實現一個目錄的增刪改查對應的操做。

腳本以下

 

每兩小時作1次全量同步

由於inotify只在啓動時會監控目錄,他沒有啓動期間的文件發生更改,他是不知道的,因此這裏每2個小時作1次全量同步,防止各類意外遺漏,保證目錄一致。

改良後咱們公司這種百萬級小文件也能作到實施同步了。

下面附上inotify的參數說明

inotify介紹-- 是一種強大的、細顆粒的、異步的文件系統監控機制,*&####&*_0_*&####&*內核從2.6.13起,加入Inotify能夠監控文件系統中添加、刪除、修改移動等各類事件,利用這個內核接口,就能夠監控文件系統下文件的各類變化狀況。

inotifywait 參數說明

參數名稱 參數說明
-m,–monitor 始終保持事件監聽狀態
-r,–recursive 遞歸查詢目錄
-q,–quiet 只打印監控事件的信息
–excludei 排除文件或目錄時,不區分大小寫
-t,–timeout 超時時間
–timefmt 指定時間輸出格式
–format 指定時間輸出格式
-e,–event 後面指定刪、增、改等事件

inotifywait events事件說明

事件名稱 事件說明
access 讀取文件或目錄內容
modify 修改文件或目錄內容
attrib 文件或目錄的屬性改變
close_write 修改真實文件內容
close_nowrite  
close  
open 文件或目錄被打開
moved_to 文件或目錄移動到
moved_from 文件或目錄從移動
move 移動文件或目錄移動到監視目錄
create 在監視目錄下建立文件或目錄
delete 刪除監視目錄下的文件或目錄
delete_self  
unmount 卸載文件系統

優化 Inotify

# 在/proc/sys/fs/inotify目錄下有三個文件,對inotify機制有必定的限制

 

-----------------------------
max_user_watches #設置inotifywait或inotifywatch命令能夠監視的文件數量(單進程)
max_user_instances #設置每一個用戶能夠運行的inotifywait或inotifywatch命令的進程數
max_queued_events #設置inotify實例事件(event)隊列可容納的事件數量
----------------------------

 

 

做者信息

廣州 - 小朱



相關文章
相關標籤/搜索