Kettle根據時間戳同步數據實現

1 Kettle整體步驟

更多數據實時同步方案,請參考筆者的另外一篇博文:大數據時代,數據實時同步解決方案的思考—最全的數據同步總結html

因爲Kettle自身的特殊性以及在多個步驟中kettle自身處理數據庫事務的特殊性,嘗試了不少種方案,最終肯定暫使用以下方案。數據庫

一、使用此方案能夠解決kettle自己數據庫事務的缺點post

二、使用此方案能夠解決支隊多個表中同時往一張總表中同步數據時,取時間戳不許的問題。大數據

三、配置時,每一個支隊的數據匯聚時,都單獨配置一個轉換做業任務。3d

四、Kettle支持字段映射,轉換,以及做業定時運行等。htm

2 Kettle配置實現

A)清空臨時表blog

 

B)讀取交換時間事務

 

C)讀取須要交換的數據get

 

D)更新到臨時表同步

 

E)插入更新到目標表

 

F)更新時間

 

3 Kettle配置風險

一、單次同步數據量大時,因爲須要同時更新兩次表,效率可能會比較低

二、若是採用單次限制數據記錄量,因爲Kettle自己不支持數據分頁,當數據表若是存在大量數據記錄的時間戳都相同時,可能會致使部分數據沒法同步過來。

【原文歸做者全部,歡迎轉載,可是保留版權】

相關文章
相關標籤/搜索