基於Canal與Flink實現數據實時增量同步(二)

本文主要從Binlog實時採集和離線處理Binlog還原業務數據兩個方面,來介紹如何實現DB數據準確、高效地進入Hive數倉。html 背景 在數據倉庫建模中,未經任何加工處理的原始業務層數據,咱們稱之爲ODS(Operational Data Store)數據。在互聯網企業中,常見的ODS數據有業務日誌數據(Log)和業務DB數據(DB)兩類。對於業務DB數據來講,從MySQL等關係型數據庫的業
相關文章
相關標籤/搜索