1.數據倉庫-概覽

數據倉庫目前總共有4個部分: 1)ETL 2)數據模型 3)調度 4)可視化 一:ETL 1)目前ETL 主要使用kettle、Python、sql。 Kettle 在目前倉庫的作用,更多的是從源庫將數據抽取到數據倉庫當中。 Sql 主要是數據的聚合和清洗 Python 主要數據的清洗。 目前源數據庫分爲mongoDB 和 mysql, 所以在抽取這二者的數據庫時,會用到kettle不同的組件處理
相關文章
相關標籤/搜索