我理解的數倉項目

我理解的數倉項目 我會從數據的流向來梳理整個架構.前端 離線數倉:(對產生的數據進行處理,通常處理T+1數據.)mysql 訂單數據保存在mysql數據庫中,經過kettle進行ETL (進行數據的抽取,基本的預處理 轉換裝載到HDFS中)web 這裏用到hive數據倉庫工具,hive 數據保證在hdfs中,運用hsql對數據進行操做, 底層進行mapreduce.redis 對數倉進行分層.sq
相關文章
相關標籤/搜索