詳解大數據數據倉庫分層架構

大數據數據倉庫是基於HIVE構建的數據倉庫,分佈文件系統爲HDFS,資源管理爲Yarn,計算引擎主要包括MapReduce/Tez/Spark等,分層架構以下:前端 一、數據來源層:日誌或者關係型數據庫,並經過Flume、Sqoop、Kettle等etl工具導入到HDFS,並映射到HIVE的數據倉庫表中。數據庫 二、事實表是數據倉庫結構中的中央表,它包含聯繫事實與維度表的數字度量值和鍵。事實數據表
相關文章
相關標籤/搜索