詳解大數據數據倉庫分層架構

轉自:http://blog.csdn.net/kwu_ganymede/article/details/51367422 大數據數據倉庫是基於HIVE構建的數據倉庫,分佈文件系統爲HDFS,資源管理爲Yarn,計算引擎主要包括MapReduce/Tez/Spark等,分層架構如下: 1、數據來源層:日誌或者關係型數據庫,並通過Flume、Sqoop、Kettle等etl工具導入到HDFS,並映射
相關文章
相關標籤/搜索