HAdoop生態離線項目

Hadoop:HDFS MapReduce(清洗) YARN Hive:外部表 SQL 數據傾斜 基於元數據管理 SQL是如何轉換爲MapReduce的。 Flume進行調度:crontab shell Azkaban HUE:可視化的notebook,用於排查數據。 大數據項目: 集羣規模–》每臺機器的配置–》機型(物理機機型) 一、Hadoop離線處理架構 整個流程開發步驟:(1)數據採集se
相關文章
相關標籤/搜索