【若澤大數據高級第一天】-- 基於Hadoop生態離線項目--日誌分析

基於Hadoop生態離線項目 相關知識點 通用離線處理架構 整體開發流程 架構圖 相關知識點 Hadoop: HDFS MapReduce(進行數據清洗) YARN Hadoop集羣 Hive: 使用外部表 SQL 數據傾斜 基於元數據管理 SQL癒合轉換爲MapReduce FLume(數據採集) 調度 初期:crontab、shell 後期:Azkaban H
相關文章
相關標籤/搜索