Hadoop離線項目處理技術

介紹一個 Hadoop生態離線項目:web 涉及到的技術:面試            Hadoop:HDFS(數據存儲的地方)     MapReduce(用來作數據清洗)     YARN                            Hadoop集羣shell            Hive:數據清洗以後,數據放在hdfs上,須要使用外部表,全部維度的數據統計分析須要經過SQL進行處理
相關文章
相關標籤/搜索