Hadoop與大數據的預處理

1.Hadoop的生態集羣 Ambair(安裝 部署 配置 管理);Zookeeper(協作);HBbase(列式數據庫);Hive(數據倉庫);Pig(數據流);Mahout(數據挖掘);Flume(日誌收集);MapReduce(分佈式計算);HDFS(分佈式文件系統)sqoop(ETL工具) 深入學習參考此博文 2.大數據的預處理 (1)數據清洗 (2)數據集成 (3)數據變換 (4)數據規
相關文章
相關標籤/搜索