大數據Hadoop生態圈【1】

1、Hadoop 1.0的構架  HDFS :分佈式文件的存儲。 YARN:數據處理的資源調度器,負責調度內存CPU帶寬等計算資源。 MapReduce:做實時的離線批處理的工具,基於磁盤的。 Tez:優化和分析mapreduce的作業,構建成一個有向無環圖,保證處理效率 Spark:與Mapreduce類似,不過是基於內存的處理速度更快。 Hive:實現數據倉庫的功能,支持SQL,但是會把SQL
相關文章
相關標籤/搜索