大數據Hadoop之HDFS和MapReduce_02_01

Hadoop 主要由HDFS和MapReduce 引擎兩部分組成。最底部是HDFS,它存儲hadoop集羣中所有存儲節點上的文件。HDFS 的上一層是MapReduce 引擎,該引擎由JobTrackers 和TaskTrackers組成。 分佈式文件系統的理解: 隨着數據量越來越多,在一個操作系統管轄的範圍存不下了,那麼就分配到更多的操作系統管理的磁盤中,但是不方便管理和維護,因此迫切需要一種系
相關文章
相關標籤/搜索