Hadoop大數據生態系統介紹

Hadoop大數據生態系統介紹 一、Hadoop 是一個可以對大量數據進行分佈式處理的軟件框架。具備可靠、高效、可伸縮的特色。 Hadoop的核心是HDFS和Mapreduce,hadoop2.0還包括YARN。 二、HDFS Hadoop的分佈式文件系統。是Hadoop體系中數據存儲管理的基礎。它是一個高度容錯的系統,能檢測和應對硬件故障,用於在低成本的通用硬件上運行。HDFS簡化了文件的一致性
相關文章
相關標籤/搜索