Hadoop生態系統

概況 Hadoop是一個能夠對大量數據進行分佈式處理的軟件框架。具有可靠、高效、可伸縮的特點。Hadoop的核心是HDFS和Mapreduce,hadoop2.0還包括YARN。 1.HDFS(Hadoop分佈式文件系統) 簡介:源自於Google的GFS論文,發表於2003年10月,HDFS是GFS克隆版。是Hadoop體系中數據存儲管理的基礎。它是一個高度容錯的系統,能檢測和應對硬件故障,用於
相關文章
相關標籤/搜索