hadoop生態圈各個組件

Hadoop 是一個能夠對大量數據進行分佈式處理的軟件框架。具有可靠、高效、可伸縮的特點。 Hadoop 的核心是 HDFS 和 Mapreduce,HDFS 還包括 YARN。 1,HDFS(hadoop分佈式文件系統) 是hadoop體系中數據存儲管理的基礎。他是一個高度容錯的系統,能檢測和應對硬件故障。 client:切分文件,訪問HDFS,與那麼弄得交互,獲取文件位置信息,與DataNod
相關文章
相關標籤/搜索