大數據挖掘分析與應用(二)初始hadoop

二 初識Hadoop Hadoop概述 開源的 Hadoop可以搭建大型數據倉庫,PB級數據的存儲,處理,分析,統計等業務 分佈式集羣:多臺計算機構成 主節點就是管理從節點位置的計算機(圖書管理員) 心跳機制: Hadoop三大核心組件: HDFS(分佈式文件系統) YARN(資源調度系統)MapReduce(分佈式計算框架) HDFS可以將數據多副本存儲,這樣的好處1.如果一臺機器上的一個副本壞
相關文章
相關標籤/搜索