大數據處理架構Hadoop(大數據技術原理與應用--上課筆記一)

Hadoop的核心組件是HDFS和MapReduce HDFS解決了海量數據的分佈式存儲 MapReduce解決了海量數據的分佈式處理 YARN 做資源調度管理 HDFS:NN Federation 、HA(NN-name node Federation 做數據目錄服務,可設置多個name node 進行分區管理;HA:高可容性,熱備份) pig:輕量級腳本語言,簡化了MapReduce的操作 s
相關文章
相關標籤/搜索