Hadoop2.7.3 mapreduce(五)詳解

一、爲什麼使用Mapreduce? MapReduce是爲了解決傳統HPC框架在面對海量數據時擴展困難而產生的。 MapReduce致力於解決大規模數據處理的問題,利用局部性原理將整個問題分而治之。 MapReduce集羣由普通PC機構成,爲無共享式架構。在處理之前,將數據集分佈至各個節點。處理時,每個節點就近讀取本地存儲的數據處理(Map),將處理後的數據進行合併(Combine)、排序(Shu
相關文章
相關標籤/搜索