Hadoop2.7.3 mapreduce(一)原理及"hello world"實例

MapReduce編程模型 【1】先對輸入的信息進行切片處理。 【2】每個map函數對所劃分的數據並行處理,產生不同的中間結果輸出。 【3】對map的中間結果數據進行收集整理(aggregate & shuffle)處理,交給reduce。 【4】reduce進行計算最終結果。 【5】彙總所有reduce的輸出結果。 【名詞解釋】 ResourceManager:是YARN資源控制框架的中心模塊,
相關文章
相關標籤/搜索