Hadoop知識學習(3)-mapreduce

MapReduce是一種分佈式計算模型,用以進行大數據量的計算。其中Map,對數據集上的獨立元素進行指定的操作,生成鍵-值對形式中間結果。Reduce,則對中間結果中相同「鍵」的所有「值」進行規約,以得到最終結果。MapReduce這樣的功能劃分,非常適合在大量計算機組成的分佈式並行環境裏進行數據處理。 JobTracker:Master節點,只有一個,管理所有作業,作業/任務的監控、錯誤處理等;
相關文章
相關標籤/搜索