MapReduce的Word Count過程說明

    1、MapReduce編程模型 MapReduce採用分而治之的思想,把對大規模數據集的操作,分發給一個主節點管理下的各個分節點共同完成,然後通過整合各個節點的中間結果,得到最終結果。簡單來說,MapReduce就是「任務的分解和結果的彙總」。 在Hadoop中,用於執行MapReduce任務的機器角色有兩個:一個是JobTracker;另一個是TaskTracker。JobTracker
相關文章
相關標籤/搜索