《Hadoop權威指南》筆記-關於MapReduce

本筆記主要總結記錄2.4節 橫向擴展。 本小結簡單介紹了Hadoop中MapReduce的執行流程,即對數據流的處理過程,和多map對應多reduce的情況。 數據流 Mapduce主要分成一下五步: 1. MapReeduce作業(job) :客戶端需要執行的一個工作單元,包括輸入數據、MapReduce程序和配置信息。其主要分爲兩大類任務:map任務和reduce任務,這些任務運行在集羣節點上
相關文章
相關標籤/搜索