Hadoop之Shuffle過程那點事兒(筆記10)

一、回顧Reduce階段三大步驟   在第四篇博文《初識MapReduce》中,我們認識了MapReduce的八大步驟,其中在Reduce階段總共三個步驟,如下圖所示:   其中,Step2.1就是一個Shuffle操作,它針對多個map任務的輸出按照不同的分區(Partition)通過網絡複製到不同的reduce任務節點上,這個過程就稱作爲Shuffle。 PS:Hadoop的shuffle過程
相關文章
相關標籤/搜索