hadoop 之mapreduce shuffle map輸出過程

一、概要描述 shuffle是MapReduce的一個核心過程,因此沒有在提交中描述,而是單獨拿出來比較詳細的描述。 根據官方的流程圖示如下:  本篇文章中只是想嘗試從代碼分析來說明在map端是如何將map的輸出保存下來等待reduce來取。 在執行每個map task時,無論map方法中執行什麼邏輯,最終都是要把輸出寫到磁盤上。如果沒有reduce階段,則直接輸出到hdfs上,如果有有reduc
相關文章
相關標籤/搜索