黑猴子的家:MapReduce工作流程

1、流程示意圖 2、流程詳解 上面的流程是整個mapreduce最全工作流程,但是shuffle過程只是從第7步開始到第16步結束,具體shuffle過程詳解,如下: 1)maptask收集我們的map()方法輸出的kv對,放到內存緩衝區中 2)從內存緩衝區不斷溢出本地磁盤文件,可能會溢出多個文件 3)多個溢出文件會被合併成大的溢出文件 4)在溢出過程中,及合併的過程中,都要調用partition
相關文章
相關標籤/搜索