MapReduce原理2

MapReduce的shuffle機制 1、概述 mapreduce中,map階段處理的數據如何傳遞給reduce階段,是mapreduce框架中最關鍵的一個流程,這個流程就叫shuffle; shuffle: 洗牌、發牌——(核心機制:數據分區,排序,緩存); 具體來說:就是將maptask輸出的處理結果數據,分發給reducetask,並在分發的過程中,對數據按key進行了分區和排序;   2
相關文章
相關標籤/搜索