Hadoop的MAPReduce之shuffle

1. shuffle: 洗牌、發牌——(核心機制:數據分區,排序,緩存); shuffle具體來說:就是將maptask輸出的處理結果數據,分發給reducetask,並在分發的過程中,對數據按key進行排序; 2. shuffle緩存流程: shuffle是MapReduce處理流程中的一個過程,每一個處理步驟是分散在各個maptask和reducetask節點上完成的,整體來看,分爲三個操作:
相關文章
相關標籤/搜索