mapreduce 原理

mapreduce的shuffle機制 3.1.1 概述: mapreduce中,map階段處理的數據如何傳遞給reduce階段,是mapreduce框架中最關鍵的一個流程,這個流程就叫shuffle; shuffle: 洗牌、發牌——(核心機制:數據分區,排序,緩存); 具體來說:就是將maptask輸出的處理結果數據,分發給reducetask,並在分發的過程中,對數據按key進行了分區和排序
相關文章
相關標籤/搜索