MapReduce 原理解析-Shuffle

概述 MapReduce 中, Map 階段處理的數據如何傳遞給 Reduce 階段,是 - MapReduce 框架中最關鍵的一個流程,這個流程就叫 Shuffleweb Shuffle: 數據混洗 ——(核心機制:數據分區,排序,緩存)緩存 具體來講:就是將 MapTask 輸出的處理結果數據,分發給 ReduceTask,並在分發的過程當中,對數據按 key 進行了分區和排序。框架 主要流程
相關文章
相關標籤/搜索