Hadoop-MapReduce

時間 2021-01-15

原文原文鏈接

一、概述：以WordCount爲例，描述MapReduce的執行過程。特記(原語)：相同的key爲一組，調用一次reduce方法，方法內迭代這一組數據進行計算二、過程(3個map、4個reduce)： (紅色虛線框框屬於reduce流程，左邊屬於map流程。綠色框框屬於Shuffle：描述着數據從map task輸出到reduce task輸入的這段過程) 1、在HDFS中獲取數據，假設數據