Hadoop-MapReduce

一、概述: 以WordCount爲例,描述MapReduce的執行過程。 特記(原語):相同的key爲一組,調用一次reduce方法,方法內迭代這一組數據進行計算 二、過程(3個map、4個reduce): (紅色虛線框框屬於reduce流程,左邊屬於map流程。綠色框框屬於Shuffle:描述着數據從map task輸出到reduce task輸入的這段過程) 1、在HDFS中獲取數據,假設數據
相關文章
相關標籤/搜索