Hadoop學習(2)——組件介紹(MapReduce)

一、分佈式計算框架MapReduce介紹(計算向數據移動) 1.1、爲什麼叫MapReduce MR原語:map + reduce(MapTask & ReduceTask)輸入(格式化k,v)數據map映射成一箇中間數據集(k,v)reduce (sql) 「相同」的key爲一組,調用一次reduce方法,方法內迭代這一組數據進行計算 (類似的sql) 1.2、計算框架MR(wordcount
相關文章
相關標籤/搜索