Hadoop之MapReduce

1 MapReduce編程 1.1 MapReduce簡介 MapReduce是一種編程模型,用於大規模數據集(大於1TB)的並行運算,用於解決海量數據的計算問題。 MapReduce分成了兩個部分:    1、映射(Mapping)對集合裏的每個目標應用同一個操作。即,如果你想把表單裏每個單元格乘以二,那麼把這個函數單獨地應用在每個單元格上的操作就屬於mapping。    2、化簡(Reduc
相關文章
相關標籤/搜索