MapReduce框架Hadoop應用(一)

Google對其的定義:MapReduce是一種變成模型,用於大規模數據集(以T爲級別的數據)的並行運算。用戶定義一個map函數來處理一批Key-Value對以生成另一批中間的Key-Value對,再定義一個reduce函數將所有這些中間的有相同Key的value合併起來。「Map」(映射)和「Reduce」(簡化)的概念和它們的主要思想都是從函數式編程語言借用而來的,還有從矢量編程語言借來的特性
相關文章
相關標籤/搜索