大數據算法

前言 1.MapReduce計算框架流程 Mapper(映射器): 1)對數據進行分片,劃分紅多個Splits(每一個Split按照塊大小劃分),每一個Split都對應一個Mapper 2)Mapper對應的將Split中的數據進行映射成(key,value)web Reducer(歸約器) 對Mapper處理後的數據依次進行排序(默認按照字典排序),混洗,分組(Partitioner進行分區,分
相關文章
相關標籤/搜索