Hadoop——MapReduce計算框架詳細講解

MapReduce(MapReduce是批量計算模型,只有一批數據全部Map完,纔會開啓Reduce階段) 簡單理解 Map(映射):以一條記錄爲單位做映射,在處理當前記錄時不關心其他記錄的狀態 Reduce:以一組記錄爲單位做計算,所以計算前要分組,分組的數據是key-value的形式,分組由map完成 Map:負責數據的映射,過濾,變換,1條記錄進,n條記錄出 Reduce:負責數據的分解,縮
相關文章
相關標籤/搜索