Hadoop MapReduce原理及實例

MapReduce是用於數據處理的一種編程模型,簡單但足夠強大,專門爲並行處理大數據而設計。java 1. 通俗理解MapReduce MapReduce的處理過程分爲兩個步驟:map和reduce。每一個階段的輸入輸出都是key-value的形式,key和value的類型能夠自行指定。map階段對切分好的數據進行並行處理,處理結果傳輸給reduce,由reduce函數完成最後的彙總。python
相關文章
相關標籤/搜索