MapReduce架構簡介

前言: MapReduce是用於數據處理的一種編程模型,簡單但足夠強大,專門爲並行處理大數據而設計。 MapReduce的處理過程分爲兩個步驟:map和reduce。每個階段的輸入輸出都是key-value的形式,key和value的類型可以自行指定。map階段對切分好的數據進行並行處理,處理結果傳輸給reduce,由reduce函數完成最後的彙總。 到了2.0之後,MapReduce可以理解爲是
相關文章
相關標籤/搜索