MapReduce原理

MapReduce是一種處理大型及超大型數據集並生成相關執行的編程模型。通俗來講,MapReduce是一個大數據分佈式計算框架,它基於google的一篇研究論文MapReduce。 MapReduce是由兩個階段組成: Map端 Reduce端 而Map端和Reduce端之間有着一系列複雜的suffle(洗牌)過程 主要思想:分久必合 核心思想:"相同"的key爲一組,調用一次reduce方法,方
相關文章
相關標籤/搜索