談一談你對mapreduce 的理解?(大數據面試題系列~)

MapReduce 是一種用於數據處理的編程模型。我們可以這樣理解MapReduce, 把一堆雜亂無章的數據按照某種特徵歸納起來,然後處理並得到最後的結果。Map 面對的是雜亂無章的互不相關的數據,它解析每個數據,從中提取key 和value, 也就是提取了數據的特徵。經過MapReduce 的shuffle 階段之後,在Reduce 階段看到的都是歸納好的數據,然後再進行進一步的處理以得到結果。
相關文章
相關標籤/搜索