Hadoop 之 深入探索MapReduce

1.MapReduce基礎概念 答:MapReduce作業時一種大規模數據的並行計算的便程模型。我們可以將HDFS中存儲的海量數據,通過MapReduce作業進行計算,得到目標數據。 2.MapReduce的四個階段 答:Split階段、Map階段(需要編碼)、Shuffle階段、Reduce階段(需要編碼),下面以WordCount爲例。 3.從分片到Map 答:我們知道輸入的文件時存在Data
相關文章
相關標籤/搜索