MapReduce執行流程解析

時間 2019-12-07

原文原文鏈接

本文基於hadoop2.x，以wordcount爲例解析MapReduce執行流程。oop 注：假設HDFS中有兩個文件。分別爲1.txt（150M），2.txt（100M）spa 1.Map階段步驟：orm （1）hadoop掃描指定路徑下的全部文件，本文指的是1.txt和2.txt，並將其進行邏輯切片（也可稱爲邏輯規劃），每一個切片被稱爲split。一般切片大小與block大小保持一致。本文

>>阅读原文<<