MapReduce執行流程解析

本文基於hadoop2.x,以wordcount爲例解析MapReduce執行流程。oop 注:假設HDFS中有兩個文件。分別爲1.txt(150M),2.txt(100M)spa 1.Map階段 步驟:orm (1)hadoop掃描指定路徑下的全部文件,本文指的是1.txt和2.txt,並將其進行邏輯切片(也可稱爲邏輯規劃),每一個切片被稱爲split。一般切片大小與block大小保持一致。本文
相關文章
相關標籤/搜索