Hadoop入門之Mapreduce部分流程解析

1.建立連接後,任務文件的分片 (1)客戶端和resourcemanager建立連接後需要提交一些文件來構建Job任務,分片的文件是其中之一,還有Job.xml 和Jar (2)分片主要的作用是爲後面的Maptask過程確定啓動多少個maptask及其所要處理的文件的劃分(默認以文件或者blackSzie劃分) (3)具體分片數量的確定在  org.apache.hadoop.mapreduce.
相關文章
相關標籤/搜索