MapReduce分區和reduceTask的數量

MapReduce分區和reduceTask的數量 1.MapReduce分區:相同key的數據發送到同一個reduce裏面去。 mapTask處理的是文件切片filesplit。 注意:block的概念是在hdfs當中的,mapreduce當中,每一個mapTask處理的數據都是叫做一個文件切片。 暫時可以簡單地認爲,一個文件切片就是對應一個block塊。還可以簡單地認爲,有多少個block塊,
相關文章
相關標籤/搜索