MapReduce中input split和block的劃分以及maptask和reducetask數量的肯定

學了mapreudce框架沒多久,雖然會寫不少的一些常見的案例,可是這個框架中一些本質地方的實現仍是有不少疑惑的。因此就想整理一下最近所學到的東西。 首先先理清楚block和split的區別。 一、block塊 當把文件上傳到hdfs中時,第一步要進行的操做就是劃分數據,數據在hdfs中被劃分爲一塊一塊的,默認的大小是64MB,這個塊的大小能夠在haddop-default.xml中配置。另外,若
相關文章
相關標籤/搜索