MapReduce 切片(split)

分片大小 對於HDFS中存儲的一個文件,要進行Map處理前,須要將它切分紅多個塊,才能分配給不一樣的MapTask去執行。 分片的數量等於啓動的MapTask的數量。默認狀況下,分片的大小就是HDFS的blockSize。 Map階段的對數據文件的切片,使用以下判斷邏輯:web protected long computeSplitSize(long blockSize, long minSize
相關文章
相關標籤/搜索