在不指定的狀況下,Map 和Reduce Task 的數目由這樣幾個因素決定:it
1.輸入數據的塊數,Map 輸出數據的塊數(Reduce數量是能夠設定),一個塊通常由一個task 來處理(通常,即文件格式是否支持切分)table
2.輸入數據的文件數量。一個文件至少須要1 個task 來處理(至少,即一個文件多是存儲於多個文件塊)數據
3.是否對數據進行了壓縮,壓縮格式是否可切分(Splitable),若是不可分,即便文件大於64M,也只能由一個task 來處理 (不支持切分,順序讀取)tab