Hadoop FileInputFormat 默認切片機制

默認的切片機制 簡單地按照文件的內容長度進行切片 切片大小,默認等於 block 大小**(Local模式默認32M,集羣模式默認128M)** 切片時不考慮數據集整體,而是逐個針對每一個文件單獨切片 源碼分析 參考:Hadoop MapReduce Splits 切片源碼分析及切片機制 計算切片大小 computeSplitSize 默認情況下,切片大小=blocksize protected
相關文章
相關標籤/搜索