mapreduce中FileInputFormat與TextInputFormat解析以及HDFS小文件優化

一、FileInputFormat與TextInputFormat 在map階段,文件先被切分成split塊,而後每一個split切片對應一個Mapper任務 FileInputFormat這個類先對輸入文件進行邏輯上的劃分,以128M爲單位,將原始數據從邏輯上分割成若干個split,每個split切片對應一個Mapper任務 TextInputFormat這個類隨後將每個split塊中的每行記錄
相關文章
相關標籤/搜索