Hadoop面試題總結

Hadoop面試題總結 1. hadoop的TextInputFormat做用是什麼?如何自定義實現? InputFormat會在map操做以前對數據進行兩方面的預處理:java gitSplits,返回的是InputSplit數組,對數據進行split切片,每個切片都須要一個map任務去處理。 getRecordReader,返回的是RecordReader對象,將每一個切片中的數據轉換爲<k,
相關文章
相關標籤/搜索