[hadoop2.7.1]I/O之MapFile(排過序的SequenceFile)讀、寫、重建index實例

MapFile 是排序後的SequenceFile,MapFile由兩部分組成,分別是data和index。 index 文件的數據索引,主要記錄了每個Record的key值,以及該Record在文件中的偏移位置。在MapFile被訪問的時候,索引文件會被加載到內存,通過索引映射關係可迅速定位到指定Record所在文件位置,因此,相對SequenceFile而言,MapFile的檢索效率是高效的,
相關文章
相關標籤/搜索