一種SequenceFile的格式研究

  最近仔細研究瞭如下公司中使用的SequenceFile文件格式,SequenceFile的格式比較緊湊,實現了從中間讀取文件內容(便於hadoop將文件進行適當地切分),同時也能夠支持僅讀取文件的元數據功能。java   概述 通過總結後的文件格式圖大概以下:   其中進入到SequenceFile的全部記錄,都須要根據必定的hash規則肯定一個HashKey。相對而言,記錄塊是比較簡單的,每
相關文章
相關標籤/搜索