hadoop文件格式

按行存儲:sequenceFile、mapfile、avro sequenceFile:hadoop api提供的一種二進制文件,數據以<key,value>的形式序列化到文件中。不是很常用,一般用來合併小文件。 mapfile:帶索引的sequenceFile avro:數據序列化框架,類似protocol buffers,thrift,avro有自己的文件格式.avro結尾,avro依賴she
相關文章
相關標籤/搜索