hive的數據存儲格式

hive支持hadoop中的TextFile、RCFile、SequenceFile、AVRO、ORC、Parquet格式 1、TextFile每一行都是一條記錄,每行都以換行符\n結尾,數據不壓縮,磁盤開銷大,數據解析開銷大,可以結合Gzip和Bzip2使用。這種方式,hive不會對數據切分,從而也不會對數據進行並行處理 2、SequenceFile是一種二進制文件,使用方便、可以分割、可以壓縮
相關文章
相關標籤/搜索