hive parquet table 配置壓縮

最近用hivecontext 向hive parquet表中插入數據,發現了一個問題:總量700M的數據在parquet表中竟然有600M。 百度,發現了這個:https://blog.csdn.net/xiao_jun_0820/article/details/76893331 再看看自己的建表語句,確實沒有指定壓縮。 指定一下: 得到結果:gzip、文本形式的、snappy、默認parquet
相關文章
相關標籤/搜索