hive壓縮及存儲總結

壓縮: 各種壓縮性能比較 目前,在數倉項目中hive表一般使用snappy格式壓縮數據較多。壓縮和解壓縮速度都比較快。 文件存儲格式: 目前hive的存儲格式主要有4中;TEXTFILE SEQUENCEFILE ORCFILE 和PARQUET 4中存儲格式。在數倉中,hive表一般使用的是ORCFILE。 如果數倉中設置的有緩衝層,緩衝層一般會使用TEXTFILE,因爲TEXTFILE格式的h
相關文章
相關標籤/搜索