hive常見的幾種文件存儲格式與壓縮方式的結合-------Parquet格式+snappy壓縮 以及ORC格式+snappy壓縮文件的方式

一.使用Parquet存儲數據 數據使用列存儲以前是普通的行存儲,下面是行存儲的的文件大小,這個HDFS上的數據 使用parquet列存儲,能夠將文件的大小減少化。下面具體講parquet存儲數據的代碼以及加載數據的格式。 數據庫代碼:web create table if not exists db_yhd.track_log_parquet( id STRING, u
相關文章
相關標籤/搜索