Hive表的數據壓縮、存儲及Hive的序列化

一、數據的壓縮 1、數據的壓縮說明 (1)壓縮模式評價 可使用以下三種標準對壓縮方式進行評價 1、壓縮比:壓縮比越高,壓縮後文件越小,所以壓縮比越高越好; 2、壓縮時間:越快越好; 3、已經壓縮的格式文件是否可以再分割:可以分割的格式允許單一文件由多個Mapper程序處理,可以更好的並行化; (2)常見壓縮格式 壓縮方式 壓縮比 壓縮速度 解壓縮速度 是否可分割 gzip 13.4% 21 MB/
相關文章
相關標籤/搜索