hive 數據壓縮與存儲格式選擇

概述 爲什麼會出現需要對文件進行壓縮?  在Hadoop中,文件需要存儲、傳輸、讀取磁盤、寫入磁盤等等操作,而文件的大小,直接決定了這些這些操作的速度。 常見壓縮方式、壓縮比、壓縮解壓縮時間、是否可切分 原文件:1403M Snappy 壓縮:701M,壓縮時間:6.4s,解壓時間:19.8s,不可切分 LZ4 壓縮:693M,壓縮時間:6.4s,解壓時間:2.36s,不可切分 LZO 壓縮:68
相關文章
相關標籤/搜索