Hadoop壓縮

Hadoop壓縮 1、2種Hadoop自帶壓縮格式的特徵比較 2、gzip壓縮   優點:壓縮率比較高,而且壓縮/解壓速度也比較快;hadoop本身支持,在應用中處理gzip格式的文件就和直接處理文本一樣;有hadoop native庫;大部分linux系統都自帶gzip命令,使用方便。缺點:不支持split。 3、bzip2壓縮  優點:支持split;具有很高的壓縮率,比gzip壓縮率都高;h
相關文章
相關標籤/搜索