【問題描述】 lzw和snappy壓縮分別應用在什麼場景比較合適? 算法
【解決辦法】 snappy 壓縮算法是以單條記錄爲單位進行壓縮,記錄內部的數據重複讀直接影響到壓縮率。所以,當記錄內部數據重複度較高,如每條記錄的字段名、字段值類似,使用 snappy 算法可得到良好的壓縮性能。若是記錄內部數據重複度很低,但記錄間具備更好的類似性,如不一樣記錄之間有相同的字段名、相近的字段值等,則使用 lzw 算法更優。app