Hive壓縮說明

爲什麼要壓縮 在Hive中對中間數據或最終數據做壓縮,是提高數據吞吐量和性能的一種手段。對數據做壓縮,可以大量減少磁盤的存儲空間,比如基於文本的數據文件,可以將文件壓縮40%或更多。同時壓縮後的文件在磁盤間傳輸和I/O也會大大減少;當然壓縮和解壓縮也會帶來額外的CPU開銷,但是卻可以節省更多的I/O和使用更少的內存開銷。 壓縮模式說明 1. 壓縮模式評價 可使用以下三種標準對壓縮方式進行評價: 壓
相關文章
相關標籤/搜索