大數據與Hadoop系列之壓縮(一)

Hadoop壓縮簡介 Hadoop作爲一個較通用的海量數椐處理平臺,在使用壓縮方式方面,主要考慮壓縮速度和壓縮文件的可分割性. 所有的壓縮算法都會考慮時間和空間的權衡,更快的壓縮和解壓縮速度通常會耗費更多的交間(壓縮比較低)例如:通過gzip命令壓縮數據時,用戶可以設置不同的選項來選擇速度優先或空間優先.選項-1表示優先考慮速度,選項-9表示空間最優,可以獲得最大的壓縮比。 需要注意的是:有些壓縮
相關文章
相關標籤/搜索