使hadoop支持Splittable壓縮lzo

luoli哥要刪本身的blog了,因此好文章趕忙轉過來,指望之後還有的看:)node 在hadoop中使用lzo的壓縮算法能夠減少數 據 的大小和數據的磁盤讀寫時間,不只如此,lzo是基於block分塊的,這樣他就容許數據被分解成chunk,並行 的被hadoop處理。這樣的特色,就可讓lzo在hadoop上成爲一種很是好用的壓縮格式。     因爲壓縮的數據一般只有原始數據的1/4,在HDFS中
相關文章
相關標籤/搜索