Hadoop的一個變長long編碼剖析 本文作者:佚名 來源:51CTO

Hadoop對於long、int (化成long進行編碼)的編碼設計了自己的一套編碼方式,這是一個zero-compressed encoded的變長編碼方式,有利於大大壓縮冗餘數據。具體算法其實很簡單,具體來說有如下幾點: 1、對於-112 <= i <= 127的整數,只用1個字節byte來表示;如果超過上述範圍時,編碼第一個字節則會用來表示i的總字節數,後面則跟着 i 的字節; 2、如果i大
相關文章
相關標籤/搜索