Hive的分桶表

1 分桶表原理 分桶是相對分區進行更細粒度的劃分;Hive表或分區表可進一步的分桶; 分桶將整個數據內容按照某列取hash值,對桶的個數取模的方式決定該條記錄存放在哪個桶當中;具有相同hash值的數據進入到同一個文件中; 比如按照name屬性分爲3個桶,就是對name屬性值的hash值對3取摸,按照取模結果對數據分桶。 取模結果爲==0==的數據記錄存放到一個文件 取模結果爲==1==的數據記錄存
相關文章
相關標籤/搜索