hive分桶管理

分桶:按照用戶創建表時指定的分桶字段進行hash散列多個文件 1.hive分桶的原理 跟MR中的HashPartitioner的原理一模一樣            MR中:按照key的hash值去模除以reductTask的個數          Hive中:按照分桶字段的hash值去模除以分桶的個數 2.hive分桶的作用 好處: 1、方便抽樣 2、提高join查詢效率 3.hive分桶和分區的
相關文章
相關標籤/搜索