hive分桶管理

分桶:按照用戶建立表時指定的分桶字段進行hash散列多個文件 1.hive分桶的原理 跟MR中的HashPartitioner的原理如出一轍oop            MR中:按照key的hash值去模除以reductTask的個數spa          Hive中:按照分桶字段的hash值去模除以分桶的個數日誌 2.hive分桶的做用 好處: 一、方便抽樣 二、提升join查詢效率 orm
相關文章
相關標籤/搜索