Hive(六) Hive 分桶

1 hive 分桶概述 分桶表是對列值取哈希值的方式,將不同數據放到不同文件中存儲。 對於 hive 中每一個表、分區都可以進一步進行分桶。 由列的哈希值除以桶的個數來決定每條數據劃分在哪個桶中。 適用場景: 對比 MR 的 HashPartition 數據抽樣( sampling ) 2 開啓支持分桶 set hive.enforce.bucketing=true; 默認:false;設置爲 t
相關文章
相關標籤/搜索