Hive-分桶(Cluster By)

1.什麼叫分桶: 類似分區,根據表中的某一字段進行哈希後, 分到不同的桶裏。 2.爲何要分桶: 1.分區滿足不了用戶分隔開數據的意願,分區有數量限制, Hive會阻止過多小分區。 2.因此有了分桶,可將數據分到固定數目的桶中。沒有數據波動。 3.例子: 3.向分桶表裏正確填充數據:
相關文章
相關標籤/搜索