Hive分桶表學習總結

前言 學習總結一下Hive的分桶表。 分桶規則:對分桶字段值進行哈希,哈希值除以桶的個數求餘,餘數決定了該條記錄在哪個桶中,也就是餘數相同的在一個桶中。 優點:1、提高join查詢效率 2、提高抽樣效率 1、建表 通過 clustered by(字段名) into bucket_num buckets 分桶,意思是根據字段名分成bucket_num個桶 create table test_buck
相關文章
相關標籤/搜索