Hive之分桶表解析

分區針對的是數據的存儲路徑;分桶針對的是數據文件。  分區提供一個隔離數據和優化查詢的便利方式。不過,並非所有的數據集都可形成合理的分區。  分桶是將數據集分解成更容易管理的若干部分的另一個技術。  1、創建分桶表  create table stu_buck( id int,  name string )  clustered by(id) into 4 buckets  row format
相關文章
相關標籤/搜索