hive數據模型

分桶與分區的區別: 1)分區和分桶最大的區別就是分桶隨機分割數據庫,分區是非隨機分割數據庫。 分區是表的部分列的集合,可以爲頻繁使用的數據建立分區, 這樣查找分區中的數據時就不需要掃描全表,這對於提高查找效率很有幫助,水平劃分 2)分桶是垂直劃分,桶是通過對指定列進行哈希計算來實現的,通過哈希值將一個列名下的數據切分爲一組桶, 並使每個桶對應於該列名下的一個存儲文件, hive使用對分桶所用的值進
相關文章
相關標籤/搜索