Hive分桶

一 什麼是桶的概念,和分區有啥區別? 對於每一個表或者分區,可以進一步細分成桶,桶是對數據進行更細粒度的劃分。默認時對某一列進行hash,使用hashcode對 桶的個數求模取餘,確定哪一條記錄進入哪一個桶。 Hive在查詢數據的時候,一般會掃描整個表的數據,會消耗很多不必要的時間。有些時候,我們只需要關心一部分數據,比如WHERE子句所接的查詢條件,那這時候這種全表掃描的方式是很影響性能的。從而
相關文章
相關標籤/搜索