odps下的表分區解釋

分區字段一般來說都是重複性非常強的字段,比如說時間,某一天可能會產生幾萬條數據,把這一天產生的數據就存入到一個分區中,而時間(某天)就是分區字段,時間(某天)所在的列就是分區列。也就是說,基於分區列的數據作爲一個緯度,進行了數據塊的劃分存儲,加快查詢速度。每一個分區塊裏面的數據是完整性的,而不是分區列裏的一列或者幾列數據。在odps中最多支持六級分區。也就是說partition by裏面可以有六個
相關文章
相關標籤/搜索