Hive 分桶

概念 分桶:將數據集分解成更容易管理的若干部分。 分區針對的是數據的存儲路徑,分桶針對的是數據文件。 創建桶 查看結果: 抽樣查詢 語法:TABLESAMPLE(BUCKET x OUT OF y) y必須是table總bucket數的倍數或者因子。hive根據y的大小,決定抽樣的比例。例如,table總共分了4份,當y=2時,抽取(4/2=)2個bucket的數據,當y=8時,抽取(4/8=)1
相關文章
相關標籤/搜索