Hive的分區,分組詳解和區別

        Hive把表組織成分區(partition),這是一種根據分區列的(partition column,如日期等)的值對錶進行粗略劃分的機制。使用分區能夠加快數據分片(slice)的查詢速度。同時分區不會影響整個數據集的大範圍查詢的執行。表或者分區又能夠進一步分爲桶(bucket).它會爲數據提供額外的結構以得到更高效的查詢速度。好比,經過根據用戶的id來劃分桶,咱們能夠在全部的用戶
相關文章
相關標籤/搜索