hive的distribute by應用

hive的distribute by應用 博客分類:  hive   hive中的distribute by是控制在map端如何拆分數據給reduce端的。 hive會根據distribute by後面列,根據reduce的個數進行數據分發,默認是採用hash算法。算法 對於distribute by進行測試,必定要分配多reduce進行處理,不然沒法看到distribute by的效果。jsp
相關文章
相關標籤/搜索