大數據調優

1.distrbute by rand()或者加表中字段 算法

           distribute by是控制在map端如何拆分數據給reduce端的。hive會根據distribute by後面列,對應reduce的個數進行分發,默認是採用hash算法hash

相關文章
相關標籤/搜索