Hive性能優化

1.概述   Hive優化介紹,轉:http://www.cnblogs.com/smartloli/p/4356660.html 2.介紹   首先,我們來看看Hadoop的計算框架特性,在此特性下會衍生哪些問題? 數據量大不是問題,數據傾斜是個問題。 jobs數比較多的作業運行效率相對比較低,比如即使有幾百行的表,如果多次關聯多次彙總,產生十幾個jobs,耗時很長。原因是map reduce作
相關文章
相關標籤/搜索