Hive之表優化

1、小表、大表 Join  將 key 相對分散,而且數據量小的表放在 join 的左邊,這樣能夠有效減小內存溢出錯誤發生的概率;再進一步,可使用 map join 讓小的維度表(1000 條如下的記錄條數)先進內存。在 map 端完成 reduce。 負載均衡 新版的 hive 已經對小表 JOIN 大表和大表 JOIN 小表進行了優化。小表放在左邊和右邊已經沒有明顯區別。 優化 例:ui 一、
相關文章
相關標籤/搜索