Hive之表優化

一、小表、大表 Join  將 key 相對分散,並且數據量小的表放在 join 的左邊,這樣可以有效減少內存溢出錯誤發生的機率;再進一步,可以使用 map join 讓小的維度表(1000 條以下的記錄條數)先進內存。在 map 端完成 reduce。  新版的 hive 已經對小表 JOIN 大表和大表 JOIN 小表進行了優化。小表放在左邊和右邊已經沒有明顯區別。  例: 1、創建大表 cr
相關文章
相關標籤/搜索