hive性能優化使用map join

在實際業務邏輯中經常進行兩張表的join,不管是兩張大表關聯還是一張大表一張小表關聯會出現經常數據傾斜。下面介紹一下我在工作使用的總結: 原始數據page_test 原始數據city 1.Common join原理(select a.user_id,a.city,b.name from page_test a left outer join city b ) 注意: 1.map端的操作key爲兩張
相關文章
相關標籤/搜索