Hive性能比較之in的使用和join的使用

問題:已知老用戶表B,求解瀏覽表A裏有多少用戶是老用戶? 說明: A表有130萬不重複瀏覽用戶,B表也是百萬級。web 方法一: select count(*) from (select pin from A group by pin) a join (select pin from B group by pin) b 出現了數據傾斜,卡在一個reducer一直跑不出來。svg 方法二: sele
相關文章
相關標籤/搜索