Hive中GroupBy的實現原理

例子 hive> SELECT * FROM logs; a 蘋果 5 a 橙子 3 a 蘋果 2 b 燒雞 1 hive> SELECT uid, SUM(COUNT) FROM logs GROUP BY uid; a 10 b 1 計算過程 默認設置了hive.map.aggr=true,因此會在mapper端先group by一次,最後再把結果merge起來,爲了減小re
相關文章
相關標籤/搜索