HQL底層原理及優化:(一)使用group by代替distinct,以防數據傾斜。

本文轉載自hive性能優化使用group by替代distinct原理-weixin_42412645,感謝做者的知識分享,文章已講解得很是清晰,筆者再也不贅述。web 平常業務統計中常常使用除重(distinct)操做,可是當出現某一組數據特別多時就會出現數據傾斜。因而在SQL編寫的時候就使用group by來代替distinct,從而讓執行效率提高。下面說一下我的的理解。 原始數據page_t
相關文章
相關標籤/搜索