2020-09-11:Hive的優化策略有哪些?

福哥答案2020-09-11:web Hive調優及優化的12種方式 1.請慎重使用COUNT(DISTINCT col)。能夠考慮使用Group By 或者 ROW_NUMBER() OVER(PARTITION BY col)方式代替COUNT(DISTINCT col)。 2.小文件會形成資源的多度佔用以及影響查詢效率。在數據源頭HDFS中控制小文件產生的個數。 3.請慎重使用SELECT
相關文章
相關標籤/搜索