#hive#hive中的Distinct,group by

Select一些數據時候,會作一些去重處理,好比經過distinct 和group by來去重。spa (1)distinctselect distinct,在數據量不大的狀況下,我都會用,主要本身懶的寫group by  xxx這麼多的字段,額。當數據量太大時候,特別是count(distinct A)的時候,處理的速度會比較慢。另,distinct和Group by同樣,區別不大。 數據 (2
相關文章
相關標籤/搜索