Hive_查詢優化 計算不一樣數據的總個數 count(distinct id)

  這是一種 Hive 很是常見的問題, 下面讓咱們學習下 如何優化node   需求, 統計 明細表 裏面有多少不一樣的明細 idapp 數據規模 : 全量抽取的 MySQL 數據表,按天分區,天天存儲全部的MySQL 記錄。oop 所選分區在 2億 左右的數據量, 大小在 40 GB 規模。性能     咱們使用最多見的 SQL 進行統計 學習 select count(distinct de
相關文章
相關標籤/搜索