hive去重統計

hive去重多行數據並統計 這個是練習數據部分截圖,可以看出有部分重複數據 OK我們先進入hive 然後創建庫uid create database uid; 然後創建表uid_id create table uid_id(uid_id int); 然後去重 select distinct uid_id from uid; 最後完成會彈一個提示裏面有表的數據量就是出重後剩餘的數量
相關文章
相關標籤/搜索