Hive-2.HiveQL查詢中抽樣查詢

 當數據集很是大的時候,咱們須要找一個子集來加快數據分析。此時咱們須要數據採集工具以得到須要的子集。在此能夠使用三種方式得到採樣數據:random sampling, bucket sampling, block sampling。數組 8.1隨機抽樣(Random sampling )  使用RAND()函數和LIMIT關鍵字來獲取樣例數據,使用DISTRIBUTE和SORT關鍵字來保證數據是隨
相關文章
相關標籤/搜索