hive-隨機取樣

轉自 http://daizj.iteye.com/blog/2273426算法 http://lxw1234.com/archives/2015/08/444.htm app 0-Random sampling         使用RAND()函數和LIMIT關鍵字來獲取樣例數據。 使用DISTRIBUTE和SORT關鍵字來保證數據是隨機分散到mapper和reducer的。ORDER BY R
相關文章
相關標籤/搜索