Hive 分段採樣

需求 從某Hive Table中按照某字段的值的排名(rank)分紅N組,第1組爲排名前 1/N的內容,第2組爲排名前1/N ~ 2/N的內容,…,依次類推。而後每組內部隨着採樣M條記錄。web 案例 某搜索引擎的搜索日誌中,按照每日搜索次數降序排列搜索關鍵詞(query),按照排名分紅10組,第1組爲搜索次數排名前10%的記錄;第2組爲搜索次數排名前10%~20%之間的記錄;第3組爲搜索次數排名
相關文章
相關標籤/搜索