Spark如何解決常見的Top N問題

需求   假設我們有一張各個產品線URL的訪問記錄表,該表僅僅有兩個字段:product、url,我們需要統計各個產品線下訪問次數前10的URL是哪些?   http://www.cnblogs.com/yurunmiao/p/4898672.html 解決方案   (1)模擬訪問記錄數據     模擬數據記錄共有1000條,其中包括10個產品線:product1、product2、…、produ
相關文章
相關標籤/搜索