Spark--分組TopN

爲了獲取每一個分組的topN, 首先要進行分組, 再對每一個分組進行排序,獲取TopN。 測試數據 hadoop 23 spark 45 java 90 spark 57 spark 90 hadoop 99 hadoop 76 spark 45 spark 88 spark 89 hadoop 45 hadoop 90 java 78 java 70 1.一、第一步, 將源數據轉化爲(key,
相關文章
相關標籤/搜索