Spark Core 和 Spark SQL 實現分組取Top N(基於scala)

分組取Top N在平常需求中不少見:sql 每一個班級分數前三名同窗的名字以及分數 各省指標數量前三的市的名字  等等需求,主要思想就是在某一個分區(班級,省)中取出該分區Top N的數據數組 測試數據格式:函數 如上圖,字段含義爲,班級,學生姓名,分數測試 下面咱們經過一個Demo來實現各班級分數前三的學生姓名以及分數spa 一、經過Spark core 實現:ssr //讀取測試數據保存爲rd
相關文章
相關標籤/搜索