Spark:Java實現 二次排序

測試數據java 1 5 2 4 3 6 1 3 2 1 輸出結果web 1 3 1 5 2 1 2 4 3 6 實現思路:算法 1.實現自定義的key,要實現Ordered接口和Serializable接口,在key中實現本身對多個列的排序算法 2.將包含文本的RDD,映射成key爲自定義key,value爲文本的JavaPariRDD 3.使用sortByKey算子按照自定義的key進行排序
相關文章
相關標籤/搜索