pyspark RDD 自定義排序(python)

問題: 現有數據 data = ((‘crystal’,90,22),(‘crystal1’,100,28),(‘crystal3’,100,22)) 如今對data 進行排序 排序規則: 1 按元組中的第二個字段排序 2 第二個字段相等的話,按第三個字段排序python 實現思路: 定義一個列表元素類,每個元素均可以實例化成這個類的對象 定義類的比較規則,比較規則即爲需求規則, 而後將RDD遠程
相關文章
相關標籤/搜索