Spark源碼分析-SortByKey源碼

簡單介紹 SortByKey對<key, value>數據進行按照key進行排序,怎麼個排法,我麼先看一下spark源碼中的一些註釋:           兩段註釋的基本意思差不多:通過RDD的key進行排序,每一個分區包括在一個範圍內排好序的元素,然後返回一個有序的list集合,或者按照該key以part-x的形式保存在文件系統上。大概的意思就是這樣,就是按照partition排好序,然後返回。
相關文章
相關標籤/搜索