Spark源碼分析 -- PairRDD

和通常RDD最大的不一樣就是有兩個泛型參數, [K, V]表示pair的概念 關鍵的function是, combineByKey, 全部pair相關操做的抽象html combine是這樣的操做, Turns an RDD[(K, V)] into a result of type RDD[(K, C)] 其中C有可能只是簡單類型, 但常常是seq, 好比(Int, Int) to (Int,
相關文章
相關標籤/搜索