Pair RDD基本操做

Pair RDD基本操做 雖然大部分Spark的RDD操做都支持全部種類的對象,可是有少部分特殊的操做只能做用於鍵值對類型的RDD。這類操做中最多見的就是分佈的shuffle操做,好比將元素經過鍵來分組或彙集計算。在Python中,這類操做通常都會使用Python內建的元組類型,好比(1, 2)。生成的鍵值對的RDD稱爲PairRDD。web 建立Pair RDD 有不少種建立鍵值對的方式,不少存
相關文章
相關標籤/搜索