Spark RDD編程(Python和Scala版本)

Spark中的RDD就是一個不可變的分佈式對象集合,是一種具備兼容性的基於內存的集羣計算抽象方法,Spark則是這個方法的抽象。 java Spark的RDD操做分爲轉化操做(transformation)和行動操做(action),二者的區別在於: python        a.轉化操做返回一個新的RDD對象apache        b.行動操做則會對RDD產生一個計算結果,並把結果返回到驅
相關文章
相關標籤/搜索