RDD的建立方式及注意事項

1 RDD的建立方式 1.1 SparkContext’s parallelize(並行化集合) 並行化集合經過調用SparkContext的並行化方法在驅動程序(Scala Seq)中的現有集合上建立的。複製集合的元素以造成可並行操做的分佈式數據集。web val data = Array(1, 2, 3, 4, 5) val distData = sc.parallelize(data) 並行
相關文章
相關標籤/搜索