初識sparkCore

1、概念 RDD(Resilient Distributed Dataset),彈性分佈式數據集 ,是分佈式內存的一個抽象概念。mysql 2、RDD的五大特性       一、RDD是由一系列的partition組成的。算法         partition通常有三種方式產生sql     (1)從Scala集合中建立,經過調用SparkContext#makeRDD或SparkContext
相關文章
相關標籤/搜索