sparkCore

SparkCore 講解 一、RDD基本概念 1.一、什麼是RDD ​ RDD(Resilient Distributed Dataset)叫作彈性分佈式數據集,是Spark中最基本的數據抽象,它表明一個不可變、可分區、裏面的元素可並行計算的集合。html ​ Dataset:一個數據集合,用於存放數據的。java ​ Distributed:RDD中的數據是分佈式存儲的,可用於分佈式計算。nod
相關文章
相關標籤/搜索