Spark之 RDD

Spark之 RDD 簡介 RDD(Resilient Distributed Dataset)叫作彈性分佈式數據集,是Spark中最基本的數據抽象,它表明一個不可變、可分區、裏面的元素可並行計算的集合。   Resilient:彈性,它表示的含義rdd的數據是能夠保存在內存中或者是磁盤中。   Distributed:它的數據是分佈式存儲的,後期方便於進行分佈式計算。   Dataset:它就是
相關文章
相關標籤/搜索