Spark Core應用解析

一。RDD概念 1.1。RDD概述 1.1.1。什麼是RDD   RDD(Resilient Distributed Dataset)叫作分佈式數據集,是Spark中最基本的數據抽象,它表明一個不可變、可分區、裏面的元素可並行計算的集合。在 Spark 中,對數據的全部操做不外乎建立 RDD、轉化已有RDD 以及調用 RDD 操做進行求值。每一個 RDD 都被分爲多個分區,這些分區運行在集羣中的不
相關文章
相關標籤/搜索