Spark-RDD簡介以及算子實例

                              Spark-RDD簡介以及算子實例 1、RDD概述 1.1 什麼是RDD?es6 RDD(Resilient Distribute Dataset)叫作分佈式數據集。式Spark最基本的數據抽象。apache 它表明一個不可變,可分區,裏面的元素可並行計算的集合。centos RDD具備數據流模型的特色:自動容錯、位置感應性調度和可伸縮性
相關文章
相關標籤/搜索