02.spark-core入門(算子和Spark任務執行流程)

一、Spark Core概念講解 Spark Core:內核,也是Spark中最重要的部分。 相當於Mapreduce SparkCore 和 Mapreduce都是進行離線數據分析 SparkCore的核心:RDD(彈性分佈式數據集),由分區組成 二、RDD的五大特性       1、RDD是由一系列的partition組成的。         partition一般有三種方式產生     (1
相關文章
相關標籤/搜索