Spark Core 核心RDD

1、 RDD是一個抽象類,帶泛型的,可以支持多種類型,String、Person、User… 2、RDD : Resilient Distributed Dataset 彈性 分佈式 數據集 是spark裏面最基本的一個抽象的單元,是一個不可變的數據集分區的並行計算 3、 什麼是Resilient 彈性:spark 作爲一個和mapreduce類似的計算框架,能做到分佈式節點掛掉或者某個數據節點丟
相關文章
相關標籤/搜索