【Spark】Spark 基本概念、模塊和架構

本文結構如下: 基本概念 基本模塊 基本架構 一、基本概念 RDD(Resilient Distributed Datasets):彈性分佈式數據集,只讀分區記錄的集合,Spark 對所處理數據的基本抽象。RDD 是 Spark 分發數據和計算的基礎抽象類。一個 RDD 是一個不可改變的分佈式集合對象,因此在使用 scala 編寫時,前面加修飾符 val 。Spark 中 的計算可以簡單抽象爲對
相關文章
相關標籤/搜索