子雨大數據之Spark入門教程---Spark入門:Spark運行架構1.2

本節首先介紹Spark的基本概念和架構設計方法,而後介紹Spark運行基本流程。數據庫 基本概念 在具體講解Spark運行架構以前,須要先了解幾個重要的概念: *  RDD:是彈性分佈式數據集(Resilient Distributed Dataset)的簡稱,是分佈式內存的一個抽象概念,提供了一種高度受限的共享內存模型; *  DAG:是Directed Acyclic Graph(有向無環
相關文章
相關標籤/搜索