Spark速成之2:運行架構

    本節首先介紹Spark的基本概念和架構設計方法,然後介紹Spark運行基本流程。 1.基本概念     在具體講解Spark運行架構之前,需要先了解幾個重要的概念:     1、RDD:是彈性分佈式數據集(Resilient Distributed Dataset)的簡稱,是分佈式內存的一個抽象概念,提供了一種高度受限的共享內存模型;     2、DAG:是Directed Acyclic
相關文章
相關標籤/搜索