Spark運行架構------學習筆記

基本概念: RDD:是Resillient Distributed Dataset(彈性分佈式數據集)的簡稱,是分佈式內存的一個抽象概念,提供了一種高度受限的共享內存模型 DAG:是Directed Acyclic Graph(有向無環圖)的簡稱,反映RDD之間的依賴關係 Executor:是運行在工作節點(WorkerNode)的一個進程,負責運行Task Application:用戶編寫的Sp
相關文章
相關標籤/搜索