Spark 的做業執行原理

參見書籍 《圖解Spark:核心技術與案例實戰》多線程 要點概述spa ** 做業(Job)提交後由行動操做觸發做業執行,根據RDD的依賴關係構建DAG圖,由DAGSheduler(面向階段的任務調度器)解析線程 ** DAGSheduler在解析DAG圖時是以RDD的依賴是否爲寬依賴,當遇到寬依賴就劃分爲一個新的調度階段。每一個調度階段都包含一個或者是多個任務(Task),多個Task組成任務集
相關文章
相關標籤/搜索