spark任務調度流程

   job中的RDD會形成有向無環圖(DAG),然後這個DAG會提交給DAGScheduler對象(DAGScheduler是調度任務中的高層調度器,他是在創建sparkcontext也就是啓動Driver的時候被創建出來的),它會將job中的RDD依賴關係,根據寬依賴劃分成一個個的stage。然後這些被劃分好的stage按照taskset的形式發送到TaskScheduler中(TaskSch
相關文章
相關標籤/搜索