Spark任務調度

Spark是分佈式計算平臺,最核心的就是他的任務調度體系。分佈式

DagSchedule的做用

最主要方法是SubmitJob。負責Job的調度,Job劃分紅多個Stage,每一個Stage設置一個TaskSetManager,管理多個Task。調度TaskSchedulerImpl執行Task。spa

TaskSchedulerImpl的做用

目前是TaskScheduler接口的惟一實現類。任務調度,以TaskSet爲單位進行任務調度,每一個TaskSet包含一組Task。TaskScheduler管理着TaskSetManager,而TaskSetManager管理着一組關聯的Task的生命週期。接口

TaskSetManager

管理一組Task的生命週期,元數據等。生命週期

ScheduleBackEnd

各類Endpoint的實現類,負責在集羣間傳遞任務調度的消息。it

相關文章
相關標籤/搜索