Spark內核之美(三):DAGScheduler的原理與源碼分析

1、前言 RDD具有延遲計算的特性,當操作是transformation算子的時候,並不執行操作,直到遇到action算子的時候纔開始執行計算。Spark會根據Action操作之前一系列Transform操作的關聯關係,生成一個DAG,在後續的操作中,對DAG進行Stage劃分,生成Task並最終運行。 表1  Spark中支持的RDD轉換(transformation算子)和動作(action算
相關文章
相關標籤/搜索