Spark storage系列------3.Spark cache數據塊以後對後繼Job任務調度的影響,以及後繼Job Task執行的影響

    DAGScheduler.submitStage創建Spark應用的物理執行圖,DAGScheduler.submitStage經過調用DAGSchdeuler.getMissingParentStages找到一個Stage的祖宗Stage並把祖宗Stage加入到物理執行圖中。在這裏若是發現依賴的RDD的所有分區已經存儲到了BlockManager,也就是已經成功Cache,那麼這個RDD
相關文章
相關標籤/搜索