Stage的劃分

介紹 Stage是Spark獨有的概念,是對RDD進行範圍描述的東西。 原理 Stage劃分是從最終結果RDD從後往前,通過遞歸來劃分stage,循環到最後會把所有rdd劃分爲一個Stage(可以結合Stage的源碼來理解這句話) 爲什麼要根據寬窄依賴劃分Stage? 在此之前一定要先理解寬依賴和窄依賴的概念:寬依賴和窄依賴 每個寬依賴的處理均會是一個stage的劃分點。可以這麼簡單的理解: 寬依
相關文章
相關標籤/搜索