Spark 學習筆記----寬依賴與窄依賴深度剖析

窄依賴: Narrow Dependency。一個RDD,對它的父RDD只有簡單的一對一的依賴關係,也就是說RDD的每個partition僅僅依賴於父RDD中的一個partition,父RDD和子RDD的partition之間的對應關係是一對一的; 寬依賴: Shuffle Dependency。本質就是Shuffle。也就是說每一個父RDD的partition中的數據,都有可能傳輸一部分,到下一
相關文章
相關標籤/搜索