寬依賴和窄依賴

窄依賴:一個RDD,對它的父RDD,只有簡單的一對一的依賴關係。也就是說,每個RDD的partition,僅僅依賴於父RDD中的一個partition。父RDD和子RDD的partition之間的關係是一對一的。 寬依賴:本質就是Shuffle,就是每一個父RDD的partition中的數據,都可能會傳輸一部分,到下一個RDD的每個partition中。此時就會出現,父RDD和子RDD的parti
相關文章
相關標籤/搜索