什麼是寬窄依賴,及特殊join算子,join時何時產生shuffle,何時不產生shuffle

1、 什麼是寬窄依賴, 寬依賴: 發生shuffle時,一定會產生寬依賴,寬依賴是一個RDD中的一個Partition被多個子Partition所依賴(一個父親多有兒子),也就是說每一個父RDD的Partition中的數據,都可能傳輸一部分到下一個RDD的多個partition中,此時一定會發生shuffle 窄依賴: 一個RDD中的一個 Partition最多 被一個 子 Partition所依
相關文章
相關標籤/搜索