Spark:寬依賴和窄依賴

站在父RDD角度 窄依賴:一對一 站在父RDD角度 寬依賴:一對多 寬依賴和窄依賴:   寬依賴:父RDD的分區被子RDD的多個分區使用   例如 groupByKey、reduceByKey、sortByKey等操作會產生寬依賴,會產生shuffle 窄依賴:父RDD的每個分區都只被子RDD的一個分區使用  例如map、filter、union等操作會產生窄依賴   注意:join操作有兩種情況
相關文章
相關標籤/搜索