Spark 中的寬依賴和窄依賴

Spark中RDD的高效與DAG圖有着莫大的關係,在DAG調度中需要對計算過程劃分stage,而劃分依據就是RDD之間的依賴關係。針對不同的轉換函數,RDD之間的依賴關係分類窄依賴(narrow dependency)和寬依賴(wide dependency, 也稱 shuffle dependency). 寬依賴與窄依賴     窄依賴是指父RDD的每個分區只被子RDD的一個分區所使用,子RDD
相關文章
相關標籤/搜索