Spark中寬依賴和窄依賴

Spark中RDD的高效與DAG圖有着莫大的關係,在DAG調度中需要對計算過程劃分stage,而劃分依據就是RDD之間的依賴關係。針對不同的轉換函數,RDD之間的依賴關係分類窄依賴(narrow dependency)和寬依賴(wide dependency, 也稱 shuffle dependency)。 窄依賴是指父RDD的每個分區只被子RDD的一個分區所使用,子RDD分區通常對應常數個父RD
相關文章
相關標籤/搜索