spark stage

spark RRD 依賴關係: 窄依賴:每個父RRD的分區至多被一個子RDD的分區使用,協同劃分,分區一一對應。 寬依賴(ShuffleDependecy):多個子RDD的分區依賴一個父RDD的分區。寬依賴需要所有的父RDD分區數據可用。寬依賴會重新分區。               寬依賴操作會有一個可選參數(手動設置分區數)。               寬依賴對應的RDD實現是Shuffle
相關文章
相關標籤/搜索