關於Spark的知識點

1.寬依賴與窄依賴 針對不同的轉換函數,RDD之間的依賴關係分爲窄依賴(narrow dependency)和寬依賴(wide dependency,也成shuffle dependency)。 窄依賴: 窄依賴是指1個父RDD分區對應1個子RDD的分區,換句話說,一個父RDD的分區對應於一個子RDD的分區,或者多個父RDD的分區對應於一個子RDD的分區。所以窄依賴又可以分爲兩種情況: # 1個子
相關文章
相關標籤/搜索