spark RDD 寬依賴與窄依賴

我的新博客地址:geekgao.cn RDD被設計爲可以記錄依賴關係,關係可以分爲兩類:窄依賴和寬依賴。 窄依賴:表示父親 RDD 的一個分區最多被子 RDD 一個分區所依賴。 寬依賴:表示父親 RDD 的一個分區可以被子 RDD 的多個子分區所依賴。 如下圖,左邊是窄依賴,右邊是寬依賴:
相關文章
相關標籤/搜索