Spark進階

Spack進階 1.RDD的依賴關係 窄依賴(不產生shuffle) 父RDD和子RDD的patiition之間的關係是一對一,或者是多對一的關係 寬依賴(會有shuffle產生(類似中間結果,會影響計算效率)) 父RDD和子RDD的patition之間的關係是多對一. 寬依賴與窄依賴示意圖 2.stage 過程 spark會根據RDD之間的依賴關係,形成一個有向無環圖(DAG),DAG會提交給D
相關文章
相關標籤/搜索