DAG

什麼是DAG 在Spark裏每個操做生成一個RDD,RDD之間連一條邊,最後這些RDD和他們之間的邊組成一個有向無環圖,這個就是DAG。分佈式 Spark 爲何要構建DAG? Spark會根據寬依賴窄依賴來劃分具體的Stage,而依賴有2個做用:ide 用來解決數據容錯的高效性; 其二用來劃分stage。 RDD的依賴關係分爲兩種:窄依賴(Narrow Dependencies)與寬依賴(Wide
相關文章
相關標籤/搜索