【Spark】RDD的依賴關係

文章目錄 Spark Lineage(血統) 窄依賴 寬依賴 DAG 任務劃分 Spark Lineage(血統) Lineage利用內存加快數據加載,在其它的In-Memory類數據庫或Cache類系統中也有實現。Spark的主要區別在於它採用血統(Lineage)來時實現分佈式運算環境下的數據容錯性(節點失效、數據丟失)問題。RDD Lineage被稱爲RDD運算圖或RDD依賴關係圖,是RDD
相關文章
相關標籤/搜索