運行spark——7. RDD依賴、stage劃分、checkpoint

RDD依賴: 窄依賴:每一個父RDD的分區最多被子RDD的一個分區使用 寬依賴:每一個父RDD的分區被多個子RDD分區依賴   RDD依賴的作用: 血統(Lineage)會記錄RDD的元數據和轉換行爲, 以便恢復丟失的分區。   stage劃分: DAG(有向無環圖):RDD的一系列轉換組成了DAG 劃分stage的目的是生成任務,每個stage對應一種任務, 劃分stage的關鍵因素爲是否發生了
相關文章
相關標籤/搜索