Spark RDD概念學習系列之RDD的容錯機制(十七)

RDD的容錯機制         RDD實現了基於Lineage的容錯機制。RDD的轉換關係,構成了compute chain,可以把這個compute chain認爲是RDD之間演化的Lineage。在部分計算結果丟失時,只需要根據這個Lineage重算即可。 圖1中,假如RDD2所在的計算作業先計算的話,那麼計算完成後RDD1的結果就會被緩存起來。緩存起來的結果會被後續的計算使用。圖中的示意是
相關文章
相關標籤/搜索