第142課:Spark面試經典系列之Cache和Checkpoint

Spark面試經典系列之Cache和Checkpoint 1、Cache 2、Checkpoint Cache:當我們想複用數據的時候一般都會進行Cache,在實際生產環境下複用RDD是最重要的性能優化手段之一(當然,如果能夠實現優良的RDD的複用,一定是建立在同時駕馭業務和技術的基礎之上的)。所謂的Cache其實是把數據經過第一次計算放在了BlockManager中。 Checkpoint:相當
相關文章
相關標籤/搜索