RDD chache和checkoutPoint操作

1.  RDD的緩存 Spark速度非常快的原因之一,就是在不同操作中可以在內存中持久化或緩存個數據集。當持久化某個RDD後,每一個節點都將把計算的分片結果保存在內存中,並在對此RDD或衍生出的RDD進行的其他動作中重用。這使得後續的動作變得更加迅速。RDD相關的持久化和緩存,是Spark最重要的特徵之一。可以說,緩存是Spark構建迭代式算法和快速交互式查詢的關鍵。 1.2  RDD緩存方式 R
相關文章
相關標籤/搜索