spark筆記之RDD的緩存

Spark速度非常快的原因之一,就是在不同操作中可以在內存中持久化或者緩存數據集。當持久化某個RDD後,每一個節點都將把計算分區結果保存在內存中,對此RDD或衍生出的RDD進行的其他動作中重用。這使得後續的動作變得更加迅速。RDD相關的持久化和緩存,是Spark最重要的特徵之一。可以說,緩存是Spark構建迭代式算法和快速交互式查詢的關鍵。 7.1RDD緩存方式 RDD通過persist方法或ca
相關文章
相關標籤/搜索