spark學習系列——8 RDD持久化操做

一、概念緩存 RDD持久化 將數據經過操做持久化(或緩存)在內存中是Spark的重要能力之一。當你緩存了一個RDD,每一個節點都緩存了RDD的全部分區。這樣就能夠在內存中進行計算。這樣可使之後在RDD上的動做更快(一般能夠提升10倍)。 你能夠對但願緩存的RDD經過使用persist或cache方法進行標記。它經過動做操做第一次在RDD上進行計算後,它就會被緩存在節點上的內存中。Spark的緩存具
相關文章
相關標籤/搜索