Spark控制算子

Spark控制算子 1. 控制算子分類 Spark中控制算子也是懶執行的,須要Action算子觸發才能執行,主要是爲了對數據進行緩存。緩存 cache(),persist(),checkpoint()算子app 其中【cache () = persist()=persist(StorageLevel.Memory_Only)】學習 以上算子均可以將RDD持久化,持久化的最小單位是partition
相關文章
相關標籤/搜索