Spark Streaming:緩存與持久化機制

緩存與持久化機制 與RDD相似,Spark Streaming也能夠讓開發人員手動控制,將數據流中的數據持久化到內存中。對 DStream調用 persist()方法,就能夠讓Spark Streaming自動將該數據流中的全部產生的RDD,都持久化到內存中。若是要對一個DStream屢次執行操做,那麼,對DStream持久化是很是有用的。由於屢次操做,能夠共享使用內存中的一份緩存數據。 對於基於
相關文章
相關標籤/搜索