Spark的持久化

Spark的持久化級別 持久化級別 含義解釋 MEMORY_ONLY 使用未序列化的Java對象格式,將數據保存在內存中。如果內存不夠存放所有的數據,則數據可能就不會進行持久化。那麼下次對這個RDD執行算子操作時,那些沒有被持久化的數據,需要從源頭處重新計算一遍。這是默認的持久化策略,使用cache()方法時,實際就是使用的這種持久化策略。 MEMORY_AND_DISK 使用未序列化的Java對
相關文章
相關標籤/搜索