持久化級別
|
|
MEMORY_ONLY
|
以非序列化的Java對象的方式持久化在JVM內存中。若是內存沒法徹底存儲RDD全部的partition,那麼那些沒有持久化的partition就會在下一次須要使用它的時候,從新被計算
|
MEMORY_AND_DISK
|
同上,可是當某些partition沒法存儲在內存中時,會持久化到磁盤中。下次須要使用這些partition時,須要從磁盤上讀取
|
MEMORY_ONLY_SER
|
同MEMORY_ONLY,可是會使用Java序列化方式,將Java對象序列化後進行持久化。能夠減小內存開銷,可是須要進行反序列化,所以會加大CPU開銷
|
MEMORY_AND_DSK_SER
|
同MEMORY_AND_DSK。可是使用序列化方式持久化Java對象
|
DISK_ONLY
|
使用非序列化Java對象的方式持久化,徹底存儲到磁盤上
|
MEMORY_ONLY_2
MEMORY_AND_DISK_2
等等
|
若是是尾部加了2的持久化級別,表示會將持久化數據複用一份,保存到其餘節點,從而在數據丟失時,不須要再次計算,只須要使用備份數據便可
|