spark RDD內容總結(適用於複雜的結構)

1.RDD Checkpointing和RDD cache/persist的區別?node 相同點:都須要手動調用方法來保存結果,爲了不前面所作的計算工做丟失面試 ,須要把RDD存到緩存或者checkpoint裏。json   存放目錄的區別緩存 是否自動清除?ide Checkpointing:本身設置目錄,目錄下面的文件咱們本身來決定是否刪除。大數據 cache/persist:只在程序運行時
相關文章
相關標籤/搜索