spark 緩存篇

spark數據集市RDD,這裏有個很重要的特性是RDD能夠選擇存儲起來讓另外的action操做,下面是各類緩存級別 [color=red]存儲方式[/color]:RDD的持久化或緩存選項是經過persist()或cache() [color=red]備註[/color]:1.RDD中的數據具備容錯性; 2.Shuffle操做是不須要指定cache()或者persist()的,會自動緩存rdd結果
相關文章
相關標籤/搜索