Spark-rdd的持久化

Spark 最重要的一個功能是它可以通 過 各種操作( operations )持久化(或者 緩 存)一個集合到內存中。當你持久化一個 RDD 的 時 候,每一個 節 點都將參與 計 算的所有分區數據存 儲 到內存中,並且 這 些 數據可以被 這 個集合(以及 這 個集合衍生的其他集合)的 動 作( action )重複利用。 這 個能力使後 續 的 動 作速度更快(通常快 10 倍以上)。 對應
相關文章
相關標籤/搜索