spark rdd 持久化

爲什麼80%的碼農都做不了架構師?>>>    Spark最重要的一個功能是它可以通過各種操作(operations)持久化(或者緩存)一個集合到內存中。當你持久化一個RDD 的時候,每一個節點都將參與計算的所有分區數據存儲到內存中,並且這些 數據可以被這個集合(以及這個集合衍生的其他 集合)的動作(action)重複利用。這個能力使後續的動作速度更快(通常快10倍以上)。對應迭代算法和快速的交互
相關文章
相關標籤/搜索