Spark RDD核心詳解

本篇文章主要講解Spark 的編程模型以及做業執行調度流程。對於spark 來講,其核心是RDD(Resilient Distributed Dataset,彈性分佈式數據集),它是一種特殊的集合,支持多種來源,有容錯機制,能夠被緩存支持並行操做。下面來看看RDD這一抽象數據集的核心。javascript Spark編程模型 RDD的特徵 RDD總共有五個特徵,三個基本特徵,兩個可選特徵。 (1)
相關文章
相關標籤/搜索