Spark設計理念與基本架構

1.基本概念 Spark中的一些概念: RDD(resillient distributed dataset):彈性分佈式數據集。 Partition:數據分區。即一個RDD的數據可以劃分爲多少個分區。 NarrowDependency:窄依賴,即子RDD依賴於父RDD中固定的Partition。Narrow-Dependency分爲OneToOneDependency和RangeDependen
相關文章
相關標籤/搜索