spark學習筆記之一:RDD的五大特性

1.A list of partitions RDD是一個由多個partition(某個節點裏的某一片連續的數據)組成的的list;將數據加載爲RDD時,通常會遵循數據的本地性(通常一個hdfs裏的block會加載爲一個partition)。 2.A function for computing each split RDD的每一個partition上面都會有function,也就是函數應用,其做
相關文章
相關標籤/搜索