spark RDD 五大特性

一、有一個分片列表,可以被切分,就是和Hadoop同樣,能被切分的數據才能並行操做。         二、有一個函數計算每個分片,compute函數。         三、對其餘的RDD的依賴列表,依賴又分爲寬依賴和窄依賴,但不是全部的RDD都有依賴。         四、可選,key-value型的RDD是根據哈希來分區的,相似於mapreduce的Paritioner接口,控制key分配到哪一
相關文章
相關標籤/搜索