Spark獨到見解--2總技術棧見解之SparkCore

  1) RDD      1) 概念           RDD(Resilient Distributed Dateset),彈性分佈式數據集。       2) RDD的五大特性:           1.   RDD是由一系列的partition組成的。           2.   函數是作用在每一個partition(split)上的。           3.   RDD之間有一些列
相關文章
相關標籤/搜索