SparkCore抽象之RDD

【彈性的】分佈式的數據集 彈性的:靈活的 Rdd的特性: 1、rdd是分佈式的:rdd裏面的數據實際上是分佈在集羣的不同節點上的。 注:數據是可分區的,分區的個數和hdfs上文件塊的個數有關,默認一個文件塊對應一個分區,一個分區對於一個rdd裏面的一部分文件。 2、rdd是可分區的:分區的個數是我們可以指定的,但是默認的情況下,一個hdfs上的文件塊就是一個分區,一個分區對應一個rdd裏面的一部分
相關文章
相關標籤/搜索