彈性分佈式數據集(RDD)的特性 以及應注意的問題

RDD的五大特性: 1.RDD是由一系列的partition組成的。 2.函數是作用在每一個partition(split)上的。 3.RDD之間有一系列的依賴關係。 4.分區器是作用在K,V格式的RDD上。 5.RDD提供一系列最佳的計算位置。 RDD理解圖: 注意: textFile方法底層封裝的是讀取MR讀取文件的方式,讀取文件之前先split,默認split大小是一個block大小。 RD
相關文章
相關標籤/搜索