Spark學習之路 (十七)Spark分區

目錄 一、分區的概念 二、爲什麼要進行分區 三、Spark分區原則及方法 3.1 本地模式 3.2 YARN模式 四、分區器   正文 回到頂部 一、分區的概念   分區是RDD內部並行計算的一個計算單元,RDD的數據集在邏輯上被劃分爲多個分片,每一個分片稱爲分區,分區的格式決定了並行計算的粒度,而每個分區的數值計算都是在一個任務中進行的,因此任務的個數,也是由RDD(準確來說是作業最後一個RDD
相關文章
相關標籤/搜索