[Spark] - HashPartitioner & RangePartitioner 區別

Spark RDD的寬依賴中存在Shuffle過程,Spark的Shuffle過程同MapReduce,也依賴於Partitioner數據分區器,Partitioner類的代碼依賴結構主要如下所示: 主要是HashPartitioner和RangePartitioner兩個類,分別用於根據RDD中key的hashcode值進行分區以及根據範圍進行數據分區 一、Partitioner   Spark
相關文章
相關標籤/搜索