Spark的Stage劃分

文章目錄 0x01 寬依賴和窄依賴 0x02 Stage 0x03 Stage的劃分 爲什麼遇到寬依賴需要切分Stage? 0x01 寬依賴和窄依賴 窄依賴: 父RDD的每個分區最多被子RDD的一個分區所用(一個父RDD分區對應一個子RDD分區),即父RDD的數據沒有被重新規劃分區(沒有被重新洗牌)。 寬依賴: 父RDD的每一個分區被子RDD的所有分區所用(一個父RDD分區的數據被分發到子RDD的
相關文章
相關標籤/搜索