聊聊spark中的寬依賴和窄依賴

窄依賴相對簡單,先說說窄依賴,窄依賴是指,父RDD的每個分區到子RDD的分區,道路是非常窄的,窄到什麼程度,也就是說父RDD每個分區中的數據到子RDD分別只有一條道路可走,意思是說,父RDD的同一個分區裏的數據只能傳輸到子RDD的一個分區。這就是所謂的窄依賴。  同理,寬依賴就是父RDD每個分區到子RDD的分區,道路是非常寬的。聰明的人應該很快想到。沒錯,意思就是說父RDD每個分區中的數據,可能一
相關文章
相關標籤/搜索