spark task、job、partition之間的關係 寬窄依賴 spark任務調度

1.task、job、partition之間的關係 1.1一個task處理一個partition的數據 1.2partition的數量是根據一次任務需要處理的hdfs上的block的數量決定的 1.3一個action類算子對應一個job 1.4一個job處理一個或多個partition的數據,所以一個job對應多個partition 關係圖如下: 2.寬窄依賴 寬窄依賴實際上就是partition
相關文章
相關標籤/搜索