Spark中Task,Partition,RDD、節點數、Executor數、core數目的關係和Application,Driver,Job,Task,Stage理解

有部分圖和語句摘抄別的博客,有些理解是本身的 併發 梳理一下Spark中關於併發度涉及的幾個概念File,Block,Split,Task,Partition,RDD以及節點數、Executor數、core數目的關係。app   輸入可能以多個文件的形式存儲在HDFS上,每一個File都包含了不少塊,稱爲Block。 當Spark讀取這些文件做爲輸入時,會根據具體數據格式對應的InputForma
相關文章
相關標籤/搜索