spark 大型項目實戰(二十七): --性能調優之在實際項目中調節並行度

並行度:其實就是指的是,Spark作業中,各個stage的task數量,也就代表了Spark作業的在各個階段(stage)的並行度。 如果不調節並行度,導致並行度過低,會怎麼樣? 假設,現在已經在spark-submit腳本里面,給我們的spark作業分配了足夠多的資源,比如50個executor,每個executor有10G內存,每個executor有3個cpu core。基本已經達到了集羣或者
相關文章
相關標籤/搜索