Spark作業運行架構及常見問題

文章目錄 1.Spark作業運行架構 2.Spark有幾種運行模式 3.Spark的算子分類 4.RDD的五個特徵 5.RDD,DataFrame,DataSet的區別 6.map和flatmap的區別 7.spark中rdd.persist()和rdd.cache()的區別 8.spark內存不足怎麼處理? 9.mapreduce和spark計算框架效率區別的原因 10.Spark數據傾斜怎麼處
相關文章
相關標籤/搜索