Spark踩坑系列3--Spark使用總結與分享

背景 使用spark開發已有幾個月。相比於python/hive,scala/spark學習門檻較高。尤其記得剛開時,舉步維艱,進展十分緩慢。不過謝天謝地,這段苦澀(bi)的日子過去了。憶苦思甜,爲了避免項目組的其他同學走彎路,決定總結和梳理spark的使用經驗。 Spark基礎 基石RDD spark的核心是RDD(彈性分佈式數據集),一種通用的數據抽象,封裝了基礎的數據操作,如map,filt
相關文章
相關標籤/搜索