Spark Shell各類操做及詳細說明

並行化scala集合(Parallelize)   //加載數據1~10html val num=sc.parallelize(1 to 10)java //每一個數據項乘以2,注意 _*2記爲一個函數(fun)緩存 val doublenum = num.map(_*2)函數 //內存緩存數據ui doublenum.cache()spa //過濾數據,每一個數據項 % 3 爲0的數據爲結果集;
相關文章
相關標籤/搜索