【零】SparkSQL特性與優化

SparkSQL特性之:代碼量少,可讀性高。 計算平均數的功能,左是hadoop寫MapReduce的代碼量,太繁瑣。右是用Spark Core RDD API寫,代碼量少但可讀性很差。mysql 一樣是計算平均數,用Spark SQL或者DataFrame,代碼可讀性比RDD好不少。sql SparkSQL特性之:統一訪問操做接口。 在SparkSQL中read/write不一樣格式的數據都是有
相關文章
相關標籤/搜索