【零】SparkSQL特性與優化

SparkSQL特性之:代碼量少,可讀性高。 計算平均數的功能,左是hadoop寫MapReduce的代碼量,太繁瑣。右是用Spark Core RDD API寫,代碼量少但可讀性不好。 同樣是計算平均數,用Spark SQL或者DataFrame,代碼可讀性比RDD好很多。 SparkSQL特性之:統一訪問操作接口。 在SparkSQL中read/write不同格式的數據都是有統一個接口。支持(
相關文章
相關標籤/搜索