6大數據實戰系列-sparkSql實戰

sparkSql兩個最重要的類SqlContext、DataFrame,DataFrame功能強大,可以與rdd互轉換、支持sql操做如sql().where.order.join.groupBy.limit等。 SparkSql的查詢響應性能是hive的幾何級倍數,而且SparkSql支持多種數據源操做包括hive、hdfs、rdd、json、mysql,本文先講解hive、hdfs、rdd、j
相關文章
相關標籤/搜索