Spark-SparkSQL數據源

Spark SQL的DataFrame接口支持多種數據源的操作。一個DataFrame可以進行RDDs方式的操作,也可以被註冊爲臨時表。把DataFrame註冊爲臨時表之後,就可以對該DataFrame執行SQL查詢。 Spark SQL的默認數據源爲Parquet格式。數據源爲Parquet文件時,Spark SQL可以方便的執行所有的操作。修改配置項spark.sql.sources.defa
相關文章
相關標籤/搜索