spark sql 的介紹

        Spark SQL允許Spark執行用SQL, HiveQL或者Scala表示的關係查詢。這個模塊的核心是一個新類型的RDD-SchemaRDD。SchemaRDDs由行對象組成,行對象擁有一個模式(scheme)來描述行中每一列的數據類型。SchemaRDD與關係型數據庫中的表很相似。可以通過存在的RDD、一個Parquet文件、一個JSON數據庫或者對存儲在Apache Hiv
相關文章
相關標籤/搜索