Spark入門之六:SparkSQL實戰

介紹 SparkSQL引入了一種新的RDD——SchemaRDD,SchemaRDD由行對象(Row)以及描述行對象中每列數據類型的Schema組成;SchemaRDD很象傳統數據庫中的表。SchemaRDD能夠經過RDD、Parquet文件、JSON文件、或者經過使用hiveql查詢hive數據來創建。SchemaRDD除了能夠和RDD同樣操做外,還能夠經過registerTempTable註冊
相關文章
相關標籤/搜索