SparkSQL基礎

SparkSQL概述 SparkSQL是Spark的結構化數據處理模塊。特色以下:html 數據兼容:可從Hive表、外部數據庫(JDBC)、RDD、Parquet 文件、JSON 文件獲取數據; 組件擴展:SQL 語法解析器、分析器、優化器都可從新定義; 性能優化:內存列存儲、動態字節碼生成等優化技術,內存緩存數據; 多語言支持:Scala、Java、Python; Shark即Hive on
相關文章
相關標籤/搜索