SparkSQL

SparkSQL的前身是Shark,它拋棄原有Shark的代碼,汲取了Shark的一些優點,如內存列存儲(In-Memory Columnar Storage)、Hive兼容性等,重新開發了SparkSQL代碼;由於擺脫了對Hive的依賴性,SparkSQL無論在數據兼容、性能優化、組件擴展方面都得到了極大的方便。   1、Spark SQL性能 Spark SQL比hive快10-100倍,原因
相關文章
相關標籤/搜索