Impala,Hive,SparkSQL數據清洗後對後續查詢的影響比較

Impala,Hive,SparkSQL數據清洗後對後續查詢的影響比較 SparkSQL和Impala執行的時間會比較快,Hive明顯慢不少,可是這裏比較不是執行單次查詢效率,而是三種方式清洗後數據產生結果小文件對後續使用的影響。 首先準備好2000萬表記錄,做爲外部表建好。 而後把出生日期星座劃分,結果生成表格存放。三種方式存放3個不一樣表格。 #########################
相關文章
相關標籤/搜索