Impala在處理結果集較大的查詢的優勢

時間 2021-01-18

原文原文鏈接

近期運營出報表，查詢的數據量爲15年的數據量，涉及的表及表中記錄數如下圖所示：剛開始的時候在MySQL中進行查詢彙總，選擇第一個數據量最小的表，發現MySQL 出現內存溢出，數據庫使用的是騰訊雲上的一臺CDB，內存大小爲24GB。後來將數據上傳到hdfs上使用impala（數據格式爲PARQUET）來查詢，發現效果要好於MySQL，我們的impala是一個3節點集羣，內

>>阅读原文<<