Impala在處理結果集較大的查詢的優勢

    近期運營出報表,查詢的數據量爲15年的數據量,涉及的表及表中記錄數如下圖所示:          剛開始的時候在MySQL中進行查詢彙總,選擇第一個數據量最小的表,發現MySQL 出現內存溢出,數據庫使用的是騰訊雲上的一臺CDB,內存大小爲24GB。後來將數據上傳到hdfs上使用impala(數據格式爲PARQUET)來查詢,發現效果要好於MySQL,我們的impala是一個3節點集羣,內
相關文章
相關標籤/搜索