大數據量查詢容易OOM?試試MySQL流式查詢

mark

1、前言

程序訪問 MySQL 數據庫時,當查詢出來的數據量特別大時,數據庫驅動把加載到的數據所有加載到內存裏,就有可能會致使內存溢出(OOM)。java

其實在 MySQL 數據庫中提供了流式查詢,容許把符合條件的數據分批一部分一部分地加載到內存中,能夠有效避免OOM;本文主要介紹如何使用流式查詢並對比普通查詢進行性能測試。mysql

 

2、JDBC實現流式查詢

使用JDBC的 PreparedStatement/StatementsetFetchSize 方法設置爲 Integer.MIN_VALUE 或者使用方法 Statement.enableStreamingResults() 能夠實現流式查詢,在執行 ResultSet.next() 方法時,會經過數據庫鏈接一條一條的返回,這樣也不會大量佔用客戶端的內存。git

public int execute(String sql, boolean isStreamQuery) throws SQLException {
    Connection conn = null;
    PreparedStatement stmt = null;
    ResultSet rs = null;
    int count = 0;
    try {
        //獲取數據庫鏈接
        conn = getConnection();
        if (isStreamQuery) {
            //設置流式查詢參數
            stmt = conn.prepareStatement(sql, ResultSet.TYPE_FORWARD_ONLY, ResultSet.CONCUR_READ_ONLY);
            stmt.setFetchSize(Integer.MIN_VALUE);
        } else {
            //普通查詢
            stmt = conn.prepareStatement(sql);
        }

        //執行查詢獲取結果
        rs = stmt.executeQuery();
        //遍歷結果
        while(rs.next()){
            System.out.println(rs.getString(1));
            count++;
        }
    } catch (SQLException e) {
        e.printStackTrace();
    } finally {
        close(stmt, rs, conn);
    }
    return count;
}

PS:上面的例子中經過參數 isStreamQuery 來切換流式查詢普通查詢,用於下面作測試對比。github

 

3、性能測試

建立了一張測試表 my_test 進行測試,總數據量爲 27w 條,分別使用如下4個測試用例進行測試:sql

  1. 大數據量普通查詢(27w條)
  2. 大數據量流式查詢(27w條)
  3. 小數據量普通查詢(10條)
  4. 小數據量流式查詢(10條)

 

3.1. 測試大數據量普通查詢

@Test
public void testCommonBigData() throws SQLException {
    String sql = "select * from my_test";
    testExecute(sql, false);
}

3.1.1. 查詢耗時

27w 數據量用時 38 秒
file數據庫

3.1.2. 內存佔用狀況

使用將近 1G 內存
性能

 

3.2. 測試大數據量流式查詢

@Test
public void testStreamBigData() throws SQLException {
    String sql = "select * from my_test";
    testExecute(sql, true);
}

3.2.1. 查詢耗時

27w 數據量用時 37 秒
測試

3.2.2. 內存佔用狀況

因爲是分批獲取,因此內存在30-270m波動
大數據

 

3.3. 測試小數據量普通查詢

@Test
public void testCommonSmallData() throws SQLException {
    String sql = "select * from my_test limit 100000, 10";
    testExecute(sql, false);
}

3.3.1. 查詢耗時

10 條數據量用時 1 秒
優化

 

3.4. 測試小數據量流式查詢

@Test
public void testStreamSmallData() throws SQLException {
    String sql = "select * from my_test limit 100000, 10";
    testExecute(sql, true);
}

3.4.1. 查詢耗時

10 條數據量用時 1 秒

 

4、總結

MySQL 流式查詢對於內存佔用方面的優化仍是比較明顯的,可是對於查詢速度的影響較小,主要用於解決大數據量查詢時的內存佔用多的場景。

DEMO地址https://github.com/zlt2000/mysql-stream-query

 

掃碼關注有驚喜!

file

相關文章
相關標籤/搜索