數據庫訪問性能優化(三)

時間 2019-11-08

標籤數據庫訪問性能優化欄目 SQL 简体版

原文原文鏈接

3.4、使用存儲過程

大型數據庫通常都支持存儲過程，合理的利用存儲過程也能夠提升系統性能。如你有一個業務須要將A表的數據作一些加工而後更新到B表中，可是又不可能一條SQL完成，這時你須要以下3步操做：java

a：將A表數據所有取出到客戶端；程序員

b：計算出要更新的數據；sql

c：將計算結果更新到B表。數據庫

若是採用存儲過程你能夠將整個業務邏輯封裝在存儲過程裏，而後在客戶端直接調用存儲過程處理，這樣能夠減小網絡交互的成本。編程

固然，存儲過程也並非十全十美，存儲過程有如下缺點：緩存

a、不可移植性，每種數據庫的內部編程語法都不太相同，當你的系統須要兼容多種數據庫時最好不要用存儲過程。安全

b、學習成本高，DBA通常都擅長寫存儲過程，但並非每一個程序員都能寫好存儲過程，除非你的團隊有較多的開發人員熟悉寫存儲過程，不然後期系統維護會產生問題。服務器

c、業務邏輯多處存在，採用存儲過程後也就意味着你的系統有一些業務邏輯不是在應用程序裏處理，這種架構會增長一些系統維護和調試成本。網絡

d、存儲過程和經常使用應用程序語言不同，它支持的函數及語法有可能不能知足需求，有些邏輯就只能經過應用程序處理。架構

e、若是存儲過程當中有複雜運算的話，會增長一些數據庫服務端的處理成本，對於集中式數據庫可能會致使系統可擴展性問題。

f、爲了提升性能，數據庫會把存儲過程代碼編譯成中間運行代碼(相似於java的class文件)，因此更像靜態語言。當存儲過程引用的對像(表、視圖等等)結構改變後，存儲過程須要從新編譯才能生效，在24*7高併發應用場景，通常都是在線變動結構的，因此在變動的瞬間要同時編譯存儲過程，這可能會致使數據庫瞬間壓力上升引發故障(Oracle數據庫就存在這樣的問題)。

我的觀點：普通業務邏輯儘可能不要使用存儲過程，定時性的ETL任務或報表統計函數能夠根據團隊資源狀況採用存儲過程處理。

3.5、優化業務邏輯

要經過優化業務邏輯來提升性能是比較困難的，這須要程序員對所訪問的數據及業務流程很是清楚。

舉一個案例：

某移動公司推出優惠套參，活動對像爲VIP會員而且2010年1，2，3月平均話費20元以上的客戶。

那咱們的檢測邏輯爲：

select avg(money) as avg_money from bill where phone_no='13988888888' and date between '201001' and '201003';

select vip_flag from member where phone_no='13988888888';

if avg_money>20 and vip_flag=true then

begin

執行套參();

end;

若是咱們修改業務邏輯爲:

select avg(money) as avg_money from bill where phone_no='13988888888' and date between '201001' and '201003';

if avg_money>20 then

begin

select vip_flag from member where phone_no='13988888888';

if vip_flag=true then

begin

執行套參();

end;

經過這樣能夠減小一些判斷vip_flag的開銷，平均話費20元如下的用戶就不須要再檢測是否VIP了。

若是程序員分析業務，VIP會員比例爲1%，平均話費20元以上的用戶比例爲90%，那咱們改爲以下：

select vip_flag from member where phone_no='13988888888';

if vip_flag=true then

begin

select avg(money) as avg_money from bill where phone_no='13988888888' and date between '201001' and '201003';

if avg_money>20 then

begin

執行套參();

end;

這樣就只有1%的VIP會員纔會作檢測平均話費，最終大大減小了SQL的交互次數。

以上只是一個簡單的示例，實際的業務老是比這複雜得多，因此通常只是高級程序員更容易作出優化的邏輯，可是咱們須要有這樣一種成本優化的意識。

3.6、使用ResultSet遊標處理記錄

如今大部分Java框架都是經過jdbc從數據庫取出數據，而後裝載到一個list裏再處理，list裏多是業務Object，也多是hashmap。

因爲JVM內存通常都小於4G，因此不可能一次經過sql把大量數據裝載到list裏。爲了完成功能，不少程序員喜歡採用分頁的方法處理，如一次從數據庫取1000條記錄，經過屢次循環搞定，保證不會引發JVM Out of memory問題。

如下是實現此功能的代碼示例，t_employee表有10萬條記錄，設置分頁大小爲1000：

d1 = Calendar.getInstance().getTime();

vsql = "select count(*) cnt from t_employee";

pstmt = conn.prepareStatement(vsql);

ResultSet rs = pstmt.executeQuery();

Integer cnt = 0;

while (rs.next()) {

cnt = rs.getInt("cnt");

}

Integer lastid=0;

Integer pagesize=1000;

System.out.println("cnt:" + cnt);

String vsql = "select count(*) cnt from t_employee";

PreparedStatement pstmt = conn.prepareStatement(vsql);

ResultSet rs = pstmt.executeQuery();

Integer cnt = 0;

while (rs.next()) {

cnt = rs.getInt("cnt");

}

Integer lastid = 0;

Integer pagesize = 1000;

System.out.println("cnt:" + cnt);

for (int i = 0; i <= cnt / pagesize; i++) {

vsql = "select * from (select * from t_employee where id>? order by id) where rownum<=?";

pstmt = conn.prepareStatement(vsql);

pstmt.setFetchSize(1000);

pstmt.setInt(1, lastid);

pstmt.setInt(2, pagesize);

rs = pstmt.executeQuery();

int col_cnt = rs.getMetaData().getColumnCount();

Object o;

while (rs.next()) {

for (int j = 1; j <= col_cnt; j++) {

o = rs.getObject(j);

}

lastid = rs.getInt("id");

}

rs.close();

pstmt.close();

}

以上代碼實際執行時間爲6.516秒

不少持久層框架爲了儘可能讓程序員使用方便，封裝了jdbc經過statement執行數據返回到resultset的細節，致使程序員會想採用分頁的方式處理問題。實際上若是咱們採用jdbc原始的resultset遊標處理記錄，在resultset循環讀取的過程當中處理記錄，這樣就能夠一次從數據庫取出全部記錄。顯著提升性能。

這裏須要注意的是，採用resultset遊標處理記錄時，應該將遊標的打開方式設置爲FORWARD_READONLY模式(ResultSet.TYPE_FORWARD_ONLY,ResultSet.CONCUR_READ_ONLY)，不然會把結果緩存在JVM裏，形成JVM Out of memory問題。

代碼示例：

String vsql ="select * from t_employee";

PreparedStatement pstmt = conn.prepareStatement(vsql,ResultSet.TYPE_FORWARD_ONLY,ResultSet.CONCUR_READ_ONLY);

pstmt.setFetchSize(100);

ResultSet rs = pstmt.executeQuery(vsql);

int col_cnt = rs.getMetaData().getColumnCount();

Object o;

while (rs.next()) {

for (int j = 1; j <= col_cnt; j++) {

o = rs.getObject(j);

}

調整後的代碼實際執行時間爲3.156秒