SQL語句優化技術分析

1、操做符優化程序員

一、IN 操做符數據庫

用IN寫出來的SQL的優勢是比較容易寫及清晰易懂,這比較適合現代軟件開發的風格。可是用IN的SQL性能老是比較低的,從Oracle執行的步驟來分析用IN的SQL與不用IN的SQL有如下區別:服務器

ORACLE試圖將其轉換成多個表的鏈接,若是轉換不成功則先執行IN裏面的子查詢,再查詢外層的表記錄,若是轉換成功則直接採用多個表的鏈接方式查詢。因而可知用IN的SQL至少多了一個轉換的過程。通常的SQL均可以轉換成功,但對於含有分組統計等方面的SQL就不能轉換了。函數

推薦方案:在業務密集的SQL當中儘可能不採用IN操做符,用EXISTS 方案代替。性能

二、NOT IN操做符大數據

此操做是強列不推薦使用的,由於它不能應用表的索引。優化

推薦方案:用NOT EXISTS 方案代替spa

三、IS NULL 或IS NOT NULL操做(判斷字段是否爲空)orm

判斷字段是否爲空通常是不會應用索引的,由於索引是不索引空值的。對象

推薦方案:用其它相同功能的操做運算代替,如:a is not null 改成 a>0 或a>’’等。不容許字段爲空,而用一個缺省值代替空值,如申請中狀態字段不容許爲空,缺省爲申請。

四、> 及 < 操做符(大於或小於操做符)

大於或小於操做符通常狀況下是不用調整的,由於它有索引就會採用索引查找,但有的狀況下能夠對它進行優化,如一個表有100萬記錄,一個數值型字段A,30萬記錄的A=0,30萬記錄的A=1,39萬記錄的A=2,1萬記錄的A=3。那麼執行A>2與A>=3的效果就有很大的區別了,由於A>2時ORACLE會先找出爲2的記錄索引再進行比較,而A>=3時ORACLE則直接找到=3的記錄索引。

五、LIKE操做符

LIKE操做符能夠應用通配符查詢,裏面的通配符組合可能達到幾乎是任意的查詢,可是若是用得很差則會產生性能上的問題,如LIKE ‘%5400%’ 這種查詢不會引用索引,而LIKE ‘X5400%’則會引用範圍索引。

一個實際例子:用YW_YHJBQK表中營業編號後面的戶標識號可來查詢營業編號 YY_BH LIKE ‘%5400%’ 這個條件會產生全表掃描,若是改爲YY_BH LIKE ’X5400%’ OR YY_BH LIKE ’B5400%’ 則會利用YY_BH的索引進行兩個範圍的查詢,性能確定大大提升。

例:like '%AAA%' 這樣的左右模糊查詢不能用上索引,可使用 where instr(column_name,'AAA')> 0代替,性能提高不少

六、UNION操做符

UNION在進行表連接後會篩選掉重複的記錄,因此在表連接後會對所產生的結果集進行排序運算,刪除重複的記錄再返回結果。實際大部分應用中是不會產生重複的記錄,最多見的是過程表與歷史表UNION。如:
select * from gc_dfys
union
select * from ls_jg_dfys
這個SQL在運行時先取出兩個表的結果,再用排序空間進行排序刪除重複的記錄,最後返回結果集,若是表數據量大的話可能會致使用磁盤進行排序。

推薦方案:採用UNION ALL操做符替代UNION,由於UNION ALL操做只是簡單的將兩個結果合併後就返回。

select * from gc_dfys
union all
select * from ls_jg_dfys

2、SQL書寫的影響

一、同一功能同一性能不一樣寫法SQL的影響。

如一個SQL在A程序員寫的爲  Select * from zl_yhjbqk

B程序員寫的爲 Select * from dlyx.zl_yhjbqk(帶表全部者的前綴)

C程序員寫的爲 Select * from DLYX.ZLYHJBQK(大寫表名)

D程序員寫的爲 Select *  from DLYX.ZLYHJBQK(中間多了空格)

以上四個SQL在ORACLE分析整理以後產生的結果及執行的時間是同樣的,可是從ORACLE共享內存SGA的原理,能夠得出ORACLE對每一個SQL 都會對其進行一次分析,而且佔用共享內存,若是將SQL的字符串及格式寫得徹底相同,則ORACLE只會分析一次,共享內存也只會留下一次的分析結果,這不只能夠減小分析SQL的時間,並且能夠減小共享內存重複的信息,ORACLE也能夠準確統計SQL的執行頻率。

二、WHERE後面的條件順序影響

WHERE子句後面的條件順序對大數據量表的查詢會產生直接的影響。如:
Select * from zl_yhjbqk where dy_dj = '1KV如下' and xh_bz=1
Select * from zl_yhjbqk where xh_bz=1 and dy_dj = '1KV如下'
以上兩個SQL中dy_dj(電壓等級)及xh_bz(銷戶標誌)兩個字段都沒進行索引,因此執行的時候都是全表掃描,第一條SQL的dy_dj = '1KV如下'條件在記錄集內比率爲99%,而xh_bz=1的比率只爲0.5%,在進行第一條SQL的時候99%條記錄都進行dy_dj及xh_bz的比較,而在進行第二條SQL的時候0.5%條記錄都進行dy_dj及xh_bz的比較,以此能夠得出第二條SQL的CPU佔用率明顯比第一條低。

三、查詢表順序的影響

在FROM後面的表中的列表順序會對SQL執行性能影響,在沒有索引及ORACLE沒有對錶進行統計分析的狀況下,ORACLE會按表出現的順序進行連接,因而可知表的順序不對時會產生十分耗服物器資源的數據交叉。(注:若是對錶進行了統計分析,ORACLE會自動先進小表的連接,再進行大表的連接)

3、SQL語句索引的利用

一、操做符優化(同上)

二、對條件字段的一些優化

採用函數處理的字段不能利用索引,如:

substr(hbs_bh,1,4)=’5400’,優化處理:hbs_bh like ‘5400%’

trunc(sk_rq)=trunc(sysdate), 優化處理:sk_rq>=trunc(sysdate) and sk_rq<trunc(sysdate+1)

進行了顯式或隱式的運算的字段不能進行索引,如:ss_df+20>50,優化處理:ss_df>30

‘X’ || hbs_bh>’X5400021452’,優化處理:hbs_bh>’5400021542’

sk_rq+5=sysdate,優化處理:sk_rq=sysdate-5

hbs_bh=5401002554,優化處理:hbs_bh=’ 5401002554’,注:此條件對hbs_bh 進行隱式的to_number轉換,由於hbs_bh字段是字符型。

條件內包括了多個本表的字段運算時不能進行索引,如:ys_df>cx_df,沒法進行優化
qc_bh || kh_bh=’5400250000’,優化處理:qc_bh=’5400’ and kh_bh=’250000’

4、其餘

ORACLE的提示功能是比較強的功能,也是比較複雜的應用,而且提示只是給ORACLE執行的一個建議,有時若是出於成本方面的考慮ORACLE也可能不會按提示進行。根據實踐應用,通常不建議開發人員應用ORACLE提示,由於各個數據庫及服務器性能狀況不同,極可能一個地方性能提高了,但另外一個地方卻降低了,ORACLE在SQL執行分析方面已經比較成熟,若是分析執行的路徑不對首先應在數據庫結構(主要是索引)、服務器當前性能(共享內存、磁盤文件碎片)、數據庫對象(表、索引)統計信息是否正確這幾方面分析。

相關文章
相關標籤/搜索