oracle中的SQL優化

時間 2019-12-06

標籤 oracle sql 優化欄目 Oracle 简体版

原文原文鏈接

一.SQL語言的使用
1.IN 操做符
    用IN寫出來的SQL的優勢是比較容易寫及清晰易懂，這比較適合現代軟件開發的風格。
    可是用IN的SQL性能老是比較低的，從ORACLE執行的步驟來分析用IN的SQL與不用IN的SQL有如下區別：
    ORACLE試圖將其轉換成多個表的鏈接，若是轉換不成功則先執行IN裏面的子查詢，再查詢外層的表記錄，若是轉換成功則直接採用多個表的鏈接方式查詢。
    因而可知用IN的SQL至少多了一個轉換的過程。通常的SQL均可以轉換成功，但對於含有分組統計等方面的SQL就不能轉換了。程序員

推薦方案：在業務密集的SQL當中儘可能不採用IN操做符

2.NOT IN操做符
此操做是強列推薦不使用的，由於它不能應用表的索引。數據庫

推薦方案：用NOT EXISTS 或（外鏈接+判斷爲空）方案代替

3.<> 操做符（不等於）
不等於操做符是永遠不會用到索引的，所以對它的處理只會產生全表掃描。服務器

    推薦方案：用其它相同功能的操做運算代替，如
    a<>0 改成 a>0 or a<0
    a<>'' 改成 a>''

4.IS NULL 或IS NOT NULL操做（判斷字段是否爲空）
    判斷字段是否爲空通常是不會應用索引的，由於B樹索引是不索引空值的。函數

    推薦方案：
    用其它相同功能的操做運算代替，如
    a is not null 改成 a>0 或a>''等。
    不容許字段爲空，而用一個缺省值代替空值，如業擴申請中狀態字段不容許爲空，缺省爲申請。
    創建位圖索引（有分區的表不能建，位圖索引比較難控制，如字段值太多索引會使性能降低，多人更新操做會增長數據塊鎖的現象）

5.>及<操做符(大於或小於操做符)
    大於或小於操做符通常狀況下是不用調整的，由於它有索引就會採用索引查找，但有的狀況下能夠對它進行優化，
    如一個表有100萬記錄，一個數值型字段A，30萬記錄的A=0，30萬記錄的A=1，39萬記錄的A=2，1萬記錄的A=3。
    那麼執行A>2與A>=3的效果就有很大的區別了，由於A>2時ORACLE會先找出爲2的記錄索引再進行比較，而A>=3時ORACLE則直接找到=3的記錄索引。

6.LIKE操做符
    LIKE操做符能夠應用通配符查詢，裏面的通配符組合可能達到幾乎是任意的查詢，可是若是用得很差則會產生性能上的問題，
    如LIKE '%5400%' 這種查詢不會引用索引，而LIKE 'X5400%'則會引用範圍索引。
    一個實際例子：
    用YW_YHJBQK表中營業編號後面的戶標識號可來查詢營業編號 YY_BH LIKE '%5400%' 這個條件會產生全表掃描，
    若是改爲YY_BH LIKE 'X5400%' OR YY_BH LIKE 'B5400%' 則會利用YY_BH的索引進行兩個範圍的查詢，性能確定大大提升。

7.UNION操做符
    UNION在進行表連接後會篩選掉重複的記錄，因此在表連接後會對所產生的結果集進行排序運算，刪除重複的記錄再返回結果。
    實際大部分應用中是不會產生重複的記錄，最多見的是過程表與歷史表UNION。如：
    select * from gc_dfys
    union
    select * from ls_jg_dfys
    這個SQL在運行時先取出兩個表的結果，再用排序空間進行排序刪除重複的記錄，最後返回結果集，若是表數據量大的話可能會致使用磁盤進行排序。
    推薦方案：採用UNION ALL操做符替代UNION，由於UNION ALL操做只是簡單的將兩個結果合併後就返回。
    select * from gc_dfys
    union all
    select * from ls_jg_dfys

8.大量數據時不用upper()和lower性能

二.SQL書寫的影響大數據

1.同一功能同一性能不一樣寫法SQL的影響(使用ORACLE的共享SQL程序)
    如一個SQL在A程序員寫的爲:Select * from zl_yhjbqk
    B程序員寫的爲:Select * from dlyx.zl_yhjbqk（帶表全部者的前綴）
    C程序員寫的爲:Select * from DLYX.ZLYHJBQK（大寫表名）
    D程序員寫的爲:Select * from DLYX.ZLYHJBQK（中間多了空格）
    以上四個SQL在ORACLE分析整理以後產生的結果及執行的時間是同樣的，可是從ORACLE共享內存SGA的原理，能夠得出ORACLE對每一個SQL 都會對其進行一次分析，而且佔用共享內存，若是將SQL的字符串及格式寫得徹底相同則ORACLE只會分析一次，共享內存也只會留下一次的分析結果，這不只能夠減小分析SQL的時間，並且能夠減小共享內存重複的信息，ORACLE也能夠準確統計SQL的執行頻率。優化

2.WHERE後面的條件順序影響

    a.WHERE子句後面的條件順序對大數據量表的查詢會產生直接的影響，如
    Select * from zl_yhjbqk where dy_dj = '1KV如下' and xh_bz=1
    Select * from zl_yhjbqk where xh_bz=1 and dy_dj = '1KV如下'
    以上兩個SQL中dy_dj（電壓等級）及xh_bz（銷戶標誌）兩個字段都沒進行索引，因此執行的時候都是全表掃描，
    第一條SQL的dy_dj = '1KV如下'條件在記錄集內比率爲99%，而xh_bz=1的比率只爲0.5%，在進行第一條SQL的時候99%條記錄都進行dy_dj及xh_bz的比較，
    而在進行第二條SQL的時候0.5%條記錄都進行dy_dj及xh_bz的比較，以此能夠得出第二條SQL的CPU佔用率明顯比第一條低

    b.查詢表順序的影響
    在FROM後面的表中的列表順序會對SQL執行性能影響，在沒有索引及ORACLE沒有對錶進行統計分析的狀況下ORACLE會按表出現的順序進行連接，由此由於表的順序不對會產生十分耗服務器資源的數據交叉。（注：若是對錶進行了統計分析，ORACLE會自動先進小表的連接，再進行大表的連接）對象

三.SQL語句索引的利用排序

    1.對操做符的優化（見上節）
    2.對條件字段的一些優化:
    a.採用函數處理的字段不能利用索引，如：
     substr(hbs_bh,1,4)='5400'，優化處理:hbs_bh like '5400%'
     trunc(sk_rq)=trunc(sysdate)，優化處理:sk_rq>=trunc(sysdate) and sk_rq<trunc(sysdate+1)
    b.進行了顯式或隱式的運算的字段不能進行索引，如：
     ss_df+20>50，優化處理：ss_df>30
     'X'||hbs_bh>'X5400021452'，優化處理：hbs_bh>'5400021542'
     sk_rq+5=sysdate，優化處理：sk_rq=sysdate-5
     hbs_bh=5401002554，優化處理：hbs_bh='5401002554'，注：此條件對hbs_bh 進行隱式的to_number轉換，由於hbs_bh字段是字符型。
    c.條件內包括了多個本表的字段運算時不能進行索引，如：
     ys_df>cx_df，沒法進行優化
     qc_bh||kh_bh='5400250000'，優化處理：qc_bh='5400' and kh_bh='250000'
四.應用ORACLE的HINT（提示）處理:提示處理是在ORACLE產生的SQL分析執行路徑不滿意的狀況下要用到的。它能夠對SQL進行如下方面的提示
    1.目標方面的提示：
     COST（按成本優化）
     RULE（按規則優化）
     CHOOSE（缺省）（ORACLE自動選擇成本或規則進行優化）
     ALL_ROWS（全部的行儘快返回）
     FIRST_ROWS（第一行數據儘快返回）
    2.執行方法的提示：
     USE_NL（使用NESTED LOOPS方式聯合）
     USE_MERGE（使用MERGE JOIN方式聯合）
     USE_HASH（使用HASH JOIN方式聯合）
    3.索引提示：
INDEX（TABLE INDEX）（使用提示的表索引進行查詢）
    4.其它高級提示（如並行處理等等）
    ORACLE的提示功能是比較強的功能，也是比較複雜的應用，而且提示只是給ORACLE執行的一個建議，有時若是出於成本方面的考慮ORACLE也可能不會按提示進行。
    根據實踐應用，通常不建議開發人員應用ORACLE提示，由於各個數據庫及服務器性能狀況不同，極可能一個地方性能提高了，但另外一個地方卻降低了，
    ORACLE在SQL執行分析方面已經比較成熟，
    若是分析執行的路徑不對首先應在數據庫結構（主要是索引）、服務器當前性能（共享內存、磁盤文件碎片）、數據庫對象（表、索引）統計信息是否正確這幾方面分析索引