ORACLE數據庫優化

時間 2019-12-15

標籤 oracle 數據庫優化欄目 Oracle 简体版

原文原文鏈接

　　開發都離不開數據，對數據庫的熟悉程度能夠爲咱們省去不少麻煩，咱們必須先了解一下數據庫。html

　　一個事務本質上有四個特色ACID：java

　　Atomicity原子性mysql

　　Consistency一致性sql

　　Isolation隔離性數據庫

　　Durability耐久性緩存

　　悲觀鎖和樂觀鎖的區別oracle

　　悲觀鎖（Pessimistic Lock）：函數

　　每次拿數據的時候都會擔憂會被別人修改（疑心重很悲觀），因此每次在拿數據的時候都會上鎖。確保本身使用的過程當中不會被別人訪問，本身使用完後再解鎖。期間須要訪問該數據的都會等待。性能

　　樂觀鎖（Optimistic Lock）：學習

　　每次拿數據的時候都徹底不擔憂會被別人修改（心態好很樂觀），因此每次在拿數據的時候都不會上鎖。可是在更新數據的時候去判斷該期間是否被別人修改過（使用版本號等機制），期間該數據能夠隨便被其餘人讀取。兩種鎖各有優缺點，不能單純的定義哪一個好於哪一個。樂觀鎖比較適合數據修改比較少，讀取比較頻繁的場景，即便出現了少許的衝突，這樣也省去了大量的鎖的開銷，故而提升了系統的吞吐量。可是若是常常發生衝突（寫數據比較多的狀況下），上層應用不不斷的retry，這樣反而下降了性能，對於這種狀況使用悲觀鎖就更合適

　　Left join、right join、inner join區別

　　left join :左鏈接，返回左表中全部的記錄以及右表中鏈接字段相等的記錄。

　　right join :右鏈接，返回右表中全部的記錄以及左表中鏈接字段相等的記錄。

　　inner join :內鏈接，又叫等值鏈接，只返回兩個表中鏈接字段相等的行。

　　full join :外鏈接，返回兩個表中的行：left join + right join

　　cross join :結果是笛卡爾積，就是第一個表的行數乘以第二個表的行數。

　　SQL優化

　　根據本身學習，使用的經驗，分享一些優化方法，但願您可以幫助到你們。

　　數據庫有個高速緩衝的概念，這個高速緩衝呢就是存放執行過的SQL語句，那數據庫在執行sql語句的時候要作不少工做，例如解析sql語句，估算索引利用率，綁定變量，讀取數據塊等等這些操做。假設高速緩衝裏已經存儲了執行過的sql語句，那就直接匹配執行了，少了步驟，天然就快了，可是通過測試會發現高速緩衝只對簡單的表起做用，多表的狀況下徹底沒有效果啊，例如在查詢單表的時候很是快，可是假設鏈接多個表，就會發現速度減了一倍不止。

最重要一點，數據庫的高速緩衝是全字符匹配的，什麼意思呢，看下面三個select

--No.1
SELECT * FROM tableA;
--No.2
SELECT * FROM tableA; 
--No.3 
SELECT * FROM tableA;

　　是否是以爲除了表sql都同樣?可是他看起來雖然同樣可是高速緩存是不認得，全字符匹配，索引在高速緩存裏會存儲三條不一樣的語句，ORACLE執行的是三條不一樣的sql。

　　1.SQL語句儘可能用大寫的

　　由於oracle老是先解析SQL語句，把小寫的字母轉換成大寫的再執行。

　　2.使用表的別名

　　當在SQL語句中鏈接多個表時, 儘可能使用表的別名並把別名前綴於每一個列上。這樣一來,就能夠減小解析的時間並減小那些由列歧義引發的語法錯誤。

　　3.選擇最有效率的表名順序(只在基於規則的優化器中有效)

　　ORACLE 的解析器按照從右到左的順序處理FROM子句中的表名，FROM子句中寫在最後的表(基礎表也稱爲驅動表,driving table)將被最早處理，在FROM子句中包含多個表的狀況下,必須選擇記錄條數最少的表做爲基礎表。若是有3個以上的錶鏈接查詢, 那就須要選擇交叉表(intersection table)做爲基礎表, 交叉表是指那個被其餘表所引用的表。

例以下面的兩個語句：

--No.1  tableA 100w條記錄  tableB 1w條記錄 執行速度 十秒級
SELECT COUNT(*) FROM tableA,tableB;

--No.2  執行速度百秒級甚至更高
SELECT COUNT(*) FROM tableB,tableA;

上面的結果確定是No.2比No.1效率更高

SELSETCOUNT(1) FROM tableA a,tableB b ,tableC c WHERE a.id=b.id AND a.id=c.id;

上面的sql中tableA 就稱爲交叉表，根據oracle對From子句從右向左的掃描方式，應該把交叉表放在最末尾，而後纔是最小表，因此上面的應該這樣寫

--tableA a 交叉表 
--tabelB b 100w
--tableC c 1w
SELECT COUNT(1) FROM tableB b ,tableC c ,tableA a WHERE a.id=b.id AND a.id=c.id;

這種寫法對大數據量會很是有用，你們謹記，也是很經常使用的。

　　4.Where子句後面的條件過濾有講究

　　ORACLE對where子句後面的條件過濾是自下向上，從右向左掃描的，因此和From子句同樣同樣的，把過濾條件排個序，按過濾數據的大小，天然就是能夠過濾掉最大數量記錄的條件必須寫在WHERE子句的末尾最下面，最右邊，依次類推，例如

--No.1 不可取 性能低下
SELECT * FROM tableA a WHERE 
a.id>500
AND a.lx = '2b'
AND a.id < 'SELCET COUNT(1) FROM tableA  WHERE id=a.id '

--No.2 性能高，能過濾最多數據的條件寫在最後【謹記】
SELECT * FROM tableA a WHERE 
a.id < 'SELECT COUNT(1) FROM tableA  WHERE id=a.id '
AND a.id>500
AND a.lx = '2b

　　5.在select的時候少用*

　　多敲敲鍵盤，寫上字段名吧，由於ORACLE的查詢器會把*轉換爲表的所有列名，這個會浪費時間的，因此在大表中少用。

　　6.使用rowid

　　經常使用於分頁，刪除查詢重複記錄，很是實用，給兩個例子:

--查找重複記錄
SELECT* FROM  tableA  a WHERE
 a.ROWID> (
 SELECT MIN(ROWID) FROM tableB b WHERE 
 a.column=b.column
 ) 

--刪除相同記錄
DELETE FROM  tableA  a WHERE
 a.ROWID> (
 SELECT MIN(ROWID) FROM tableB b WHERE 
 a.column=b.column
 ) 

--分頁 start=10 limit=10
--end 爲 start + limit
SELECT * FROM 
(
  SELECT A.*,Rownum rn FROM 
    (SELECT * FROM tableA ORDER BY id) A
  WHERE rownum <= 20
) b WHERE rn> 10  ORDER BY id DESC

/*解釋一下：

　　1.查詢要排列的表 A

　　2.查詢A表的Rownum 找出小於end的數據組成表B

　　3.查詢B表經過rownum找出大於start的數據完成簡單的說先根據end值過濾數據，而後在根據start過濾數據

是否是也感受很實用啊......

　　7.減小對數據庫表的查詢

　　ORACLE在內部執行了許多工做: 解析SQL語句, 估算索引的利用率, 綁定變量 , 讀數據塊等，因此少一次訪問就能提升更高的效率。

　　8.使用DECODE函數來減小處理時間

　　使用DECODE函數能夠避免重複掃描相同記錄或重複鏈接相同的表.

　　使用方法：http://www.javashuo.com/article/p-eeggjmle-bm.html

　　9.整合簡單,無關聯的數據庫訪問

　　若是你有幾個簡單的數據庫查詢語句,你能夠把它們整合到一個查詢中(即便它們之間沒有關係)

　　10.刪除重複記錄

　　最高效的刪除重複記錄方法 ( 由於使用了ROWID)例子：

DELETE  FROM  EMP E  WHERE  E.ROWID > (SELECT MIN(X.ROWID) 
FROM  EMP X  WHERE  X.EMP_NO = E.EMP_NO);

　　11.用TRUNCATE替代DELETE

　　當刪除表中的記錄時,在一般狀況下, 回滾段(rollback segments ) 用來存放能夠被恢復的信息. 若是你沒有COMMIT事務,ORACLE會將數據恢復到刪除以前的狀態(準確地說是恢復到執行刪除命令以前的情況) 而當運用TRUNCATE時, 回滾段再也不存聽任何可被恢復的信息.當命令運行後,數據不能被恢復.所以不多的資源被調用,執行時間也會很短. (譯者按: TRUNCATE只在刪除全表適用,TRUNCATE是DDL不是DML)

　　12.存儲過程當中多用commit(謹慎使用)

　　這樣程序的性能獲得提升,需求也會由於COMMIT所釋放的資源而減小

　　COMMIT所釋放的資源:

　　a. 回滾段上用於恢復數據的信息.

　　b. 被程序語句得到的鎖

　　c. redo log buffer 中的空間

　　d. ORACLE爲管理上述3種資源中的內部花費

　　13.不要用in，not in，用exists，not exists 來代替

--NO.1  IN的寫法  
SELECT * FROM TABLEA A WHERE 
A.ID IN 
( SELECT ID FORM TABLEB B WHERE B.ID>1)

--NO.2 exists 寫法
SELECT * FROM TABLEA A WHERE
EXISTS (
SELECT 1 FROM TABLEB B WHERE A.ID=B.ID AND B.ID>1)

　　14.用Where子句替換HAVING子句

　　避免使用HAVING子句, HAVING 只會在檢索出全部記錄以後纔對結果集進行過濾. 這個處理須要排序,總計等操做。若是能經過WHERE子句限制記錄的數目,那就能減小這方面的開銷. (非oracle中)on、where、having這三個均可以加條件的子句中，on是最早執行，where次之，having最後，由於on是先把不符合條件的記錄過濾後才進行統計，它就能夠減小中間運算要處理的數據，按理說應該速度是最快的，where也應該比having快點的，由於它過濾數據後才進行sum，在兩個表聯接時才用on的，因此在一個表的時候，就剩下where跟having比較了。在這單表查詢統計的狀況下，若是要過濾的條件沒有涉及到要計算字段，那它們的結果是同樣的，只是where可使用rushmore技術，而having就不能，在速度上後者要慢若是要涉及到計算的字段，就表示在沒計算以前，這個字段的值是不肯定的，根據上篇寫的工做流程，where的做用時間是在計算以前就完成的，而having就是在計算後才起做用的，因此在這種狀況下，二者的結果會不一樣。在多表聯接查詢時，on比where更早起做用。系統首先根據各個表之間的聯接條件，把多個表合成一個臨時表後，再由where進行過濾，而後再計算，計算完後再由having進行過濾。因而可知，要想過濾條件起到正確的做用，首先要明白這個條件應該在何時起做用，而後再決定放在那裏。

　　15.減小對錶的查詢

　　在含有子查詢的SQL語句中,要特別注意減小對錶的查詢.例子：

SELECT  TAB_NAME FROM TABLES
WHERE (TAB_NAME,DB_VER) = ( SELECT TAB_NAME,DB_VER FROM  TAB_COLUMNS  WHERE  VERSION = 604)

　　16.經過內部函數提升SQL效率

　　複雜的SQL每每犧牲了執行效率. 可以掌握上面的運用函數解決問題的方法在實際工做中是很是有意義的

　　17.識別’低效執行’的SQL語句

SELECT  EXECUTIONS , DISK_READS, BUFFER_GETS, 
ROUND((BUFFER_GETS-DISK_READS)/BUFFER_GETS,2) Hit_radio, 
ROUND(DISK_READS/EXECUTIONS,2) Reads_per_run, 
SQL_TEXT 
FROM  V$SQLAREA 
WHERE  EXECUTIONS>0 
AND  BUFFER_GETS > 0 
AND  (BUFFER_GETS-DISK_READS)/BUFFER_GETS < 0.8 
ORDER BY  4 DESC;

　　18.用索引提升效率

　　索引是表的一個概念部分,用來提升檢索數據的效率，ORACLE使用了一個複雜的自平衡B-tree結構. 一般,經過索引查詢數據比全表掃描要快. 當ORACLE找出執行查詢和Update語句的最佳路徑時, ORACLE優化器將使用索引. 一樣在聯結多個表時使用索引也能夠提升效率. 另外一個使用索引的好處是,它提供了主鍵(primary key)的惟一性驗

證.。那些LONG或LONG RAW數據類型, 你能夠索引幾乎全部的列. 一般, 在大型表中使用索引特別有效. 固然,你也會發現, 在掃描小表時,使用索引一樣能提升效率. 雖然使用索引能獲得查詢效率的提升,可是咱們也必須注意到它的代價. 索引須要空間來存儲,也須要按期維護, 每當有記錄在表中增減或索引列被修改時, 索引自己也會被修改. 這意味着每條記錄的INSERT , DELETE , UPDATE將爲此多付出4 , 5 次的磁盤I/O . 由於索引須要額外的存儲空間和處理,那些沒必要要的索引反而會使查詢反應時間變慢.。按期的重構索引是有必要的。

ALTER  INDEX <INDEXNAME> REBUILD <TABLESPACENAME>

　　19.用EXISTS替換DISTINCT

　　當提交一個包含一對多表信息(好比部門表和僱員表)的查詢時,避免在SELECT子句中使用DISTINCT. 通常能夠考慮用EXIST替換, EXISTS 使查詢更爲迅速,由於RDBMS核心模塊將在子查詢的條件一旦知足後,馬上返回結果. 例子

--(低效): 
SELECT  DISTINCT  DEPT_NO,DEPT_NAME  FROM  DEPT D , EMP E 
WHERE  D.DEPT_NO = E.DEPT_NO 
--(高效): 
SELECT  DEPT_NO,DEPT_NAME  FROM  DEPT D  WHERE  EXISTS ( SELECT ‘X’ 
FROM  EMP E  WHERE E.DEPT_NO = D.DEPT_NO);

　　20.在java代碼中儘可能少用鏈接符「＋」鏈接字符串！

　　21.一般避免在索引列上使用NOT

　　咱們要避免在索引列上使用NOT, NOT會產生在和在索引列上使用函數相同的影響. 當ORACLE」遇到」NOT,他就會中止使用索引轉而執行全表掃描。

　　22.避免在索引列上使用計算

　　WHERE子句中，若是索引列是函數的一部分．優化器將不使用索引而使用全表掃描。例如：

--低效： 
SELECT … FROM  DEPT  WHERE SAL * 12 > 25000; 
--高效: 
SELECT … FROM DEPT WHERE SAL > 25000/12;

　　23.用>=替代>

--高效: 
SELECT * FROM  EMP  WHERE  DEPTNO >=4 
--低效: 
SELECT * FROM EMP WHERE DEPTNO >3

　　二者的區別在於, 前者DBMS將直接跳到第一個DEPT等於4的記錄然後者將首先定位到DEPTNO=3的記錄而且向前掃描到第一個DEPT大於3的記錄. 　　

　　24.用UNION替換OR (適用於索引列)

　　一般狀況下, 用UNION替換WHERE子句中的OR將會起到較好的效果. 對索引列使用OR將形成全表掃描. 注意, 以上規則只針對多個索引列有效. 若是有column沒有被索引, 查詢效率可能會由於你沒有選擇OR而下降. 在下面的例子中, LOC_ID 和REGION上都建有索引。

--高效: 
SELECT LOC_ID , LOC_DESC , REGION 
FROM LOCATION 
WHERE LOC_ID = 10 
UNION 
SELECT LOC_ID , LOC_DESC , REGION 
FROM LOCATION 
WHERE REGION = 「MELBOURNE」 
--低效: 
SELECT LOC_ID , LOC_DESC , REGION 
FROM LOCATION 
WHERE LOC_ID = 10 OR REGION = 「MELBOURNE」

　　若是你堅持要用OR, 那就須要返回記錄最少的索引列寫在最前面（查看前面提到的 WHERE 條件查詢順序）

　　25.避免在索引列上使用IS NULL和IS NOT NULL

　　避免在索引中使用任何能夠爲空的列，ORACLE將沒法使用該索引．對於單列索引，若是列包含空值，索引中將不存在此記錄. 對於複合索引，若是每一個列都爲空，索引中一樣不存在此記錄.　若是至少有一個列不爲空，則記錄存在於索引中．舉例: 若是惟一性索引創建在表的A列和B列上, 而且表中存在一條記錄的A,B值爲(123,null) , ORACLE將不接受下一條具備相同A,B值（123,null）的記錄(插入). 然而若是全部的索引列都爲空，ORACLE將認爲整個鍵值爲空而空不等於空. 所以你能夠插入1000 條具備相同鍵值的記錄,固然它們都是空! 由於空值不存在於索引列中,因此WHERE子句中對索引列進行空值比較將使ORACLE停用該索引。

--低效: (索引失效) 
SELECT … FROM  DEPARTMENT  WHERE  DEPT_CODE IS NOT NULL; 
--高效: (索引有效) 
SELECT … FROM  DEPARTMENT  WHERE  DEPT_CODE >=0;

　　26.老是使用索引的第一個列

　　若是索引是創建在多個列上, 只有在它的第一個列(leading column)被where子句引用時,優化器纔會選擇使用該索引. 這也是一條簡單而重要的規則，當僅引用索引的第二個列時,優化器使用了全表掃描而忽略了索引。

　　27.用UNION-ALL 替換UNION ( 若是有可能的話)

　　當SQL 語句須要UNION兩個查詢結果集合時,這兩個結果集合會以UNION-ALL的方式被合併, 而後在輸出最終結果前進行排序. 若是用UNION ALL替代UNION, 這樣排序就不是必要了. 效率就會所以獲得提升. 須要注意的是，UNION ALL 將重複輸出兩個結果集合中相同記錄. 所以各位仍是要從業務需求分析使用UNION ALL的可行性. UNION 將對結果集合排序,這個操做會使用到SORT_AREA_SIZE這塊內存. 對於這塊內存的優化也是至關重要的。

　　下面的SQL能夠用來查詢排序的消耗量

--低效： 
SELECT  ACCT_NUM, BALANCE_AMT 
FROM  DEBIT_TRANSACTIONS 
WHERE TRAN_DATE = ’31-DEC-95′ 
UNION 
SELECT ACCT_NUM, BALANCE_AMT 
FROM DEBIT_TRANSACTIONS 
WHERE TRAN_DATE = ’31-DEC-95′ 
--高效: 
SELECT ACCT_NUM, BALANCE_AMT 
FROM DEBIT_TRANSACTIONS 
WHERE TRAN_DATE = ’31-DEC-95′ 
UNION ALL 
SELECT ACCT_NUM, BALANCE_AMT 
FROM DEBIT_TRANSACTIONS 
WHERE TRAN_DATE = ’31-DEC-95′

　　28.用WHERE替代ORDER BY

　　ORDER BY 子句只在兩種嚴格的條件下使用索引.

　　(a).ORDER BY中全部的列必須包含在相同的索引中並保持在索引中的排列順序.

　　(b).ORDER BY中全部的列必須定義爲非空.

　　WHERE子句使用的索引和ORDER BY子句中所使用的索引不能並列.

　　例如:

　　表DEPT包含如下3列:DEPT_CODE PK NOT NULL------DEPT_DESC NOT NULL------DEPT_TYPE NULL

--低效: (索引不被使用) 
SELECT DEPT_CODE FROM  DEPT  ORDER BY  DEPT_TYPE 
--高效: (使用索引) 
SELECT DEPT_CODE  FROM  DEPT  WHERE  DEPT_TYPE > 0

　　29.避免改變索引列的類型

　　當比較不一樣數據類型的數據時, ORACLE自動對列進行簡單的類型轉換.

--假設 EMPNO是一個數值類型的索引列.

SELECT …  FROM EMP  WHERE  EMPNO = ‘123′

--實際上,通過ORACLE類型轉換, 語句轉化爲:

SELECT …  FROM EMP  WHERE  EMPNO = TO_NUMBER(‘123′)

　　幸運的是,類型轉換沒有發生在索引列上,索引的用途沒有被改變.

--如今,假設EMP_TYPE是一個字符類型的索引列.

SELECT …  FROM EMP  WHERE EMP_TYPE = 123

--這個語句被ORACLE轉換爲:

SELECT …  FROM EMP  WHERETO_NUMBER(EMP_TYPE)=123

　　由於內部發生的類型轉換, 這個索引將不會被用到! 爲了不ORACLE對你的SQL進行隱式的類型轉換, 最好把類型轉換用顯式表現出來. 注意當字符和數值比較時, ORACLE會優先轉換數值類型到字符類型

　　30.須要小心的WHERE子句

　　某些SELECT 語句中的WHERE子句不使用索引. 這裏有一些例子.

　　在下面的例子裏,

　　　　(1) ‘!=’ 將不使用索引. 記住, 索引只能告訴你什麼存在於表中, 而不能告訴你什麼不存在於表中.

　　　　(2) ‘ | |’是字符鏈接函數. 就象其餘函數那樣, 停用了索引.

　　　　(3) ‘+’是數學函數. 就象其餘數學函數那樣, 停用了索引.

　　　　(4) 相同的索引列不能互相比較,這將會啓用全表掃描.

　　31.使用索引須要注意的兩點

　　a. 若是檢索數據量超過30%的表中記錄數.使用索引將沒有顯著的效率提升。

　　b. 在特定狀況下, 使用索引也許會比全表掃描慢, 但這是同一個數量級上的區別. 而一般狀況下,使用索引比全表掃描要快幾倍乃至幾千倍!

　　32.避免使用耗費資源的操做

　　帶有DISTINCT,UNION,MINUS,INTERSECT,ORDER BY的SQL語句會啓動SQL引擎

　　執行耗費資源的排序(SORT)功能. DISTINCT須要一次排序操做, 而其餘的至少須要執行兩次排序. 一般, 帶有UNION, MINUS , INTERSECT的SQL語句均可以用其餘方式重寫. 若是你的數據庫的SORT_AREA_SIZE調配得好, 使用UNION , MINUS, INTERSECT也是能夠考慮的, 畢竟它們的可讀性很強。

　　33.優化GROUP BY

　　提升GROUP BY 語句的效率, 能夠經過將不須要的記錄在GROUP BY 以前過濾掉.下面兩個查詢返回相同結果但第二個明顯就快了許多。

--低效: 
SELECT JOB , AVG(SAL) 
FROM EMP 
GROUP by JOB 
HAVING JOB = ‘PRESIDENT’ 
OR JOB = ‘MANAGER’ 
--高效: 
SELECT JOB , AVG(SAL) 
FROM EMP 
WHERE JOB = ‘PRESIDENT’ 
OR JOB = ‘MANAGER’ 
GROUP by JOB