Oracle SQL調優

在多數狀況下,Oracle使用索引t來更快地遍歷表,優化器主要根據定義的索引來提升性能。數據庫

可是,若是在SQL語句的where子句中寫的SQL代碼不合理,就會形成優化器刪去索引而使用全表掃描,通常就這種SQL語句就是所謂的劣質SQL語句。函數

在編寫SQL語句時咱們應清楚優化器根據何種原則來刪除索引,這有助於寫出高性能的SQL語句性能

 

1. IS NULL 與 IS NOT NULL

不能用null做索引,任何包含null值的列都將不會被包含在索引中。優化

即便索引有多列這樣的狀況下,只要這些列中有一列含有null,該列就會從索引中排除。spa

也就是說若是某列存在空值,即便對該列建索引也不會提升性能。code

任何在where子句中使用is null或is not null的語句優化器是不容許使用索引的blog

 

若是咱們必需要用 is null,又須要提供查詢效率 能夠用函數索引排序

實例以下索引

create table test_date (name varchar2(20),day date);
insert into test_date(name ,day) values ('lucy',null);
insert into test_date(name ,day) values ('jony',null);
insert into test_date(name,day) values ('james',sysdate);
select * from test_date;
--建立decode函數索引來代替 create index finx_day on test_date(decode(day,null,'N', 'Y'))

--使用decode判斷來代替is null判斷 select * from test_date a where decode(day,null,'N','Y') = 'N'

 

2. 聯接列

對於有聯接的列,即便最後的聯接值爲一個靜態值,優化器是不會使用索引的。開發

假定有一個職工表(employee),對於一個職工的姓和名分紅兩列存放(FIRST_NAME和LAST_NAME),

如今要查詢一個叫比爾.克林頓(Bill Cliton)的職工。

 

下面是一個採用聯接查詢的SQL語句,

select * from employs where 
first_name||’ ’||last_name ='Beill Cliton'

上面這條語句徹底能夠查詢出是否有Bill Cliton這個員工,可是這裏須要注意,系統優化器對基於last_name建立的索引沒有使用。

當採用下面這種SQL語句的編寫,Oracle系統就能夠採用基於last_name建立的索引。

Select * from employee where
first_name ='Beill' and last_name ='Cliton'

 

 

若是一個變量(name)中存放着Bill Cliton這個員工的姓名,對於這種狀況咱們又如何避免全程遍歷?

可使用一個函數,將變量name中的姓和名分開就能夠了,可是有一點須要注意,這個函數是不能做用在索引列上。‘

下面是SQL查詢腳本

select * from employee
where
first_name = SUBSTR('&&name',1,INSTR('&&name',' ')-1)
and
last_name = SUBSTR('&&name',INSTR('&&name’,' ')+1)

 

3. 帶通配符(%)的like語句

以以下SQL講解:

select * from employee where last_name like '%cliton%'

這裏因爲通配符(%)在搜尋詞首出現,因此Oracle系統不使用last_name的索引。

在不少狀況下可能沒法避免這種狀況,可是必定要心中有底,通配符如此使用會下降查詢速度。

然而當通配符出如今字符串其餘位置時,優化器就能利用索引。

在下面的查詢中索引獲得了使用:

select * from employee where last_name like 'c%'

讀者注意:項目真實開發中,若是常常性的模糊查詢,能夠採用solr或者elasticSearch或者直接Lucene也能夠

 

4. Order by語句

ORDER BY語句決定了Oracle如何將返回的查詢結果排序。

Order by語句對要排序的列沒有什麼特別的限制,也能夠將函數加入列中(聯接或者附加等)。

任何在Order by語句的非索引項或者有計算表達式都將下降查詢速度。

仔細檢查order by語句以找出非索引項或者表達式,它們會下降性能。

解決這個問題的辦法就是重寫order by語句以使用索引,也能夠爲所使用的列創建另一個索引,同時應絕對避免在order by子句中使用表達式。

5. NOT 的理想替代方案

咱們在查詢時常常在where子句使用一些邏輯表達式,如大於、小於、等於以及不等於等等,

也可使用and(與)、or(或)以及not(非)。NOT可用來對任何邏輯運算符號取反。

下面是一個NOT子句的例子:

... where not (status ='VALID')

若是要使用NOT,則應在取反的短語前面加上括號,並在短語前面加上NOT運算符。

NOT運算符包含在另一個邏輯運算符中,這就是不等於(<>;)運算符。

換句話說,即便不在查詢where子句中顯式地加入NOT詞,NOT仍在運算符中,

見下例:

... where status <>'INVALID'

再看下面這個例子:

select * from employee where salary<>3000;

對這個查詢,能夠改寫爲不使用NOT:

select * from employee where salary<3000 or salary>3000;

雖然這兩種查詢的結果同樣,可是第二種查詢方案會比第一種查詢方案更快些。第二種查詢容許Oracle對salary列使用索引,而第一種查詢則不能使用索引。

6. IN和EXISTS(下面有個重複的)

有時候會將一列和一系列值相比較。最簡單的辦法就是在where子句中使用子查詢。在where子句中可使用兩種格式的子查詢。

第一種格式是使用IN操做符:

... where column in(select * from ... where ...);

第二種格式是使用EXIST操做符:

... where exists (select 'X' from ...where ...);

我相信絕大多數人會使用第一種格式,由於它比較容易編寫,而實際上第二種格式要遠比第一種格式的效率高。

在Oracle中能夠幾乎將全部的IN操做符子查詢改寫爲使用EXISTS的子查詢。

第二種格式中,子查詢以‘select 'X'開始。運用EXISTS子句無論子查詢從表中抽取什麼數據它只查看where子句。

這樣優化器就沒必要遍歷整個表而僅根據索引就可完成工做(這裏假定在where語句中使用的列存在索引)。

相對於IN子句來講,EXISTS使用相連子查詢,構造起來要比IN子查詢困難一些。

經過使用EXIST,Oracle系統會首先檢查主查詢,而後運行子查詢直到它找到第一個匹配項,這就節省了時間。

Oracle系統在執行IN子查詢時,首先執行子查詢,並將得到的結果列表存放在在一個加了索引的臨時表中。

在執行子查詢以前,系統先將主查詢掛起,待子查詢執行完畢,存放在臨時表中之後再執行主查詢。這也就是使用EXISTS比使用IN一般查詢速度快的緣由。

同時應儘量使用NOT EXISTS來代替NOT IN,儘管兩者都使用了NOT(不能使用索引而下降速度),NOT EXISTS要比NOT IN查詢效率更高

 

七、Select子句中避免使用 「 * 」:

當你想在select子句中列出全部的column時,使用動態SQL列引用 ‘*' 是一個方便的方法。

不幸的是,這是一個很是低效的方法。

實際上,ORACLE在解析的過程當中,會將 '*' 依次轉換成全部的列名, 這個工做是經過查詢數據字典完成的, 這意味着將耗費更多的時間。

 

八、減小訪問數據庫的次數:

當執行每條SQL語句時,ORACLE在內部執行了許多工做:

解析SQL語句、估算索引的利用率、綁定變量、讀數據塊等等。

因而可知,減小訪問數據庫的次數,就能實際上減小ORACLE的工做量。

 

舉例:

題目——我要查找編號爲000一、0002學生的信息。

(低效)

select name,age,gender,address from t_student where id = '0001';
select name,age,gender,address from t_student where id = '0002';

(高效)

select a.name,a.age,a.gender,a.address,b.name,b.age,b.gender,b.address from t_student a,t_student b where a.id = '0001' and b.id = '0002';

 

九、使用Decode函數來減小處理時間:

使用DECODE函數能夠避免重複掃描相同記錄或重複鏈接相同的表。

舉例:

(低效)

select count(*), sum(banace) from table1 where dept_id = '0001' and name like 'anger%';
select count(*), sum(banace) from table1 where dept_id = '0002' and name like 'anger%';

 

(高效)

select count(decode(dept_id,'0001','XYZ',null)) count_01,count(decode(dept_id,'0002','XYZ',null)) count_02,
sum(decode(dept_id,'0001',dept_id,null)) sum_01,sum(decode(dept_id,'0002',dept_id,null)) sum_02
from table1
where name like 'anger%';

 

十、整合簡單,無關聯的數據庫訪問:

若是你有幾個簡單的數據庫查詢語句,你能夠把它們整合到一個查詢中(即便它們之間沒有關係)

舉例:

(低效)

select name from table1 where id = '0001';
select name from table2 where id = '0001';
select name from table3 where id = '0001';

 

(高效)

    select t1.name, t2.name, t3.name
    from table1 t1, table2 t2, table3 t3
    where t1.id(+) = '0001' and t2.id(+) = '0001' and t3.id(+) = '0001'

注:上面例子雖然高效,可是可讀性差,須要量情而定啊!

 

十一、刪除重複記錄:

最高效的刪除重複記錄方法 ( 由於使用了ROWID)

舉例:

delete from table1 t1
where t1.rowid > (select min(t2.rowid) from table1 t2 where t1.id = t2.id); 

 

十二、儘可能不要使用having子句,能夠考慮用where替換:

having只會在檢索出全部記錄以後纔對結果集進行過濾. 這個處理須要排序,總計等操做。

若是能經過where子句限制記錄的數目,那就能減小這方面的開銷。

 

1三、儘可能用表的別名:

當在SQL語句中鏈接多個表時,請使用表的別名並把別名前綴於每一個Column上。

這樣一來,就能夠減小解析的時間並減小那些由Column歧義引發的語法錯誤。

 

1四、用exists替換distinct:

當提交一個包含一對多表信息的查詢時,避免在select子句中使用distinct. 通常能夠考慮用exists替換

舉例:

(低效)

select distinct d.dept_no, d.dept_name from t_dept d, t_emp e where d.dept_no = e.dept_no;

(高效)

select d.dept_no, d.dept_name from t_dept d where exists (select 1 from t_emp where d.dept_no = e.dept_no);

exists使查詢更爲迅速,由於RDBMS核心模塊將在子查詢的條件一旦知足後,馬上返回結果. 

 

1五、用錶鏈接替換exists:

一般來講,採用錶鏈接的方式比exists更有效率。

舉例:

(低效)

select ename from emp e where exists (select 1 from dept where dept_no = e.dept_no and dept_cat = 'W');

(高效)

select ename from dept d, emp e where e.dept_no = d.dept_no and dept_cat = 'W'; 
相關文章
相關標籤/搜索