sql語句優化(一)

sql語句優化

在說到sql語句優化的時候,必須考慮我們爲啥要優化它,優化它給我們能帶來啥好處,是否是.那我們如今就先說說爲啥要優化它啦

html

  1.SQL語句是對數據庫進行操做的唯一途徑,對數據庫系統的性能起着決定性的做用。算法

  2.SQL語句消耗了70%至90%的數據庫資源。sql

  3.SQL語句獨立於程序設計邏輯,對SQL語句進行優化不會影響程序邏輯。數據庫

  4.SQL語句有不一樣的寫法,在性能上的差別很是大。編程

  5.SQL語句易學,但難精通。服務器

就由於前兩條我們也要考慮一下優化一下sql語句.優化sql語句的作好方式就是從自身作起,從我們寫第一句代碼的時候就要注意,如今我就一一道來。(自我約束sql語句)網絡

最好不要用自增屬性字段做爲主鍵與子表關聯。不便於系統的遷移和數據恢復。對外統計系統映射關係丟失。函數

表的設計具體注意的問題:
 post

    一、數據行的長度不要超過8020字節,若是超過這個長度的話在物理頁中這條數據會佔用兩行從而形成存儲碎片,下降查詢效率。性能

    二、可以用數字類型的字段儘可能選擇數字類型而不用字符串類型的(電話號碼),這會下降查詢和鏈接的性能,並會增長存儲開銷。這是由於引擎在處理查詢和鏈接回逐個比較字符串中每個字符,而對於數字型而言只須要比較一次就夠了。

    三、對於不可變字符類型char和可變字符類型varchar 都是8000字節,char查詢快,可是耗存儲空間,varchar查詢相對慢一些可是節省存儲空間。在設計字段的時候能夠靈活選擇,例如用戶名、密碼等 長度變化不大的字段能夠選擇CHAR,對於評論等長度變化大的字段能夠選擇VARCHAR。

    四、字段的長度在最大限度的知足可能的須要的前提下,應該儘量的設得短一些,這樣能夠提升查詢的效率,並且在創建索引的時候也能夠減小資源的消耗。

   www.2cto.com  

查詢的優化 
 

保證在實現功能的基礎上,儘可能減小對數據庫的訪問次數;經過搜索參數,儘可能減小對錶的訪問行數,最小化結果集,從而減輕網絡負擔;可以分開的操 做盡可能分開處理,提升每次的響應速度;在數據窗口使用SQL時,儘可能把使用的索引放在選擇的首列;算法的結構儘可能簡單;在查詢時,不要過多地使用通配符如 SELECT * FROM T1語句,要用到幾列就選擇幾列如:SELECT COL1,COL2 FROM T1;在可能的狀況下儘可能限制儘可能結果集行數如:SELECT TOP 300 COL1,COL2,COL3 FROM T1,由於某些狀況下用戶是不須要那麼多的數據的。  
 

具體要注意的:
 

1.應儘可能避免在 where 子句中對字段進行 null 值判斷,不然將致使引擎放棄使用索引而進行全表掃描,如:

select id from t where num is null

能夠在num上設置默認值0,確保表中num列沒有null值,而後這樣查詢:

select id from t where num=0
 

2.應儘可能避免在 where 子句中使用!=或<>操做符,不然將引擎放棄使用索引而進行全表掃描。優化器將沒法經過索引來肯定將要命中的行數,所以須要搜索該表的全部行。
 

3.應儘可能避免在 where 子句中使用 or 來鏈接條件,不然將致使引擎放棄使用索引而進行全表掃描,如:

select id from t where num=10 or num=20

能夠這樣查詢:

select id from t where num=10

union all

select id from t where num=20
 

4.in 和 not in 也要慎用,由於IN會使系統沒法使用索引,而只能直接搜索表中的數據。如:

select id from t where num in(1,2,3)

對於連續的數值,能用 between 就不要用 in 了:

select id from t where num between 1 and 3
 

5.儘可能避免在索引過的字符數據中,使用非打頭字母搜索。這也使得引擎沒法利用索引。 

見以下例子: 

SELECT * FROM T1 WHERE NAME LIKE ‘%L%’ 

SELECT * FROM T1 WHERE SUBSTING(NAME,2,1)=’L’ 

SELECT * FROM T1 WHERE NAME LIKE ‘L%’ 

即便NAME字段建有索引,前兩個查詢依然沒法利用索引完成加快操做,引擎不得不對全表全部數據逐條操做來完成任務。而第三個查詢可以使用索引來加快操做。
 

6.必要時強制查詢優化器使用某個索引,如在 where 子句中使用參數,也會致使全表掃描。由於SQL只有在運行時纔會解析局部變量,但優化程序不能將訪問計劃的選擇推遲到運行時;它必須在編譯時進行選擇。然 而,若是在編譯時創建訪問計劃,變量的值仍是未知的,於是沒法做爲索引選擇的輸入項。
以下面語句將進行全表掃描:

select id from t where num=@num

能夠改成強制查詢使用索引:

select id from t with(index(索引名)) where num=@num
 

7.應儘可能避免在 where 子句中對字段進行表達式操做,這將致使引擎放棄使用索引而進行全表掃描。如:  www.2cto.com  

SELECT * FROM T1 WHERE F1/2=100 

應改成: 

SELECT * FROM T1 WHERE F1=100*2

 

SELECT * FROM RECORD WHERE SUBSTRING(CARD_NO,1,4)=’5378’ 

應改成: 

SELECT * FROM RECORD WHERE CARD_NO LIKE ‘5378%’

 

SELECT member_number, first_name, last_name FROM members 

WHERE DATEDIFF(yy,datofbirth,GETDATE()) > 21 

應改成: 

SELECT member_number, first_name, last_name FROM members 

WHERE dateofbirth < DATEADD(yy,-21,GETDATE()) 

即:任何對列的操做都將致使表掃描,它包括數據庫函數、計算表達式等等,查詢時要儘量將操做移至等號右邊。
 

8.應儘可能避免在where子句中對字段進行函數操做,這將致使引擎放棄使用索引而進行全表掃描。如:

select id from t where substring(name,1,3)='abc'--name以abc開頭的id

select id from t where datediff(day,createdate,'2005-11-30')=0--‘2005-11-30’生成的id

應改成:

select id from t where name like 'abc%'

select id from t where createdate>='2005-11-30' and createdate<'2005-12-1'
 

9.不要在 where 子句中的「=」左邊進行函數、算術運算或其餘表達式運算,不然系統將可能沒法正確使用索引。
 

10.在使用索引字段做爲條件時,若是該索引是複合索引,那麼必須使用到該索引中的第一個字段做爲條件時才能保證系統使用該索引,不然該索引將不會被使用,而且應儘量的讓字段順序與索引順序相一致。
 

11.不少時候用 exists是一個好的選擇:

select num from a where num in(select num from b)

用下面的語句替換:

select num from a where exists(select 1 from b where num=a.num)

SELECT SUM(T1.C1)FROM T1 WHERE(   www.2cto.com  

(SELECT COUNT(*)FROM T2 WHERE T2.C2=T1.C2>0) 

SELECT SUM(T1.C1) FROM T1WHERE EXISTS( 

SELECT * FROM T2 WHERE T2.C2=T1.C2) 

二者產生相同的結果,可是後者的效率顯然要高於前者。由於後者不會產生大量鎖定的表掃描或是索引掃描。

若是你想校驗表裏是否存在某條紀錄,不要用count(*)那樣效率很低,並且浪費服務器資源。能夠用EXISTS代替。如: 

IF (SELECT COUNT(*) FROM table_name WHERE column_name = 'xxx') 

能夠寫成: 

IF EXISTS (SELECT * FROM table_name WHERE column_name = 'xxx')
 

常常須要寫一個T_SQL語句比較一個父結果集和子結果集,從而找到是否存在在父結果集中有而在子結果集中沒有的記錄,如: 

SELECT a.hdr_key FROM hdr_tbl a---- tbl a 表示tbl用別名a代替 

WHERE NOT EXISTS (SELECT * FROM dtl_tbl b WHERE a.hdr_key = b.hdr_key) 

SELECT a.hdr_key FROM hdr_tbl a 

LEFT JOIN dtl_tbl b ON a.hdr_key = b.hdr_key WHERE b.hdr_key IS NULL 

SELECT hdr_key FROM hdr_tbl 

WHERE hdr_key NOT IN (SELECT hdr_key FROM dtl_tbl)
 

三種寫法均可以獲得一樣正確的結果,可是效率依次下降。
 

20. 避免使用不兼容的數據類型。例如float和int、char和varchar、binary和varbinary是不兼容的。數據類型的不兼容可能使優化器沒法執行一些原本能夠進行的優化操做。例如: 

SELECT name FROM employee WHERE salary > 60000 

在這條語句中,如salary字段是money型的,則優化器很難對其進行優化,由於60000是個整型數。咱們應當在編程時將整型轉化成爲錢幣型,而不要等到運行時轉化。
 

21.充分利用鏈接條件,在某種狀況下,兩個表之間可能不僅一個的鏈接條件,這時在 WHERE 子句中將鏈接條件完整的寫上,有可能大大提升查詢速度。 

例: 

SELECT SUM(A.AMOUNT) FROM ACCOUNT A,CARD B WHERE A.CARD_NO = B.CARD_NO 

SELECT SUM(A.AMOUNT) FROM ACCOUNT A,CARD B WHERE A.CARD_NO = B.CARD_NO AND A.ACCOUNT_NO=B.ACCOUNT_NO 

第二句將比第一句執行快得多。
 

2二、使用視圖加速查詢 

把表的一個子集進行排序並建立視圖,有時能加速查詢。它有助於避免多重排序操做,並且在其餘方面還能簡化優化器的工做。例如:

SELECT cust.name,rcvbles.balance,……other columns 

FROM cust,rcvbles   www.2cto.com  

WHERE cust.customer_id = rcvlbes.customer_id 

AND rcvblls.balance>0 

AND cust.postcode>「98000」 

ORDER BY cust.name

若是這個查詢要被執行屢次而不止一次,能夠把全部未付款的客戶找出來放在一個視圖中,並按客戶的名字進行排序: 

CREATE VIEW DBO.V_CUST_RCVLBES 

AS 

SELECT cust.name,rcvbles.balance,……other columns 

FROM cust,rcvbles 

WHERE cust.customer_id = rcvlbes.customer_id 

AND rcvblls.balance>0 

ORDER BY cust.name 

而後如下面的方式在視圖中查詢: 

SELECT * FROM V_CUST_RCVLBES 

WHERE postcode>「98000」 

視圖中的行要比主表中的行少,並且物理順序就是所要求的順序,減小了磁盤I/O,因此查詢工做量能夠獲得大幅減小。
 

2三、能用DISTINCT的就不用GROUP BY 

SELECT OrderID FROM Details WHERE UnitPrice > 10 GROUP BY OrderID 

可改成: 

SELECT DISTINCT OrderID FROM Details WHERE UnitPrice > 10
 

24.能用UNION ALL就不要用UNION   www.2cto.com  

UNION ALL不執行SELECT DISTINCT函數,這樣就會減小不少沒必要要的資源 

25.儘可能不要用SELECT INTO語句。 

SELECT INOT 語句會致使表鎖定,阻止其餘用戶訪問該表。

網上收集,以供參考。

相關文章
相關標籤/搜索