數據庫性能優化之SQL語句優化3

時間 2019-11-21

標籤數據庫性能優化 sql 語句欄目 SQL 简体版

原文原文鏈接

舒適提示：本篇內容均來自網上，本人只作了稍微處理，未進行細緻研究，僅當作之後不備之需，如若你喜歡可盡情轉走。 sql

查詢速度慢的緣由： 數據庫

一、沒有索引或者沒有用到索引(這是查詢慢最多見的問題，是程序設計的缺陷)
二、I/O吞吐量小，造成了瓶頸效應。
三、沒有建立計算列致使查詢不優化。
四、內存不足
五、網絡速度慢
六、查詢出的數據量過大（能夠採用屢次查詢，其餘的方法下降數據量）
七、鎖或者死鎖(這也是查詢慢最多見的問題，是程序設計的缺陷)
八、sp_lock,sp_who,活動的用戶查看,緣由是讀寫競爭資源。
九、返回了沒必要要的行和列
十、查詢語句很差，沒有優化編程

經過以下方法來優化查詢：
一、把數據、日誌、索引放到不一樣的I/O設備上，增長讀取速度，之前能夠將Tempdb應放在RAID0上，SQL2000不在支持。數據量（尺寸）越大，提升I/O越重要.
二、縱向、橫向分割表，減小表的尺寸(sp_spaceuse)
三、升級硬件
四、根據查詢條件,創建索引,優化索引、優化訪問方式，限制結果集的數據量。注意填充因子要適當（最好是使用默認值0）。索引應該儘可能小，使用字節數小的列建索引好（參照索引的建立）,不要對有限的幾個值的字段建單一索引如性別字段
五、提升網速;
六、擴大服務器的內存,Windows   2000和SQL   server   2000能支持4-8G的內存。配置虛擬內存：虛擬內存大小應基於計算機上併發運行的服務進行配置。運行   Microsoft   SQL   Server?   2000   時，可考慮將虛擬內存大小設置爲計算機中安裝的物理內存的   1.5   倍。若是另外安裝了全文檢索功能，並打算運行   Microsoft   搜索服務以便執行全文索引和查詢，可考慮：將虛擬內存大小配置爲至少是計算機中安裝的物理內存的   3   倍。將   SQL   Server   max   server   memory   服務器配置選項配置爲物理內存的   1.5   倍（虛擬內存大小設置的一半）。
七、增長服務器CPU個數;可是必須明白並行處理串行處理更須要資源例如內存。使用並行仍是串行程是MsSQL自動評估選擇的。單個任務分解成多個任務，就能夠在處理器上運行。例如耽擱查詢的排序、鏈接、掃描和GROUP   BY字句同時執行，SQL   SERVER根據系統的負載狀況決定最優的並行等級，複雜的須要消耗大量的CPU的查詢最適合並行處理。可是更新操做UPDATE,INSERT， DELETE還不能並行處理。
八、若是是使用like進行查詢的話，簡單的使用index是不行的，可是全文索引，耗空間。   like 'a%'   使用索引   like '%a'   不使用索引用   like '%a%'   查詢時，查詢耗時和字段值總長度成正比,因此不能用CHAR類型，而是VARCHAR。對於字段的值很長的建全文索引。
九、DB   Server   和APPLication   Server   分離；OLTP和OLAP分離
十、分佈式分區視圖可用於實現數據庫服務器聯合體。聯合體是一組分開管理的服務器，但它們相互協做分擔系統的處理負荷。這種經過分區數據造成數據庫服務器聯合體的機制可以擴大一組服務器，以支持大型的多層   Web   站點的處理須要。有關更多信息，參見設計聯合數據庫服務器。（參照SQL幫助文件'分區視圖'）服務器

a、在實現分區視圖以前，必須先水平分區表
b、在建立成員表後，在每一個成員服務器上定義一個分佈式分區視圖，而且每一個視圖具備相同的名稱。這樣，引用分佈式分區視圖名的查詢能夠在任何一個成員服務器上運行。系統操做如同每一個成員服務器上都有一個原始表的複本同樣，但其實每一個服務器上只有一個成員表和一個分佈式分區視圖。數據的位置對應用程序是透明的。網絡

十一、重建索引 DBCC REINDEX ,DBCC INDEXDEFRAG,收縮數據和日誌 DBCC SHRINKDB,DBCC SHRINKFILE. 設置自動收縮日誌.對於大的數據庫不要設置數據庫自動增加，它會下降服務器的性能。在T-sql的寫法上有很大的講究，下面列出常見的要點：首先，DBMS處理查詢計劃的過程是這樣的：併發

一、   查詢語句的詞法、語法檢查
二、   將語句提交給DBMS的查詢優化器
三、   優化器作代數優化和存取路徑的優化
四、   由預編譯模塊生成查詢規劃
五、   而後在合適的時間提交給系統處理執行
六、   最後將執行結果返回給用戶其次，看一下SQL   SERVER的數據存放的結構：一個頁面的大小爲8K(8060)字節，8個頁面爲一個盤區，按照B樹存放。分佈式

十二、Commit和rollback的區別   Rollback:回滾全部的事物。   Commit:提交當前的事物.   沒有必要在動態SQL裏寫事物，若是要寫請寫在外面如：   begin tran exec(@s)   commit   trans   或者將動態SQL   寫成函數或者存儲過程。
1三、在查詢Select語句中用Where字句限制返回的行數,避免表掃描,若是返回沒必要要的數據，浪費了服務器的I/O資源，加劇了網絡的負擔下降性能。若是表很大，在表掃描的期間將表鎖住，禁止其餘的聯接訪問表,後果嚴重。
1四、SQL的註釋申明對執行沒有任何影響
1五、儘量不使用遊標，它佔用大量的資源。若是須要row-by-row地執行，儘可能採用非光標技術,如：在客戶端循環，用臨時表，Table變量，用子查詢，用Case語句等等。遊標能夠按照它所支持的提取選項進行分類：   只進   必須按照從第一行到最後一行的順序提取行。FETCH NEXT   是惟一容許的提取操做,也是默認方式。可滾動性   能夠在遊標中任何地方隨機提取任意行。遊標的技術在SQL2000下變得功能很強大，他的目的是支持循環。
1六、用Profiler來跟蹤查詢，獲得查詢所需的時間，找出SQL的問題所在;用索引優化器優化索引
1七、注意UNion和UNion   all   的區別。UNION   all好
1八、注意使用DISTINCT，在沒有必要時不要用，它同UNION同樣會使查詢變慢。重複的記錄在查詢裏是沒有問題的
1九、查詢時不要返回不須要的行、列
20、用sp_configure   'query   governor   cost   limit'或者SET   QUERY_GOVERNOR_COST_LIMIT來限制查詢消耗的資源。當評估查詢消耗的資源超出限制時，服務器自動取消查詢,在查詢以前就扼殺掉。 SET   LOCKTIME設置鎖的時間
2一、用select   top 100 / 10 Percent   來限制用戶返回的行數或者SET   ROWCOUNT來限制操做的行
2二、在SQL2000之前，通常不要用以下的字句「IS NULL",   " <> ",   "!=",   "!> ",   "! <",   "NOT",   "NOT EXISTS",   "NOT IN",   "NOT LIKE",   and   "LIKE '%500'"，由於他們不走索引全是表掃描。
也不要在WHere字句中的列名加函數，如Convert，substring等,若是必須用函數的時候，建立計算列再建立索引來替代.還能夠變通寫法：WHERE SUBSTRING(firstname,1,1)   = 'm'改成WHERE   firstname   like 'm%'（索引掃描），必定要將函數和列名分開。而且索引不能建得太多和太大。
NOT   IN會屢次掃描表，使用EXISTS、NOT EXISTS   ，IN   ,   LEFT OUTER JOIN   來替代，特別是左鏈接,而Exists比IN更快，最慢的是NOT操做.若是列的值含有空，之前它的索引不起做用，如今2000的優化器可以處理了。相同的是IS   NULL，「NOT",   "NOT EXISTS",   "NOT IN"能優化她，而」 <> 」等仍是不能優化，用不到索引。
2三、使用Query   Analyzer，查看SQL語句的查詢計劃和評估分析是不是優化的SQL。通常的20%的代碼佔據了80%的資源，咱們優化的重點是這些慢的地方。
2四、若是使用了IN或者OR等時發現查詢沒有走索引，使用顯示申明指定索引：   SELECT * FROM   PersonMember   (INDEX =   IX_Title)   WHERE   processid   IN   (‘男’，‘女’)
2五、將須要查詢的結果預先計算好放在表中，查詢的時候再SELECT。這在SQL7.0之前是最重要的手段。例如醫院的住院費計算。
2六、MIN()   和   MAX()能使用到合適的索引
2七、數據庫有一個原則是代碼離數據越近越好，因此優先選擇Default,依次爲Rules,Triggers,   Constraint（約束如外健主健CheckUNIQUE……,數據類型的最大長度等等都是約束）,Procedure.這樣不只維護工做小，編寫程序質量高，而且執行的速度快。
2八、若是要插入大的二進制值到Image列，使用存儲過程，千萬不要用內嵌INsert來插入(不知JAVA是否)。由於這樣應用程序首先將二進制值轉換成字符串（尺寸是它的兩倍），服務器受到字符後又將他轉換成二進制值.存儲過程就沒有這些動做:   方法：Create procedure   p_insert   as insert into table(Fimage)   values   (@image),   在前臺調用這個存儲過程傳入二進制參數，這樣處理速度明顯改善。
2九、Between在某些時候比IN速度更快,Between可以更快地根據索引找到範圍。用查詢優化器可見到差異。   select * from   chineseresume   where   title   in   ('男','女')   Select * from   chineseresume   where between '男' and '女'   是同樣的。因爲in會在比較屢次，因此有時會慢些。
30、在必要是對全局或者局部臨時表建立索引，有時可以提升速度，但不是必定會這樣，由於索引也耗費大量的資源。他的建立同是實際表同樣。
3一、不要建沒有做用的事物例如產生報表時，浪費資源。只有在必要使用事物時使用它。
3二、用OR的字句能夠分解成多個查詢，而且經過UNION   鏈接多個查詢。他們的速度只同是否使用索引有關,若是查詢須要用到聯合索引，用UNION   all執行的效率更高.多個OR的字句沒有用到索引，改寫成UNION的形式再試圖與索引匹配。一個關鍵的問題是否用到索引。
3三、儘可能少用視圖，它的效率低。對視圖操做比直接對錶操做慢,能夠用stored   procedure來代替她。特別的是不要用視圖嵌套,嵌套視圖增長了尋找原始資料的難度。咱們看視圖的本質：它是存放在服務器上的被優化好了的已經產生了查詢規劃的SQL。對單個表檢索數據時，不要使用指向多個表的視圖，直接從表檢索或者僅僅包含這個表的視圖上讀，不然增長了沒必要要的開銷,查詢受到干擾.爲了加快視圖的查詢，MsSQL增長了視圖索引的功能。
3四、沒有必要時不要用DISTINCT和ORDER   BY，這些動做能夠改在客戶端執行。它們增長了額外的開銷。這同UNION   和UNION   ALL同樣的道理。   函數

SELECT top 20 ad.companyname,comid,position,ad.referenceid,worklocation, convert(varchar(10),ad.postDate,120) as postDate1,workyear,degreedescription FROM jobcn_query.dbo.COMPANYAD_query ad where referenceID in('JCNAD00329667','JCNAD132168','JCNAD00337748','JCNAD00338345','JCNAD00333138','JCNAD00303570', 'JCNAD00303569','JCNAD00303568','JCNAD00306698','JCNAD00231935','JCNAD00231933','JCNAD00254567', 'JCNAD00254585','JCNAD00254608','JCNAD00254607','JCNAD00258524','JCNAD00332133','JCNAD00268618', 'JCNAD00279196','JCNAD00268613') order by postdate desc post

3五、在IN後面值的列表中，將出現最頻繁的值放在最前面，出現得最少的放在最後面，減小判斷的次數
3六、當用SELECT   INTO時，它會鎖住系統表(sysobjects，sysindexes等等)，阻塞其餘的鏈接的存取。建立臨時表時用顯示申明語句，而不是 select INTO.   drop table   t_lxh   begin tran select * into   t_lxh   from   chineseresume   where   name   = 'XYZ' --commit   在另外一個鏈接中SELECT   *   from   sysobjects能夠看到   SELECT   INTO   會鎖住系統表，Create   table   也會鎖系統表(無論是臨時表仍是系統表)。因此千萬不要在事物內使用它！！！這樣的話若是是常常要用的臨時表請使用實表，或者臨時表變量。
3七、通常在GROUP   BY   個HAVING字句以前就能剔除多餘的行，因此儘可能不要用它們來作剔除行的工做。他們的執行順序應該以下最優：select   的Where字句選擇全部合適的行，Group   By用來分組個統計行，Having字句用來剔除多餘的分組。這樣Group   By   個Having的開銷小，查詢快.對於大的數據行進行分組和Having十分消耗資源。若是Group   BY的目的不包括計算，只是分組，那麼用Distinct更快
3八、一次更新多條記錄比分屢次更新每次一條快,就是說批處理好
3九、少用臨時表，儘可能用結果集和Table類性的變量來代替它,Table   類型的變量比臨時表好
40、在SQL2000下，計算字段是能夠索引的，須要知足的條件以下：性能

a、計算字段的表達是肯定的
b、不能用在TEXT,Ntext，Image數據類型
c、必須配製以下選項   ANSI_NULLS   = ON,   ANSI_PADDINGS   = ON,   …….

4一、儘可能將數據的處理工做放在服務器上，減小網絡的開銷，如使用存儲過程。存儲過程是編譯好、優化過、而且被組織到一個執行規劃裏、且存儲在數據庫中的 SQL語句，是控制流語言的集合，速度固然快。反覆執行的動態SQL,可使用臨時存儲過程，該過程（臨時表）被放在Tempdb中。之前因爲SQL   SERVER對複雜的數學計算不支持，因此不得不將這個工做放在其餘的層上而增長網絡的開銷。SQL2000支持UDFs,如今支持複雜的數學計算，函數的返回值不要太大，這樣的開銷很大。用戶自定義函數象光標同樣執行的消耗大量的資源，若是返回大的結果採用存儲過程
4二、不要在一句話裏再三的使用相同的函數，浪費資源,將結果放在變量裏再調用更快
4三、SELECT COUNT(*)的效率教低，儘可能變通他的寫法，而EXISTS快.同時請注意區別：   select count(Field   of null)   from Table   和   select count(Field   of NOT null)   from Table   的返回值是不一樣的。
4四、當服務器的內存夠多時，配製線程數量   =   最大鏈接數+5，這樣能發揮最大的效率；不然使用   配製線程數量 <最大鏈接數啓用SQL   SERVER的線程池來解決,若是仍是數量   =   最大鏈接數+5，嚴重的損害服務器的性能。
4五、按照必定的次序來訪問你的表。若是你先鎖住表A，再鎖住表B，那麼在全部的存儲過程當中都要按照這個順序來鎖定它們。若是你（不經意的）某個存儲過程當中先鎖定表B，再鎖定表A，這可能就會致使一個死鎖。若是鎖定順序沒有被預先詳細的設計好，死鎖很難被發現
4六、經過SQL   Server   Performance   Monitor監視相應硬件的負載   Memory:   Page   Faults   /   sec計數器若是該值偶爾走高，代表當時有線程競爭內存。若是持續很高，則內存多是瓶頸。   Process:

一、%   DPC   Time   指在範例間隔期間處理器用在緩延程序調用(DPC)接收和提供服務的百分比。(DPC   正在運行的爲比標準間隔優先權低的間隔)。   因爲   DPC   是以特權模式執行的，DPC   時間的百分比爲特權時間   百分比的一部分。這些時間單獨計算而且不屬於間隔計算總數的一部   分。這個總數顯示了做爲實例時間百分比的平均忙時。
二、%Processor   Time計數器若是該參數值持續超過95%，代表瓶頸是CPU。能夠考慮增長一個處理器或換一個更快的處理器。
三、%   Privileged   Time   指非閒置處理器時間用於特權模式的百分比。(特權模式是爲操做系統組件和操縱硬件驅動程序而設計的一種處理模式。它容許直接訪問硬件和全部內存。另外一種模式爲用戶模式，它是一種爲應用程序、環境分系統和整數分系統設計的一種有限處理模式。操做系統將應用程序線程轉換成特權模式以訪問操做系統服務)。   特權時間的   %   包括爲間斷和   DPC   提供服務的時間。特權時間比率高多是因爲失敗設備產生的大數量的間隔而引發的。這個計數器將平均忙時做爲樣本時間的一部分顯示。
四、% User   Time表示耗費CPU的數據庫操做，如排序，執行aggregate   functions等。若是該值很高，可考慮增長索引，儘可能使用簡單的表聯接，水平分割大表格等方法來下降該值。   Physical   Disk:   Curretn   Disk   Queue   Length計數器該值應不超過磁盤數的1.5~2倍。要提升性能，可增長磁盤。   SQLServer:Cache   Hit   Ratio計數器該值越高越好。若是持續低於80%，應考慮增長內存。   注意該參數值是從SQL   Server啓動後，就一直累加記數，因此運行通過一段時間後，該值將不能反映系統當前值。

4七、分析select emp_name form employee where salary > 3000 在此語句中若salary是Float類型的，則優化器對其進行優化爲Convert(float,3000)，由於3000是個整數，咱們應在編程時使用3000.0而不要等運行時讓DBMS進行轉化。一樣字符和整型數據的轉換。