SQL Server查詢優化方法

時間 2019-11-30

標籤 sql server 查詢優化方法欄目 SQL 简体版

原文原文鏈接

SQL Server查詢優化方法html

查詢速度慢的緣由不少，常見以下幾種sql

　　一、沒有索引或者沒有用到索引(這是查詢慢最多見的問題，是程序設計的缺陷)
　　二、I/O吞吐量小，造成了瓶頸效應
　　三、沒有建立計算列致使查詢不優化
　　四、內存不足
　　五、網絡速度慢
　　六、查詢出的數據量過大（能夠採用屢次查詢，其餘的方法下降數據量）
　　七、鎖或者死鎖(這也是查詢慢最多見的問題，是程序設計的缺陷)
　　八、sp_lock,sp_who,活動的用戶查看,緣由是讀寫競爭資源。
　　九、返回了沒必要要的行和列
　　十、查詢語句很差，沒有優化數據庫

能夠經過以下方法來優化查詢編程

　　一、把數據、日誌、索引放到不一樣的I/O設備上，增長讀取速度，之前能夠將Tempdb應放在RAID0上，SQL2000不在支持。數據量（尺寸）越大，提升I/O越重要.
　　二、縱向、橫向分割表，減小表的尺寸(sp_spaceuse)
　　三、升級硬件
　　四、根據查詢條件,創建索引,優化索引、優化訪問方式，限制結果集的數據量。注意填充因子要適當（最好是使用默認值0）。索引應該儘可能小，使用字節數小的列建索引好（參照索引的建立）,不要對有限的幾個值的字段建單一索引如性別字段
　　五、提升網速;
　　六、擴大服務器的內存。配置虛擬內存：虛擬內存大小應基於計算機上併發運行的服務進行配置。可考慮將虛擬內存大小設置爲計算機中安裝的物理內存的1.5倍。若是另外安裝了全文檢索功能，並打算運行Microsoft搜索服務以便執行全文索引和查詢，可考慮：將虛擬內存大小配置爲至少是計算機中安裝的物理內存的3倍。將SQL Server max server memory服務器配置選項配置爲物理內存的1.5倍（虛擬內存大小設置的一半）。
　　七、增長服務器CPU個數;可是必須明白並行處理串行處理更須要資源例如內存。使用並行仍是串行程是MsSQL自動評估選擇的。單個任務分解成多個任務，就能夠在處理器上運行。例如耽擱查詢的排序、鏈接、掃描和GROUPBY字句同時執行，SQLSERVER根據系統的負載狀況決定最優的並行等級，複雜的須要消耗大量的CPU的查詢最適合並行處理。可是更新操做UPDATE,INSERT，DELETE還不能並行處理。
　　八、若是是使用like進行查詢的話，簡單的使用index是不行的，可是全文索引耗空間。like'a%'使用索引like'%a'不使用索引用like'%a%'查詢時，查詢耗時和字段值總長度成正比,因此不能用CHAR類型，而是VARCHAR。對於字段的值很長的建全文索引。
　　九、DBServer和ApplicationServer分離，OLTP和OLAP分離
　　十、分佈式分區視圖可用於實現數據庫服務器聯合體。聯合體是一組分開管理的服務器，但它們相互協做分擔系統的處理負荷。這種經過分區數據造成數據庫服務器聯合體的機制可以擴大一組服務器，以支持大型的多層Web站點的處理須要。有關更多信息，參見設計聯合數據庫服務器。（參照SQL幫助文件'分區視圖'）服務器

　　　　a、在實現分區視圖以前，必須先水平分區表
　　　　b、在建立成員表後，在每一個成員服務器上定義一個分佈式分區視圖，而且每一個視圖具備相同的名稱。這樣，引用分佈式分區視圖名的查詢能夠在任何一個成員服務器上運行。系統操做如同每一個成員服務器上都有一個原始表的複本同樣，但其實每一個服務器上只有一個成員表和一個分佈式分區視圖。數據的位置對應用程序是透明的。網絡

　　十一、重建索引DBCCREINDEX,DBCCINDEXDEFRAG,收縮數據和日誌DBCCSHRINKDB,DBCCSHRINKFILE.設置自動收縮日誌.對於大的數據庫不要設置數據庫自動增加，它會下降服務器的性能。在T-sql的寫法上有很大的講究，下面列出常見的要點：首先，DBMS處理查詢計劃的過程是這樣的：
　　　　一、查詢語句的詞法、語法檢查
　　　　二、將語句提交給DBMS的查詢優化器
　　　　三、優化器作代數優化和存取路徑的優化
　　　　四、由預編譯模塊生成查詢規劃
　　　　五、而後在合適的時間提交給系統處理執行
　　　　六、最後將執行結果返回給用戶其次，看一下SQLSERVER的數據存放的結構：一個頁面的大小爲8K(8060)字節，8個頁面爲一個盤區，按照B樹存放。
　　十二、Commit和rollback的區別Rollback:回滾全部的事物。Commit:提交當前的事物.沒有必要在動態SQL裏寫事物，若是要寫請寫在外面如：begintranexec(@s)committrans或者將動態SQL寫成函數或者存儲過程。
　　1三、在查詢Select語句中用Where字句限制返回的行數,避免表掃描,若是返回沒必要要的數據，浪費了服務器的I/O資源，加劇了網絡的負擔下降性能。若是表很大，在表掃描的期間將表鎖住，禁止其餘的聯接訪問表,後果嚴重。
　　1四、SQL的註釋申明對執行沒有任何影響
　　1五、儘量不使用光標，它佔用大量的資源。若是須要row-by-row地執行，儘可能採用非光標技術,如：在客戶端循環，用臨時表，Table變量，用子查詢，用Case語句等等。遊標能夠按照它所支持的提取選項進行分類：只進必須按照從第一行到最後一行的順序提取行。FETCHNEXT是惟一容許的提取操做,也是默認方式。可滾動性能夠在遊標中任何地方隨機提取任意行。遊標的技術在SQL2000下變得功能很強大，他的目的是支持循環。
　　有四個併發選項：
　　　　READ_ONLY：不容許經過遊標定位更新(Update)，且在組成結果集的行中沒有鎖。
　　　　OPTIMISTICWITHvalueS:樂觀併發控制是事務控制理論的一個標準部分。樂觀併發控制用於這樣的情形，即在打開遊標及更新行的間隔中，只有很小的機會讓第二個用戶更新某一行。當某個遊標以此選項打開時，沒有鎖控制其中的行，這將有助於最大化其處理能力。若是用戶試圖修改某一行，則此行的當前值會與最後一次提取此行時獲取的值進行比較。若是任何值發生改變，則服務器就會知道其餘人已更新了此行，並會返回一個錯誤。若是值是同樣的，服務器就執行修改。選擇這個併發選項OPTIMISTICWITHROWVERSIONING:此樂觀併發控制選項基於行版本控制。使用行版本控制，其中的表必須具備某種版本標識符，服務器可用它來肯定該行在讀入遊標後是否有所更改。
　　　　在SQLServer中，這個性能由timestamp數據類型提供，它是一個二進制數字，表示數據庫中更改的相對順序。每一個數據庫都有一個全局當前時間戳值：@@DBTS。每次以任何方式更改帶有timestamp列的行時，SQLServer先在時間戳列中存儲當前的@@DBTS值，而後增長@@DBTS的值。若是某個表具備timestamp列，則時間戳會被記到行級。服務器就能夠比較某行的當前時間戳值和上次提取時所存儲的時間戳值，從而肯定該行是否已更新。服務器沒必要比較全部列的值，只需比較timestamp列便可。若是應用程序對沒有timestamp列的表要求基於行版本控制的樂觀併發，則遊標默認爲基於數值的樂觀併發控制。
　　　　SCROLLLOCKS這個選項實現悲觀併發控制。在悲觀併發控制中，在把數據庫的行讀入遊標結果集時，應用程序將試圖鎖定數據庫行。在使用服務器遊標時，將行讀入遊標時會在其上放置一個更新鎖。若是在事務內打開遊標，則該事務更新鎖將一直保持到事務被提交或回滾；當提取下一行時，將除去遊標鎖。若是在事務外打開遊標，則提取下一行時，鎖就被丟棄。所以，每當用戶須要徹底的悲觀併發控制時，遊標都應在事務內打開。更新鎖將阻止任何其它任務獲取更新鎖或排它鎖，從而阻止其它任務更新該行。
　　　　然而，更新鎖並不阻止共享鎖，因此它不會阻止其它任務讀取行，除非第二個任務也在要求帶更新鎖的讀取。滾動鎖根據在遊標定義的SELECT語句中指定的鎖提示，這些遊標併發選項能夠生成滾動鎖。滾動鎖在提取時在每行上獲取，並保持到下次提取或者遊標關閉，以先發生者爲準。下次提取時，服務器爲新提取中的行獲取滾動鎖，並釋放上次提取中行的滾動鎖。滾動鎖獨立於事務鎖，並能夠保持到一個提交或回滾操做以後。若是提交時關閉遊標的選項爲關，則COMMIT語句並不關閉任何打開的遊標，並且滾動鎖被保留到提交以後，以維護對所提取數據的隔離。所獲取滾動鎖的類型取決於遊標併發選項和遊標SELECT語句中的鎖提示。
　　　　鎖提示只讀樂觀數值樂觀行版本控制鎖定無提示未鎖定未鎖定未鎖定更新NOLOCK未鎖定未鎖定未鎖定未鎖定HOLDLOCK共享共享共享更新UPDLOCK錯誤更新更新更新TABLOCKX錯誤未鎖定未鎖定更新其它未鎖定未鎖定未鎖定更新*指定NOLOCK提示將使指定了該提示的表在遊標內是隻讀的。
　　1六、用Profiler來跟蹤查詢，獲得查詢所需的時間，找出SQL的問題所在;用索引優化器優化索引
　　1七、注意UNion和UNionall的區別。UNIONall好
　　1八、注意使用DISTINCT，在沒有必要時不要用，它同UNION同樣會使查詢變慢。重複的記錄在查詢裏是沒有問題的
　　1九、查詢時不要返回不須要的行、列
　　20、用sp_configure'querygovernorcostlimit'或者SETQUERY_GOVERNOR_COST_LIMIT來限制查詢消耗的資源。當評估查詢消耗的資源超出限制時，服務器自動取消查詢,在查詢以前就扼殺掉。SETLOCKTIME設置鎖的時間
　　2一、用selecttop100/10Percent來限制用戶返回的行數或者SETROWCOUNT來限制操做的行
　　2二、在SQL2000之前，通常不要用以下的字句:"ISNULL","<>","!=","!>","!<","NOT","NOTEXISTS","NOTIN","NOTLIKE",and"LIKE'%500'"，由於他們不走索引全是表掃描。也不要在WHere字句中的列名加函數，如Convert，substring等,若是必須用函數的時候，建立計算列再建立索引來替代.還能夠變通寫法：WHERESUBSTRING(firstname,1,1)='m'改成WHEREfirstnamelike'm%'（索引掃描），必定要將函數和列名分開。而且索引不能建得太多和太大。NOTIN會屢次掃描表，使用EXISTS、NOTEXISTS，IN,LEFTOUTERJOIN來替代，特別是左鏈接,而Exists比IN更快，最慢的是NOT操做.若是列的值含有空，之前它的索引不起做用，如今2000的優化器可以處理了。相同的是ISNULL，「NOT","NOTEXISTS","NOTIN"能優化她，而」<>」等仍是不能優化，用不到索引。
　　2三、使用QueryAnalyzer，查看SQL語句的查詢計劃和評估分析是不是優化的SQL。通常的20%的代碼佔據了80%的資源，咱們優化的重點是這些慢的地方。
　　2四、若是使用了IN或者OR等時發現查詢沒有走索引，使用顯示申明指定索引：SELECT*FROMPersonMember(INDEX=IX_Title)WHEREprocessidIN(‘男’，‘女’)
　　2五、將須要查詢的結果預先計算好放在表中，查詢的時候再SELECT。這在SQL7.0之前是最重要的手段。例如醫院的住院費計算。
　　2六、MIN()和MAX()能使用到合適的索引
　　2七、數據庫有一個原則是代碼離數據越近越好，因此優先選擇Default,依次爲Rules,Triggers,Constraint（約束如外健主健CheckUNIQUE……,數據類型的最大長度等等都是約束）,Procedure.這樣不只維護工做小，編寫程序質量高，而且執行的速度快。
　　2八、若是要插入大的二進制值到Image列，使用存儲過程，千萬不要用內嵌INsert來插入(不知JAVA是否)。由於這樣應用程序首先將二進制值轉換成字符串（尺寸是它的兩倍），服務器受到字符後又將他轉換成二進制值.存儲過程就沒有這些動做:方法：Createprocedurep_insertasinsertintotable(Fimage)values(@image),在前臺調用這個存儲過程傳入二進制參數，這樣處理速度明顯改善。
　　2九、Between在某些時候比IN速度更快,Between可以更快地根據索引找到範圍。用查詢優化器可見到差異。select*fromchineseresumewheretitlein('男','女')Select*fromchineseresumewherebetween'男'and'女'是同樣的。因爲in會在比較屢次，因此有時會慢些。
　　30、在必要是對全局或者局部臨時表建立索引，有時可以提升速度，但不是必定會這樣，由於索引也耗費大量的資源。他的建立同是實際表同樣。
　　3一、不要建沒有做用的事物例如產生報表時，浪費資源。只有在必要使用事物時使用它。
　　3二、用OR的字句能夠分解成多個查詢，而且經過UNION鏈接多個查詢。他們的速度只同是否使用索引有關,若是查詢須要用到聯合索引，用UNIONall執行的效率更高.多個OR的字句沒有用到索引，改寫成UNION的形式再試圖與索引匹配。一個關鍵的問題是否用到索引。
　　3三、儘可能少用視圖，它的效率低。對視圖操做比直接對錶操做慢,能夠用storedprocedure來代替她。特別的是不要用視圖嵌套,嵌套視圖增長了尋找原始資料的難度。咱們看視圖的本質：它是存放在服務器上的被優化好了的已經產生了查詢規劃的SQL。對單個表檢索數據時，不要使用指向多個表的視圖，直接從表檢索或者僅僅包含這個表的視圖上讀，不然增長了沒必要要的開銷,查詢受到干擾.爲了加快視圖的查詢，MsSQL增長了視圖索引的功能。
　　3四、沒有必要時不要用DISTINCT和ORDERBY，這些動做能夠改在客戶端執行。它們增長了額外的開銷。這同UNION和UNIONALL同樣的道理。SELECTtop20ad.companyname,comid,position,ad.referenceid,worklocation,convert(varchar(10),ad.postDate,120)aspostDate1,workyear,degreedescriptionFROMjobcn_query.dbo.COMPANYAD_queryadwherereferenceIDin('JCNAD00329667','JCNAD132168','JCNAD00337748','JCNAD00338345','JCNAD00333138','JCNAD00303570','JCNAD00303569','JCNAD00303568','JCNAD00306698','JCNAD00231935','JCNAD00231933','JCNAD00254567','JCNAD00254585','JCNAD00254608','JCNAD00254607','JCNAD00258524','JCNAD00332133','JCNAD00268618','JCNAD00279196','JCNAD00268613')orderbypostdatedesc
　　3五、在IN後面值的列表中，將出現最頻繁的值放在最前面，出現得最少的放在最後面，減小判斷的次數
　　3六、當用SELECTINTO時，它會鎖住系統表(sysobjects，sysindexes等等)，阻塞其餘的鏈接的存取。建立臨時表時用顯示申明語句，而不是selectINTO.droptablet_lxhbegintranselect*intot_lxhfromchineseresumewherename='XYZ'--commit在另外一個鏈接中SELECT*fromsysobjects能夠看到SELECTINTO會鎖住系統表，Createtable也會鎖系統表(無論是臨時表仍是系統表)。因此千萬不要在事物內使用它！！！這樣的話若是是常常要用的臨時表請使用實表，或者臨時表變量。
　　3七、通常在GROUPBY個HAVING字句以前就能剔除多餘的行，因此儘可能不要用它們來作剔除行的工做。他們的執行順序應該以下最優：select的Where字句選擇全部合適的行，GroupBy用來分組個統計行，Having字句用來剔除多餘的分組。這樣GroupBy個Having的開銷小，查詢快.對於大的數據行進行分組和Having十分消耗資源。若是GroupBY的目的不包括計算，只是分組，那麼用Distinct更快
　　3八、一次更新多條記錄比分屢次更新每次一條快,就是說批處理好
　　3九、少用臨時表，儘可能用結果集和Table類性的變量來代替它,Table類型的變量比臨時表好
　　40、在SQL2000下，計算字段是能夠索引的，須要知足的條件以下：
　　　　a、計算字段的表達是肯定的
　　　　b、不能用在TEXT,Ntext，Image數據類型
　　　　c、必須配製以下選項ANSI_NULLS=ON,ANSI_PADDINGS=ON,…….
　　4一、儘可能將數據的處理工做放在服務器上，減小網絡的開銷，如使用存儲過程。存儲過程是編譯好、優化過、而且被組織到一個執行規劃裏、且存儲在數據庫中的SQL語句，是控制流語言的集合，速度固然快。反覆執行的動態SQL,可使用臨時存儲過程，該過程（臨時表）被放在Tempdb中。之前因爲SQLSERVER對複雜的數學計算不支持，因此不得不將這個工做放在其餘的層上而增長網絡的開銷。SQL2000支持UDFs,如今支持複雜的數學計算，函數的返回值不要太大，這樣的開銷很大。用戶自定義函數象光標同樣執行的消耗大量的資源，若是返回大的結果採用存儲過程
　　4二、不要在一句話裏再三的使用相同的函數，浪費資源,將結果放在變量裏再調用更快
　　4三、SELECTCOUNT(*)的效率教低，儘可能變通他的寫法，而EXISTS快.同時請注意區別：selectcount(Fieldofnull)fromTable和selectcount(FieldofNOTnull)fromTable的返回值是不一樣的。
　　4四、當服務器的內存夠多時，配製線程數量=最大鏈接數+5，這樣能發揮最大的效率；不然使用配製線程數量<最大鏈接數啓用SQLSERVER的線程池來解決,若是仍是數量=最大鏈接數+5，嚴重的損害服務器的性能。
　　4五、按照必定的次序來訪問你的表。若是你先鎖住表A，再鎖住表B，那麼在全部的存儲過程當中都要按照這個順序來鎖定它們。若是你（不經意的）某個存儲過程當中先鎖定表B，再鎖定表A，這可能就會致使一個死鎖。若是鎖定順序沒有被預先詳細的設計好，死鎖很難被發現
　　4六、經過SQLServerPerformanceMonitor監視相應硬件的負載Memory:PageFaults/sec計數器若是該值偶爾走高，代表當時有線程競爭內存。若是持續很高，則內存多是瓶頸。Process:
　　　　一、%DPCTime指在範例間隔期間處理器用在緩延程序調用(DPC)接收和提供服務的百分比。(DPC正在運行的爲比標準間隔優先權低的間隔)。因爲DPC是以特權模式執行的，DPC時間的百分比爲特權時間百分比的一部分。這些時間單獨計算而且不屬於間隔計算總數的一部分。這個總數顯示了做爲實例時間百分比的平均忙時。
　　　　二、%ProcessorTime計數器　若是該參數值持續超過95%，代表瓶頸是CPU。能夠考慮增長一個處理器或換一個更快的處理器。
　　　　三、%PrivilegedTime指非閒置處理器時間用於特權模式的百分比。(特權模式是爲操做系統組件和操縱硬件驅動程序而設計的一種處理模式。它容許直接訪問硬件和全部內存。另外一種模式爲用戶模式，它是一種爲應用程序、環境分系統和整數分系統設計的一種有限處理模式。操做系統將應用程序線程轉換成特權模式以訪問操做系統服務)。特權時間的%包括爲間斷和DPC提供服務的時間。特權時間比率高多是因爲失敗設備產生的大數量的間隔而引發的。這個計數器將平均忙時做爲樣本時間的一部分顯示。
　　　　四、%UserTime表示耗費CPU的數據庫操做，如排序，執行aggregatefunctions等。若是該值很高，可考慮增長索引，儘可能使用簡單的表聯接，水平分割大表格等方法來下降該值。PhysicalDisk:CurretnDiskQueueLength計數器該值應不超過磁盤數的1.5~2倍。要提升性能，可增長磁盤。SQLServer:CacheHitRatio計數器該值越高越好。若是持續低於80%，應考慮增長內存。注意該參數值是從SQLServer啓動後，就一直累加記數，因此運行通過一段時間後，該值將不能反映系統當前值。
　　4七、分析selectemp_nameformemployeewheresalary>3000在此語句中若salary是Float類型的，則優化器對其進行優化爲Convert(float,3000)，由於3000是個整數，咱們應在編程時使用3000.0而不要等運行時讓DBMS進行轉化。一樣字符和整型數據的轉換。併發