50種方法優化SQL Server數據庫查詢(有N多錯別字)
http://database.51cto.com/art/200612/35820.htm
查詢速度慢的緣由不少,常見以下幾種:
一、沒有索引或者沒有用到索引(這是查詢慢最多見的問題,是程序設計的缺陷)
二、I/O吞吐量小,造成了瓶頸效應。
三、沒有建立計算列致使查詢不優化。
四、內存不足
五、網絡速度慢
六、查詢出的數據量過大(能夠採用屢次查詢,其餘的方法下降數據量)
七、鎖或者死鎖(這也是查詢慢最多見的問題,是程序設計的缺陷)
八、sp_lock,sp_who,活動的用戶查看,緣由是讀寫競爭資源。
九、返回了沒必要要的行和列
十、查詢語句很差,沒有優化
能夠經過以下方法來優化查詢 :
一、把數據、日誌、索引放到不一樣的I/O設備上,增長讀取速度,之前能夠將Tempdb應放在RAID0上,SQL2000不在支持。數據量(尺寸)越大,提升I/O越重要.
二、縱向、橫向分割表,減小表的尺寸(sp_spaceuse)
三、升級硬件
四、根據查詢條件,創建索引,優化索引、優化訪問方式,限制結果集的數據量。注意填充因子要適當(最好是使用默認值0)。索引應該儘可能小,使用字節數小的列建索引好(參照索引的建立),不要對有限的幾個值的字段建單一索引如性別字段
五、提升網速;
六、擴大服務器的內存,Windows 2000和SQL server 2000能支持4-8G的內存。配置虛擬內存:虛擬內存大小應基於計算機上併發運行的服務進行配置。運行 Microsoft SQL Server? 2000 時,可考慮將虛擬內存大小設置爲計算機中安裝的物理內存的 1.5 倍。若是另外安裝了全文檢索功能,並打算運行 Microsoft 搜索服務以便執行全文索引和查詢,可考慮:將虛擬內存大小配置爲至少是計算機中安裝的物理內存的 3 倍。將 SQL Server max server memory 服務器配置選項配置爲物理內存的 1.5 倍(虛擬內存大小設置的一半)。
七、增長服務器 CPU個數;可是必須明白並行處理串行處理更須要資源例如內存。使用並行仍是串行程是MsSQL自動評估選擇的。單個任務分解成多個任務,就能夠在處理器上運行。例如耽擱查詢的排序、鏈接、掃描和GROUP BY字句同時執行,SQL SERVER根據系統的負載狀況決定最優的並行等級,複雜的須要消耗大量的CPU的查詢最適合並行處理。可是更新操做Update,Insert, Delete還不能並行處理。
八、若是是使用like進行查詢的話,簡單的使用index是不行的,可是全文索引,耗空間。 like 'a%' 使用索引 like '%a' 不使用索引用 like '%a%' 查詢時,查詢耗時和字段值總長度成正比,因此不能用CHAR類型,而是VARCHAR。對於字段的值很長的建全文索引。
九、DB Server 和APPLication Server 分離;OLTP和OLAP分離
十、分佈式分區視圖可用於實現數據庫服務器聯合體。聯合體是一組分開管理的服務器,但它們相互協做分擔系統的處理負荷。這種經過分區數據造成數據庫服務器聯合體的機制可以擴大一組服務器,以支持大型的多層 Web 站點的處理須要。有關更多信息,參見設計聯合數據庫服務器。(參照SQL幫助文件'分區視圖')
a、在實現分區視圖以前,必須先水平分區表
b、在建立成員表後,在每一個成員服務器上定義一個分佈式分區視圖,而且每一個視圖具備相同的名稱。這樣,引用分佈式分區視圖名的查詢能夠在任何一個成員服務器上運行。系統操做如同每一個成員服務器上都有一個原始表的複本同樣,但其實每一個服務器上只有一個成員表和一個分佈式分區視圖。數據的位置對應用程序是透明的。
十一、重建索引 DBCC REINDEX ,DBCC INDEXDEFRAG,收縮數據和日誌 DBCC SHRINKDB,DBCC SHRINKFILE. 設置自動收縮日誌.對於大的數據庫不要設置數據庫自動增加,它會下降服務器的性能。在T-sql的寫法上有很大的講究,下面列出常見的要點:首先, DBMS處理查詢計劃的過程是這樣的:
一、 查詢語句的詞法、語法檢查
二、 將語句提交給DBMS的查詢優化器
三、 優化器作代數優化和存取路徑的優化
四、 由預編譯模塊生成查詢規劃
五、 而後在合適的時間提交給系統處理執行
六、 最後將執行結果返回給用戶其次,看一下SQL SERVER的數據存放的結構:一個頁面的大小爲8K(8060)字節,8個頁面爲一個盤區,按照B樹存放。
十二、Commit和rollback的區別 Rollback:回滾全部的事物。 Commit:提交當前的事物. 沒有必要在動態SQL裏寫事物,若是要寫請寫在外面如: begin tran exec(@s) commit trans 或者將動態SQL 寫成函數或者存儲過程。
1三、在查詢Select語句中用Where字句限制返回的行數,避免表掃描,若是返回沒必要要的數據,浪費了服務器的I/O資源,加劇了網絡的負擔下降性能。若是表很大,在表掃描的期間將表鎖住,禁止其餘的聯接訪問表,後果嚴重。
1四、SQL的註釋申明對執行沒有任何影響
1五、儘量不使用光標,它佔用大量的資源。若是須要row-by-row地執行,儘可能採用非光標技術,如:在客戶端循環,用臨時表,Table變量,用子查詢,用Case語句等等。遊標能夠按照它所支持的提取選項進行分類: 只進 必須按照從第一行到最後一行的順序提取行。FETCH NEXT 是惟一容許的提取操做,也是默認方式。可滾動性能夠在遊標中任何地方隨機提取任意行。遊標的技術在SQL2000下變得功能很強大,他的目的是支持循環。有四個併發選項 READ_ONLY:不容許經過遊標定位更新(Update),且在組成結果集的行中沒有鎖。 OPTIMISTIC WITH valueS:樂觀併發控制是事務控制理論的一個標準部分。樂觀併發控制用於這樣的情形,即在打開遊標及更新行的間隔中,只有很小的機會讓第二個用戶更新某一行。當某個遊標以此選項打開時,沒有鎖控制其中的行,這將有助於最大化其處理能力。若是用戶試圖修改某一行,則此行的當前值會與最後一次提取此行時獲取的值進行比較。若是任何值發生改變,則服務器就會知道其餘人已更新了此行,並會返回一個錯誤。若是值是同樣的,服務器就執行修改。選擇這個併發選項 ?OPTIMISTIC WITH ROW VERSIONING:此樂觀併發控制選項基於行版本控制。使用行版本控制,其中的表必須具備某種版本標識符,服務器可用它來肯定該行在讀入遊標後是否有所更改。在 SQL Server 中,這個性能由 timestamp 數據類型提供,它是一個二進制數字,表示數據庫中更改的相對順序。每一個數據庫都有一個全局當前時間戳值:@@DBTS。每次以任何方式更改帶有 timestamp 列的行時,SQL Server 先在時間戳列中存儲當前的 @@DBTS 值,而後增長 @@DBTS 的值。若是某 個表具備 timestamp 列,則時間戳會被記到行級。服務器就能夠比較某行的當前時間戳值和上次提取時所存儲的時間戳值,從而肯定該行是否已更新。服務器沒必要比較全部列的值,只需比較 timestamp 列便可。若是應用程序對沒有 timestamp 列的表要求基於行版本控制的樂觀併發,則遊標默認爲基於數值的樂觀併發控制。 SCROLL LOCKS 這個選項實現悲觀併發控制。在悲觀併發控制中,在把數據庫的行讀入遊標結果集時,應用程序將試圖鎖定數據庫行。在使用服務器遊標時,將行讀入遊標時會在其上放置一個更新鎖。若是在事務內打開遊標,則該事務更新鎖將一直保持到事務被提交或回滾;當提取下一行時,將除去遊標鎖。若是在事務外打開遊標,則提取下一行時,鎖就被丟棄。所以,每當用戶須要徹底的悲觀併發控制時,遊標都應在事務內打開。更新鎖將阻止任何其它任務獲取更新鎖或排它鎖,從而阻止其它任務更新該行。然而,更新鎖並不阻止共享鎖,因此它不會阻止其它任務讀取行,除非第二個任務也在要求帶更新鎖的讀取。滾動鎖根據在遊標定義的 Select 語句中指定的鎖提示,這些遊標併發選項能夠生成滾動鎖。滾動鎖在提取時在每行上獲取,並保持到下次提取或者遊標關閉,以先發生者爲準。下次提取時,服務器爲新提取中的行獲取滾動鎖,並釋放上次提取中行的滾動鎖。滾動鎖獨立於事務鎖,並能夠保持到一個提交或回滾操做以後。若是提交時關閉遊標的選項爲關,則 COMMIT 語句並不關閉任何打開的遊標,並且滾動鎖被保留到提交以後,以維護對所提取數據的隔離。所獲取滾動鎖的類型取決於遊標併發選項和遊標 Select 語句中的鎖提示。鎖提示 只讀 樂觀數值 樂觀行版本控制 鎖定無提示 未鎖定 未鎖定 未鎖定 更新 NOLOCK 未鎖定未鎖定未鎖定 未鎖定 HOLDLOCK 共享 共享 共享 更新 UPDLOCK 錯誤 更新 更新 更新 TABLOCKX 錯誤 未鎖定未鎖定更新其它 未鎖定 未鎖定 未鎖定 更新 *指定 NOLOCK 提示將使指定了該提示的表在遊標內是隻讀的。
1六、用Profiler來跟蹤查詢,獲得查詢所需的時間,找出SQL的問題所在;用索引優化器優化索引
1七、注意UNion和UNion all 的區別。UNION all好
1八、注意使用DISTINCT,在沒有必要時不要用,它同UNION同樣會使查詢變慢。重複的記錄在查詢裏是沒有問題的
1九、查詢時不要返回不須要的行、列
20、用sp_configure 'query governor cost limit'或者SET QUERY_GOVERNOR_COST_LIMIT來限制查詢消耗的資源。當評估查詢消耗的資源超出限制時,服務器自動取消查詢,在查詢以前就扼殺掉。 SET LOCKTIME設置鎖的時間
2一、用select top 100 / 10 Percent 來限制用戶返回的行數或者SET ROWCOUNT來限制操做的行
2二、在SQL2000之前,通常不要用以下的字句: "IS NULL", "<>", "!=", "!>", "!<", "NOT", "NOT EXISTS", "NOT IN", "NOT LIKE", and "LIKE '%500'",由於他們不走索引全是表掃描。也不要在Where字句中的列名加函數,如Convert,substring等,若是必須用函數的時候,建立計算列再建立索引來替代.還能夠變通寫法:Where SUBSTRING(firstname,1,1) = 'm'改成Where firstname like 'm%'(索引掃描),必定要將函數和列名分開。而且索引不能建得太多和太大。NOT IN會屢次掃描表,使用EXISTS、NOT EXISTS ,IN , LEFT OUTER JOIN 來替代,特別是左鏈接,而Exists比IN更快,最慢的是NOT操做.若是列的值含有空,之前它的索引不起做用,如今2000的優化器可以處理了。相同的是IS NULL,"NOT", "NOT EXISTS", "NOT IN"能優化她,而"<>"等仍是不能優化,用不到索引。
2三、使用Query Analyzer,查看SQL語句的查詢計劃和評估分析是不是優化的SQL。通常的20%的代碼佔據了80%的資源,咱們優化的重點是這些慢的地方。
2四、若是使用了IN或者OR等時發現查詢沒有走索引,使用顯示申明指定索引: Select * FROM PersonMember (INDEX = IX_Title) Where processid IN (男,'女)
2五、將須要查詢的結果預先計算好放在表中,查詢的時候再Select。這在SQL7.0之前是最重要的手段。例如醫院的住院費計算。
2六、MIN() 和 MAX()能使用到合適的索引。
2七、數據庫有一個原則是代碼離數據越近越好,因此優先選擇Default,依次爲Rules,Triggers, Constraint(約束如外健主健CheckUNIQUE……,數據類型的最大長度等等都是約束),Procedure.這樣不只維護工做小,編寫程序質量高,而且執行的速度快。
2八、若是要插入大的二進制值到Image列,使用存儲過程,千萬不要用內嵌Insert來插入(不知JAVA是否)。由於這樣應用程序首先將二進制值轉換成字符串(尺寸是它的兩倍),服務器受到字符後又將他轉換成二進制值.存儲過程就沒有這些動做: 方法:Create procedure p_insert as insert into table(Fp_w_picpath) values (@p_w_picpath), 在前臺調用這個存儲過程傳入二進制參數,這樣處理速度明顯改善。
2九、Between在某些時候比IN 速度更快,Between可以更快地根據索引找到範圍。用查詢優化器可見到差異。 select * from chineseresume where title in (男,女') Select * from chineseresume where between 男 and 女 是同樣的。因爲in會在比較屢次,因此有時會慢些。
30、在必要是對全局或者局部臨時表建立索引,有時可以提升速度,但不是必定會這樣,由於索引也耗費大量的資源。他的建立同是實際表同樣。
3一、不要建沒有做用的事物例如產生報表時,浪費資源。只有在必要使用事物時使用它。
3二、用OR的字句能夠分解成多個查詢,而且經過UNION 鏈接多個查詢。他們的速度只同是否使用索引有關,若是查詢須要用到聯合索引,用UNION all執行的效率更高.多個OR的字句沒有用到索引,改寫成UNION的形式再試圖與索引匹配。一個關鍵的問題是否用到索引。
3三、儘可能少用視圖,它的效率低。對視圖操做比直接對錶操做慢,能夠用stored procedure來代替她。特別的是不要用視圖嵌套,嵌套視圖增長了尋找原始資料的難度。咱們看視圖的本質:它是存放在服務器上的被優化好了的已經產生了查詢規劃的SQL。對單個表檢索數據時,不要使用指向多個表的視圖,直接從表檢索或者僅僅包含這個表的視圖上讀,不然增長了沒必要要的開銷,查詢受到干擾.爲了加快視圖的查詢,MsSQL增長了視圖索引的功能。
3四、沒有必要時不要用DISTINCT和ORDER BY,這些動做能夠改在客戶端執行。它們增長了額外的開銷。這同UNION 和UNION ALL同樣的道理。select top 20 ad.companyname,comid,position,ad.referenceid,worklocation, convert(varchar(10),ad.postDate,120) as postDate1,workyear,degreedescription FROM jobcn_query.dbo.COMPANYAD_query ad where referenceID in('JCNAD00329667','JCNAD132168','JCNAD00337748','JCNAD00338345',
'JCNAD00333138','JCNAD00303570','JCNAD00303569',
'JCNAD00303568','JCNAD00306698','JCNAD00231935','JCNAD00231933',
'JCNAD00254567','JCNAD00254585','JCNAD00254608',
'JCNAD00254607','JCNAD00258524','JCNAD00332133','JCNAD00268618',
JCNAD00279196','JCNAD00268613') order by postdate desc
3五、在IN後面值的列表中,將出現最頻繁的值放在最前面,出現得最少的放在最後面,減小判斷的次數。
3六、當用Select INTO時,它會鎖住系統表(sysobjects,sysindexes等等),阻塞其餘的鏈接的存取。建立臨時表時用顯示申明語句,而不是 select INTO. drop table t_lxh begin tran select * into t_lxh from chineseresume where name = 'XYZ' --commit 在另外一個鏈接中Select * from sysobjects能夠看到 Select INTO 會鎖住系統表,Create table 也會鎖系統表(無論是臨時表仍是系統表)。因此千萬不要在事物內使用它!!!這樣的話若是是常常要用的臨時表請使用實表,或者臨時表變量。
3七、通常在GROUP BY 個HAVING字句以前就能剔除多餘的行,因此儘可能不要用它們來作剔除行的工做。他們的執行順序應該以下最優:select 的Where字句選擇全部合適的行,Group By用來分組個統計行,Having字句用來剔除多餘的分組。這樣Group By 個Having的開銷小,查詢快.對於大的數據行進行分組和Having十分消耗資源。若是Group BY的目的不包括計算,只是分組,那麼用Distinct更快
3八、一次更新多條記錄比分屢次更新每次一條快,就是說批處理好
3九、少用臨時表,儘可能用結果集和Table類性的變量來代替它,Table 類型的變量比臨時表好
40、在SQL2000下,計算字段是能夠索引的,須要知足的條件以下:
a、計算字段的表達是肯定的
b、不能用在TEXT,Ntext,Image數據類型
c、必須配製以下選項 ANSI_NULLS = ON, ANSI_PADDINGS = ON, …….
4一、儘可能將數據的處理工做放在服務器上,減小網絡的開銷,如使用存儲過程。存儲過程是編譯好、優化過、而且被組織到一個執行規劃裏、且存儲在數據庫中的SQL語句,是控制流語言的集合,速度固然快。反覆執行的動態SQL,可使用臨時存儲過程,該過程(臨時表)被放在Tempdb中。之前因爲SQL SERVER對複雜的數學計算不支持,因此不得不將這個工做放在其餘的層上而增長網絡的開銷。SQL2000支持UDFs,如今支持複雜的數學計算,函數的返回值不要太大,這樣的開銷很大。用戶自定義函數象光標同樣執行的消耗大量的資源,若是返回大的結果採用存儲過程
4二、不要在一句話裏再三的使用相同的函數,浪費資源,將結果放在變量裏再調用更快
4三、Select COUNT(*)的效率教低,儘可能變通他的寫法,而EXISTS快.同時請注意區別: select count(Field of null) from Table 和 select count(Field of NOT null) from Table 的返回值是不一樣的!!!
4四、當服務器的內存夠多時,配製線程數量 = 最大鏈接數+5,這樣能發揮最大的效率;不然使用 配製線程數量<最大鏈接數啓用SQL SERVER的線程池來解決,若是仍是數量 = 最大鏈接數+5,嚴重的損害服務器的性能。
4五、按照必定的次序來訪問你的表。若是你先鎖住表A,再鎖住表B,那麼在全部的存儲過程當中都要按照這個順序來鎖定它們。若是你(不經意的)某個存儲過程當中先鎖定表B,再鎖定表A,這可能就會致使一個死鎖。若是鎖定順序沒有被預先詳細的設計好,死鎖很難被發現
4六、經過SQL Server Performance Monitor監視相應硬件的負載 Memory: Page Faults / sec計數器若是該值偶爾走高,代表當時有線程競爭內存。若是持續很高,則內存多是瓶頸。
Process:
一、% DPC Time 指在範例間隔期間處理器用在緩延程序調用(DPC)接收和提供服務的百分比。(DPC 正在運行的爲比標準間隔優先權低的間隔)。 因爲 DPC 是以特權模式執行的,DPC 時間的百分比爲特權時間百分比的一部分。這些時間單獨計算而且不屬於間隔計算總數的一部 分。這個總數顯示了做爲實例時間百分比的平均忙時。
二、%Processor Time計數器 若是該參數值持續超過95%,代表瓶頸是CPU。能夠考慮增長一個處理器或換一個更快的處理器。
三、% Privileged Time 指非閒置處理器時間用於特權模式的百分比。(特權模式是爲操做系統組件和操縱硬件驅動程序而設計的一種處理模式。它容許直接訪問硬件和全部內存。另外一種模式爲用戶模式,它是一種爲應用程序、環境分系統和整數分系統設計的一種有限處理模式。操做系統將應用程序線程轉換成特權模式以訪問操做系統服務)。特權時間的 % 包括爲間斷和 DPC 提供服務的時間。特權時間比率高多是因爲失敗設備產生的大數量的間隔而引發的。這個計數器將平均忙時做爲樣本時間的一部分顯示。
四、% User Time表示耗費CPU的數據庫操做,如排序,執行aggregate functions等。若是該值很高,可考慮增長索引,儘可能使用簡單的表聯接,水平分割大表格等方法來下降該值。 Physical Disk: Curretn Disk Queue Length計數器該值應不超過磁盤數的1.5~2倍。要提升性能,可增長磁盤。 SQLServer:Cache Hit Ratio計數器該值越高越好。若是持續低於80%,應考慮增長內存。 注意該參數值是從SQL Server啓動後,就一直累加記數,因此運行通過一段時間後,該值將不能反映系統當前值。
4七、分析select emp_name form employee where salary > 3000 在此語句中若salary是Float類型的,則優化器對其進行優化爲Convert(float,3000),由於3000是個整數,咱們應在編程時使用3000.0而不要等運行時讓DBMS進行轉化。一樣字符和整型數據的轉換。
4八、查詢的關聯同寫的順序
select a.personMemberID, * from chineseresume a,personmember b where personMemberID = b.referenceid and a.personMemberID = 'JCNPRH39681' (A = B ,B = '號碼')
select a.personMemberID, * from chineseresume a,personmember b where a.personMemberID = b.referenceid and a.personMemberID = 'JCNPRH39681' and b.referenceid = 'JCNPRH39681' (A = B ,B = '號碼', A = '號碼')
select a.personMemberID, * from chineseresume a,personmember b where b.referenceid = 'JCNPRH39681' and a.personMemberID = 'JCNPRH39681' (B = '號碼', A = '號碼')
4九、
(1)IF 沒有輸入負責人代碼 THEN code1=0 code2=9999 ELSE code1=code2=負責人代碼 END IF 執行SQL語句爲: Select 負責人名 FROM P2000 Where 負責人代碼>=:code1 AND負責人代碼 <=:code2
(2)IF 沒有輸入負責人代碼 THEN Select 負責人名 FROM P2000 ELSE code= 負責人代碼 Select 負責人代碼 FROM P2000 Where 負責人代碼=:code END IF 第一種方法只用了一條SQL語句,第二種方法用了兩條SQL語句。在沒有輸入負責人代碼時,第二種方法顯然比第一種方法執行效率高,由於它沒有限制條件; 在輸入了負責人代碼時,第二種方法仍然比第一種方法效率高,不只是少了一個限制條件,還因相等運算是最快的查詢運算。咱們寫程序不要怕麻煩
50、關於JOBCN如今查詢分頁的新方法(以下),用性能優化器分析性能的瓶頸,若是在I/O或者網絡的速度上,以下的方法優化切實有效,若是在CPU或者內存上,用如今的方法更好。請區分以下的方法,說明索引越小越好。
begin
DECLARE @local_variable table (FID int identity(1,1),ReferenceID varchar(20))
insert into @local_variable (ReferenceID)
select top 100000 ReferenceID from chineseresume order by ReferenceID
select * from @local_variable where Fid > 40 and fid <= 60
end
和
begin
DECLARE @local_variable table (FID int identity(1,1),ReferenceID varchar(20))
insert into @local_variable (ReferenceID)
select top 100000 ReferenceID from chineseresume order by updatedate
select * from @local_variable where Fid > 40 and fid <= 60
end
的不一樣
begin
create table #temp (FID int identity(1,1),ReferenceID varchar(20))
insert into #temp (ReferenceID)
select top 100000 ReferenceID from chineseresume order by updatedate
select * from #temp where Fid > 40 and fid <= 60 drop table #temp
end
存儲過程編寫經驗和優化措施
From:網頁教學網
1、適合讀者對象:數據庫開發程序員,數據庫的數據量不少,涉及到對SP(存儲過程)的優化的項目開發人員,對數據庫有濃厚興趣的人。
2、介紹:在數據庫的開發過程當中,常常會遇到複雜的業務邏輯和對數據庫的操做,這個時候就會用SP來封裝數據庫操做。若是項目的SP較多,書寫又沒有必定的規範,將會影響之後的系統維護困難和大SP邏輯的難以理解,另外若是數據庫的數據量大或者項目對SP 的性能要求很,就會遇到優化的問題,不然速度有可能很慢,通過親身經驗,一個通過優化過的SP要比一個性能差的SP的效率甚至高几百倍。
3、內容:
一、開發人員若是用到其餘庫的Table或View,務必在當前庫中創建View來實現跨庫操做,最好不要直接使用「databse.dbo.table_name」,由於sp_depends不能顯示出該SP所使用的跨庫table或view,不方便校驗。
二、開發人員在提交SP前,必須已經使用set showplan on分析過查詢計劃,作過自身的查詢優化檢查。
三、高程序運行效率,優化應用程序,在SP編寫過程當中應該注意如下幾點:
a)SQL的使用規範:
i. 儘可能避免大事務操做,慎用holdlock子句,提升系統併發能力。
ii. 儘可能避免反覆訪問同一張或幾張表,尤爲是數據量較大的表,能夠考慮先根據條件提取數據到臨時表中,而後再作鏈接。
iii. 儘可能避免使用遊標,由於遊標的效率較差,若是遊標操做的數據超過1萬行,那麼就應該改寫;若是使用了遊標,就要儘可能避免在遊標循環中再進行錶鏈接的操做。
iv. 注意where字句寫法,必須考慮語句順序,應該根據索引順序、範圍大小來肯定條件子句的先後順序,儘量的讓字段順序與索引順序相一致,範圍從大到小。
v. 不要在where子句中的「=」左邊進行函數、算術運算或其餘表達式運算,不然系統將可能沒法正確使用索引。
vi. 儘可能使用exists代替select count(1)來判斷是否存在記錄,count函數只有在統計表中全部行數時使用,並且count(1)比count(*)更有效率。
vii. 儘可能使用「>=」,不要使用「>」。
viii. 注意一些or子句和union子句之間的替換
ix. 注意表之間鏈接的數據類型,避免不一樣類型數據之間的鏈接。
x. 注意存儲過程當中參數和數據類型的關係。
xi. 注意insert、update操做的數據量,防止與其餘應用衝突。若是數據量超過200個數據頁面(400k),那麼系統將會進行鎖升級,頁級鎖會升級成表級鎖。
b)索引的使用規範:
i. 索引的建立要與應用結合考慮,建議大的OLTP表不要超過6個索引。
ii. 儘量的使用索引字段做爲查詢條件,尤爲是聚簇索引,必要時能夠經過index index_name來強制指定索引
iii. 避免對大表查詢時進行table scan,必要時考慮新建索引。
iv. 在使用索引字段做爲條件時,若是該索引是聯合索引,那麼必須使用到該索引中的第一個字段做爲條件時才能保證系統使用該索引,不然該索引將不會被使用。
v. 要注意索引的維護,週期性重建索引,從新編譯存儲過程。
c)tempdb的使用規範:
i. 儘可能避免使用distinct、order by、group by、having、join、cumpute,由於這些語句會加劇tempdb的負擔。
ii. 避免頻繁建立和刪除臨時表,減小系統表資源的消耗。
iii. 在新建臨時表時,若是一次性插入數據量很大,那麼可使用select into代替create table,避免log,提升速度;若是數據量不大,爲了緩和系統表的資源,建議先create table,而後insert。
iv. 若是臨時表的數據量較大,須要創建索引,那麼應該將建立臨時表和創建索引的過程放在單獨一個子存儲過程當中,這樣才能保證系統可以很好的使用到該臨時表的索引。
v. 若是使用到了臨時表,在存儲過程的最後務必將全部的臨時表顯式刪除,先truncate table,而後drop table,這樣能夠避免系統表的較長時間鎖定。
vi. 慎用大的臨時表與其餘大表的鏈接查詢和修改,減低系統表負擔,由於這種操做會在一條語句中屢次使用tempdb的系統表。
d)合理的算法使用:
根據上面已提到的SQL優化技術和ASE Tuning手冊中的SQL優化內容,結合實際應用,採用多種算法進行比較,以得到消耗資源最少、效率最高的方法。具體可用ASE調優命令:set statistics io on, set statistics time on , set showplan on 等。
解析:Microsoft SQL Server中的鎖模式
在SQL Server數據庫中加鎖時,除了能夠對不一樣的資源加鎖,還可使用不一樣程度的加鎖方式,即鎖有多種模式,SQL Server中鎖模式包括:
1.共享鎖 SQL Server中,共享鎖用於全部的只讀數據操做。共享鎖是非獨佔的,容許多個併發事務讀取其鎖定的資源。默認狀況下,數據被讀取後,SQL Server當即釋放共享鎖。例如,執行查詢「SELECT * FROM AUTHORS」時,首先鎖定第一頁,讀取以後,釋放對第一頁的鎖定,而後鎖定第二頁。這樣,就容許在讀操做過程當中,修改未被鎖定的第一頁。可是,事務隔離級別鏈接選項設置和SELECT語句中的鎖定設置均可以改變SQL Server的這種默認設置。例如,「 SELECT * FROM AUTHORS HOLDLOCK」就要求在整個查詢過程當中,保持對錶的鎖定,直到查詢完成才釋放鎖定。
2.更新鎖更新鎖在修改操做的初始化階段用來鎖定可能要被修改的資源,這樣能夠避免使用共享鎖形成的死鎖現象。由於使用共享鎖時,修改數據的操做分爲兩步,首先得到一個共享鎖,讀取數據,而後將共享鎖升級爲排它鎖,而後再執行修改操做。這樣若是同時有兩個或多個事務同時對一個事務申請了共享鎖,在修改數據的時候,這些事務都要將共享鎖升級爲排它鎖。這時,這些事務都不會釋放共享鎖而是一直等待對方釋放,這樣就形成了死鎖。若是一個數據在修改前直接申請更新鎖,在數據修改的時候再升級爲排它鎖,就能夠避免死鎖。
3.排它鎖 排它鎖是爲修改數據而保留的。它所鎖定的資源,其餘事務不能讀取也不能修改。
4.結構鎖 執行表的數據定義語言 (DDL) 操做(例如添加列或除去表)時使用架構修改 (Sch-M) 鎖。當編譯查詢時,使用架構穩定性 (Sch-S) 鎖。架構穩定性 (Sch-S) 鎖不阻塞任何事務鎖,包括排它鎖。所以在編譯查詢時,其它事務(包括在表上有排它鎖的事務)都能繼續運行。但不能在表上執行 DDL 操做。
5.意向鎖 意向鎖說明SQL Server有在資源的低層得到共享鎖或排它鎖的意向。例如,表級的共享意向鎖說明事務意圖將排它鎖釋放到表中的頁或者行。意向鎖又能夠分爲共享意向鎖、獨佔意向鎖和共享式獨佔意向鎖。共享意向鎖說明事務意圖在共享意向鎖所鎖定的低層資源上放置共享鎖來讀取數據。獨佔意向鎖說明事務意圖在共享意向鎖所鎖定的低層資源上放置排它鎖來修改數據。共享式排它鎖說明事務容許其餘事務使用共享鎖來讀取頂層資源,並意圖在該資源低層上放置排它鎖。
6.大容量更新鎖 當將數據大容量複製到表,且指定了 TABLOCK 提示或者使用 sp_tableoption 設置了 table lock on bulk 表選項時,將使用大容量更新鎖。大容量更新鎖容許進程將數據併發地大容量複製到同一表,同時防止其它不進行大容量複製數據的進程訪問該表。
詳細介紹優化SQL Server 2000的設置
SQL Server已經爲了優化本身的性能而進行了良好的配置,比今天市場其餘的關係型數據庫都要好得多。然而,你仍然有幾項設置須要進行修改,以便你的數據庫每分鐘能夠處理更多的事務(TPM)。本篇文章的目的就是討論這些設置。咱們忽略那些能夠經過硬件配置或者表或者索引設計提升的性能,由於這些內容在本篇文章範圍以外。
破碎頁面檢測
在咱們開始討論服務器配置開關以前,讓咱們快速瀏覽一下你的模型數據庫--或者說用做構建新的數據庫的基礎的模板。默認狀況下,你能夠在數據庫中建立存儲過程、函數等相似的東西,隨後他們將會被加入新建立的數據庫中。
要優化性能,你也許想要關閉模型數據庫中的破碎頁面檢測。當一個頁面被成功寫入磁盤的時候,破碎頁面檢測進行識別。若是激活了的話,你能夠看到每一個寫操做對性能產生的每一個細小的影響。大多數現代的磁盤陣列都有板上電池,使得陣列能夠在忽然斷電的狀況下完成全部的寫操做--引發破碎頁面的最頻繁緣由。
如下的步驟能夠接受如何關閉破碎頁面檢測:
exec sp_dboption 'model', 'torn page detection', 'false'
這篇基礎知識資源能夠爲你提供更多有關這個設置的信息。
大多數的配置是經過系統存儲過程sp_configure完成的。要顯示服務器的所有設置列表以便定製,你能夠輸入以下命令:
sp_configure 'show advanced options', 1
GO
RECONFIGURE WITH OVERRIDE
你能夠配置的選項的數量根據你的SQL Server的版本、服務包,以及位數版本(64位的SQL Server比32位的選項要多)而定。我將直接討論最能影響SQL Server性能優化的選項。
Affinity mask: Affinity mask讓你能夠控制SQL Server使用哪一個處理器。對於大多數狀況,你不該該接觸這個設置,讓操做系統控制處理器關係。然而,你也許想要用這個選項來將某個處理器專門用於另外一個進程(例如,MSSearch 或者 SQL Server磁盤 IO ,以及 SQL Server的平衡)。參考基礎知識資源獲取更多有關這個設置的信息。
Awe enabled: Awe的啓動可讓SQL Server Enterprise版本運行在Windows 2000以及以上高級服務器上,或者Windows 2003 Enterprise以及以上的版本使用超過4GB的內存。若是你的服務器符合這些條件的話,就激活這個設置吧。
並行成本極限:當查詢須要進行並行處理的時候,並行的成本極限就定下來了。默認狀況是五秒鐘。將這個數值改成稍低的數值,俄可讓更多個查詢得到並行處理,可是這也會引發CPU瓶頸。這個設置只有在多個處理器的機器上纔會起做用。
填充因子:填充因子設置了在建立聚簇索引的時候用來自動填充的因子。在頻繁插入的表中,將數值從默認的90%設置爲較低的數值,你會得到收益。
輕量級緩衝池:這個設置啓動了光纖模式。使用這個選項在CPU利用率很高的8路及其以上的服務器上。這可讓光纖同時爲每一個線程提供服務,同時在默認狀況下運行在每一個處理器上。某些任務能夠從這些光纖中得到優點。
並行的最大程度:當服務器可使用並行或者不能使用並行,或者是當某個數量的處理器能夠用於並行操做的時候,這個設置就肯定了。並行就是多個處理器上發生多個處理。例如,查詢的並行操做能夠在不一樣的處理器上同時處理。
服務器最大內存(MB):若是你在SQL Server上運行了其餘的處理,而且有足夠的內存,那麼你有可能想要留出512MB的內存給操做系統和這些進程。例如,你能夠在MSSearch或者在本地運行大量的代理的狀況下將其設置爲512。
最大工做線程:最大工做線程設置與ADO.net中的鏈接池有些相似。經過這個設置,任何超過限制(255個用戶)的用戶鏈接均可以在線程池中等待,直到爲某個鏈接服務的線程獲得釋放,就好像是ADO.net中的鏈接與鏈接池共享。若是你有很大量的鏈接,而且大量的內存,那麼你就能夠提升這個數值。
網絡包尺寸(B):這個設置控制了網絡中傳輸到你的客戶端的包的尺寸。在有損耗的網絡中(例如電話線),你可能想要將這個參數設置爲比較低的數值,墨人數值是4096。在鏈接良好的網絡中,你能夠提升這個設置,特別是涉及BLOB的大型批處理操做。
優先推動:這個設置爲SQL Server提供了處理器的推進。在任務管理器中,點擊進程標籤,定位SQL Server的位置,而後右擊它。選擇「設置優先級別」。注意,SQL Server應該運行在正常的優先級別上。輸入以下命令:
Sp_configure 'priority boost', 1
Reconfigure with override
而後從新啓動你的SQL Server。在任務管理器中察看SQL Server如今運行在什麼優先級別上。它應該是在高優先級上。SQL Server應該比其餘的用戶進程運行優先級別要高。在專用於SQL Server的服務器上使用這個設置。
總結
本篇討論了最多見的SQL Server優化設置。在作出改變以前和以後分別在測試環境中進行基線肯定是很是重要的,能夠據此來評估在典型的負載下,改變對你的系統的影響。
SQL Server 數據庫中關於死鎖的分析
SQL Server數據庫發生死鎖時不會像ORACLE那樣自動生成一個跟蹤文件。有時能夠在[管理]->[當前活動] 裏看到阻塞信息(有時SQL Server企業管理器會由於鎖太多而沒有響應).
設定跟蹤1204:
USE MASTER
DBCC TRACEON (1204,-1)
顯示當前啓用的全部跟蹤標記的狀態:
DBCC TRACESTATUS(-1)
取消跟蹤1204:
DBCC TRACEOFF (1204,-1)
在設定跟蹤1204後,會在數據庫的日誌文件裏顯示SQL Server數據庫死鎖時一些信息。但那些信息很難看懂,須要對照SQL Server聯機叢書仔細來看。根據PAG鎖要找到相關數據庫表的方法:
DBCC TRACEON (3604)
DBCC PAGE (db_id,file_id,page_no)
DBCC TRACEOFF (3604)
請參考sqlservercentral.com上更詳細的講解.但又從CSDN學到了一個找到死鎖緣由的方法。我稍加修改, 去掉了遊標操做並增長了一些提示信息,寫了一個系統存儲過程sp_who_lock.sql。代碼以下:
if exists (select * from dbo.sysobjects
where id = object_id(N'[dbo].[sp_who_lock]')
and OBJECTPROPERTY(id, N'IsProcedure') = 1)
drop procedure [dbo].[sp_who_lock]
GO
/********************************************************
// 建立 : fengyu 郵件 : maggiefengyu@tom.com
// 日期 :2004-04-30
// 修改 : 從http://www.csdn.net/develop/Read_Article.asp?id=26566
// 學習到並改寫
// 說明 : 查看數據庫裏阻塞和死鎖狀況
********************************************************/
use master
go
create procedure sp_who_lock
as
begin
declare @spid int,@bl int,
@intTransactionCountOnEntry int,
@intRowcount int,
@intCountProperties int,
@intCounter int
create table #tmp_lock_who (
id int identity(1,1),
spid smallint,
bl smallint)
IF @@ERROR<>0 RETURN @@ERROR
insert into #tmp_lock_who(spid,bl) select 0 ,blocked
from (select * from sysprocesses where blocked>0 ) a
where not exists(select * from (select * from sysprocesses
where blocked>0 ) b
where a.blocked=spid)
union select spid,blocked from sysprocesses where blocked>0
IF @@ERROR<>0 RETURN @@ERROR
-- 找到臨時表的記錄數
select @intCountProperties = Count(*),@intCounter = 1
from #tmp_lock_who
IF @@ERROR<>0 RETURN @@ERROR
if @intCountProperties=0
select '如今沒有阻塞和死鎖信息' as message
-- 循環開始
while @intCounter <= @intCountProperties
begin
-- 取第一條記錄
select @spid = spid,@bl = bl
from #tmp_lock_who where Id = @intCounter
begin
if @spid =0
select '引發數據庫死鎖的是: '+ CAST(@bl AS VARCHAR(10))
+ '進程號,其執行的SQL語法以下'
else
select '進程號SPID:'+ CAST(@spid AS VARCHAR(10))+ '被'
+ '進程號SPID:'+ CAST(@bl AS VARCHAR(10)) +'阻塞,其當前進程執行的SQL語法以下'
DBCC INPUTBUFFER (@bl )
end
-- 循環指針下移
set @intCounter = @intCounter + 1
end
drop table #tmp_lock_who
return 0
end
須要的時候直接調用:
sp_who_lock
就能夠查出引發死鎖的進程和SQL語句.
SQL Server自帶的系統存儲過程sp_who和sp_lock也能夠用來查找阻塞和死鎖, 但沒有這裏介紹的方法好用。若是想知道其它tracenum參數的含義,請看www.sqlservercentral.com文章
咱們還能夠設置鎖的超時時間(單位是毫秒), 來縮短死鎖可能影響的時間範圍:
例如:
use master
seelct @@lock_timeout
set lock_timeout 900000
-- 15分鐘
seelct @@lock_timeout
優化SQLServer索引的小技巧
SQL Server中有幾個可讓你檢測、調整和優化SQL Server性能的工具。在本文中,我將說明如何用SQL Server的工具來優化數據庫索引的使用,本文還涉及到有關索引的通常性知識。
關於索引的常識
影響到數據庫性能的最大因素就是索引。因爲該問題的複雜性,我只可能簡單的談談這個問題,不過關於這方面的問題,目前有好幾本不錯的書籍可供你參閱。我在這裏只討論兩種SQL Server索引,即clustered索引和nonclustered索引。當考察創建什麼類型的索引時,你應當考慮數據類型和保存這些數據的 column。一樣,你也必須考慮數據庫可能用到的查詢類型以及使用的最爲頻繁的查詢類型。
索引的類型
若是column保存了高度相關的數據,而且經常被順序訪問時,最好使用clustered索引,這是由於若是使用clustered索引,SQL Server會在物理上按升序(默認)或者降序重排數據列,這樣就能夠迅速的找到被查詢的數據。一樣,在搜尋控制在必定範圍內的狀況下,對這些 column也最好使用clustered索引。這是由於因爲物理上重排數據,每一個表格上只有一個clustered索引。
與上面狀況相反,若是columns包含的數據相關性較差,你可使用nonculstered索引。你能夠在一個表格中使用高達249個nonclustered索引--儘管我想象不出實際應用場合會用的上這麼多索引。
當表格使用主關鍵字(primary keys),默認狀況下SQL Server會自動對包含該關鍵字的column(s)創建一個獨有的cluster索引。很顯然,對這些column(s)創建獨有索引意味着主關鍵字的惟一性。當創建外關鍵字(foreign key)關係時,若是你打算頻繁使用它,那麼在外關鍵字cloumn上創建nonclustered索引不失爲一個好的方法。若是表格有 clustered索引,那麼它用一個鏈表來維護數據頁之間的關係。相反,若是表格沒有clustered索引,SQL Server將在一個堆棧中保存數據頁。
數據頁
當索引創建起來的時候,SQLServer就創建數據頁(datapage),數據頁是用以加速搜索的指針。當索引創建起來的時候,其對應的填充因子也即被設置。設置填充因子的目的是爲了指示該索引中數據頁的百分比。隨着時間的推移,數據庫的更新會消耗掉已有的空閒空間,這就會致使頁被拆分。頁拆分的後果是下降了索引的性能,於是使用該索引的查詢會致使數據存儲的支離破碎。當創建一個索引時,該索引的填充因子即被設置好了,所以填充因子不能動態維護。
爲了更新數據頁中的填充因子,咱們能夠中止舊有索引並重建索引,並從新設置填充因子(注意:這將影響到當前數據庫的運行,在重要場合請謹慎使用)。 DBCC INDEXDEFRAG和DBCC DBREINDEX是清除clustered和nonculstered索引碎片的兩個命令。INDEXDEFRAG是一種在線操做(也就是說,它不會阻塞其它表格動做,如查詢),而DBREINDEX則在物理上重建索引。在絕大多數狀況下,重建索引能夠更好的消除碎片,可是這個優勢是以阻塞當前發生在該索引所在表格上其它動做爲代價換取來得。當出現較大的碎片索引時,INDEXDEFRAG會花上一段比較長的時間,這是由於該命令的運行是基於小的交互塊(transactional block)。
填充因子
當你執行上述措施中的任何一個,數據庫引擎能夠更有效的返回編入索引的數據。關於填充因子(fillfactor)話題已經超出了本文的範疇,不過我仍是提醒你須要注意那些打算使用填充因子創建索引的表格。
在執行查詢時,SQL Server動態選擇使用哪一個索引。爲此,SQL Server根據每一個索引上分佈在該關鍵字上的統計量來決定使用哪一個索引。值得注意的是,通過平常的數據庫活動(如插入、刪除和更新表格),SQL Server用到的這些統計量可能已經「過時」了,須要更新。你能夠經過執行DBCC SHOWCONTIG來查看統計量的狀態。當你認爲統計量已經「過時」時,你能夠執行該表格的UPDATE STATISTICS命令,這樣SQL Server就刷新了關於該索引的信息了。
創建數據庫維護計劃
SQL Server提供了一種簡化並自動維護數據庫的工具。這個稱之爲數據庫維護計劃嚮導(Database Maintenance Plan Wizard ,DMPW)的工具也包括了對索引的優化。若是你運行這個嚮導,你會看到關於數據庫中關於索引的統計量,這些統計量做爲日誌工做並定時更新,這樣就減輕了手工重建索引所帶來的工做量。若是你不想自動按期刷新索引統計量,你還能夠在DMPW中選擇從新組織數據和數據頁,這將中止舊有索引並按特定的填充因子重建索引。
Sybase SQL Server索引的使用和優化
在應用系統中,尤爲在聯機事務處理系統中,對數據查詢及處理速度已成爲衡 量應用系統成敗的標準。而採用索引來加快數據處理速度也成爲廣大數據庫用戶所 接受的優化方法。
在良好的數據庫設計基礎上,能有效地使用索引是SQL Server取得高性能的基礎,SQL Server採用基於代價的優化模型,它對每個提交的有關表的查詢,決定是否使用索引或用哪個索引。由於查詢執行的大部分開銷是磁盤I/O,使用索引提升性能的一個主要目標是避免全表掃描,由於全表掃描須要從磁盤上讀表的每個數據頁,若是有索引指向數據值,則查詢只需讀幾回磁盤就能夠了。因此若是創建了合理的索引,優化器就能利用索引加速數據的查詢過程。可是,索引並不老是提升系統的性能,在增、刪、改操做中索引的存在會增長必定的工做量,所以,在適當的地方增長適當的索引並從不合理的地方刪除次優的索引,將有助於優化那些性能較差的SQL Server應用。實踐代表,合理的索引設計是創建在對各類查詢的分析和預測上的,只有正確地使索引與程序結合起來,才能產生最佳的優化方案。本文就SQL Server索引的性能問題進行了一些分析和實踐。
1、聚簇索引(clustered indexes)的使用
聚簇索引是一種對磁盤上實際數據從新組織以按指定的一個或多個列的值排序。因爲聚簇索引的索引頁面指針指向數據頁面,因此使用聚簇索引查找數據幾乎老是比使用非聚簇索引快。每張表只能建一個聚簇索引,而且建聚簇索引須要至少至關該表120%的附加空間,以存放該表的副本和索引中間頁。創建聚簇索引的思想是:
一、 大多數表都應該有聚簇索引或使用分區來下降對錶尾頁的競爭,在一個高事務的環境中,對最後一頁的封鎖嚴重影響系統的吞吐量。
二、在聚簇索引下,數據在物理上按順序排在數據頁上,重複值也排在一塊兒,於是在那些包含範圍檢查(between、<、<=、>、> =)或使用group by或order by的查詢時,一旦找到具備範圍中第一個鍵值的行,具備後續索引值的行保證物理上毗連在一塊兒而沒必要進一步搜索,避免了大範圍掃描,能夠大大提升查詢速度。
三、 在一個頻繁發生插入操做的表上創建聚簇索引時,不要建在具備單調上升值的列(如IDENTITY)上,不然會常常引發封鎖衝突。
四、 在聚簇索引中不要包含常常修改的列,由於碼值修改後,數據行必須移動到新的位置。
五、 選擇聚簇索引應基於where子句和鏈接操做的類型。聚簇索引的侯選列是:
● 主鍵列,該列在where子句中使用而且插入是隨機的。
● 按範圍存取的列,如pri_order > 100 and pri_order < 200 。
● 在group by或order by中使用的列。
● 不常常修改的列。
● 在鏈接操做中使用的列。
2、非聚簇索引(nonclustered indexes)的使用
SQL Server缺省狀況下創建的索引是非聚簇索引,因爲非聚簇索引不從新組織表中的數據,而是對每一行存儲索引列值並用一個指針指向數據所在的頁面。換句話說非聚簇索引具備在索引結構和數據自己之間的一個額外級。一個表若是沒有聚簇索引時,可有250個非聚簇索引。每一個非聚簇索引提供訪問數據的不一樣排序順序。在創建非聚簇索引時,要權衡索引對查詢速度的加快與下降修改速度之間的利弊。另外,還要考慮這些問題:
● 索引須要使用多少空間。
● 合適的列是否穩定。
● 索引鍵是如何選擇的,掃描效果是否更佳。
● 是否有許多重複值。
對更新頻繁的表來講,表上的非聚簇索引比聚簇索引和根本沒有索引須要更多的額外開銷。對移到新頁的每一行而言,指向該數據的每一個非聚簇索引的頁級行也必須更新,有時可能還須要索引頁的分理。從一個頁面刪除數據的進程也會有相似的開銷,另外,刪除進程還必須把數據移到頁面上部,以保證數據的連續性。因此,創建非聚簇索引要很是慎重。非聚簇索引常被用在如下狀況:
● 某列經常使用於集合函數(如Sum,....)。
● 某列經常使用於join,order by,group by。
● 查尋出的數據不超過表中數據量的20%。
3、覆蓋索引(covering indexes)的使用
覆蓋索引是指那些索引項中包含查尋所須要的所有信息的非聚簇索引,這 種索引之因此比較快也正是由於索引頁中包含了查尋所必須的數據,不需去訪 問數據頁。 若是非聚簇索引中包含結果數據,那麼它的查詢速度將快於聚簇索引。
可是因爲覆蓋索引的索引項比較多,要佔用比較大的空間。並且update 操 做會引發索引值改變。因此若是潛在的覆蓋查詢並不經常使用或不太關鍵,則覆蓋索引的增長反而會下降性能。
4、索引的選擇技術
p_detail是住房公積金管理系統中記錄我的明細的表,有890000行,觀察在不一樣索引下的查詢運行效果,測試在C/S環境下進行,客戶機是 IBM PII350(內存64M),服務器是DEC Alpha1000A(內存128M),數據庫爲SYBASE11.0.3。
一、 select count(*) from p_detail where op_date>’19990101’ and op_date<’19991231’ and pri_surplus1>300
二、 select count(*),sum(pri_surplus1) from p_detail where op_date>’19990101’ and pay_month between ‘199908’ and ’199912’
不建任何索引 查詢1 1分15秒
查詢2 1分7秒
在op_date上建非聚簇索引 查詢1 57秒
查詢2 57秒
在op_date上建聚簇索引 查詢1 <1秒
查詢2 52秒
在pay_month、op_date、pri_surplus1上建索引 查詢1 34秒
查詢2 <1秒
在op_date、pay_month、pri_surplus1上建索引 查詢1 <1秒
查詢2 <1秒
從以上查詢效果分析,索引的有無,創建方式的不一樣將會致使不一樣的查詢效果,選擇什麼樣的索引基於用戶對數據的查詢條件,這些條件體現於where從句和join表達式中。通常來講創建索引的思路是:
(1)、主鍵時常做爲where子句的條件,應在表的主鍵列上創建聚簇索引,尤爲當常常用它做爲鏈接的時候。
(2)、有大量重複值且常常有範圍查詢和排序、分組發生的列,或者很是頻繁地被訪問的列,可考慮創建聚簇索引。
(3)、常常同時存取多列,且每列都含有重複值可考慮創建複合索引來覆蓋一個或一組查詢,並把查詢引用最頻繁的列做爲前導列,若是可能儘可能使關鍵查詢造成覆蓋查詢。
(4)、若是知道索引鍵的全部值都是惟一的,那麼確保把索引定義成惟一索引。
(5)、在一個常常作插入操做的表上建索引時,使用fillfactor(填充因子)來減小頁分裂,同時提升併發度下降死鎖的發生。若是在只讀表上建索引,則能夠把fillfactor置爲100。
(6)、在選擇索引鍵時,設法選擇那些採用小數據類型的列做爲鍵以使每一個索
引頁可以容納儘量多的索引鍵和指針,經過這種方式,可以使一個查詢必須遍歷的索引頁面降到最小。此外,儘量地使用整數爲鍵值,由於它可以提供比任何數據類型都快的訪問速度。
5、索引的維護
上面講到,某些不合適的索引影響到SQL Server的性能,隨着應用系統的運行,數據不斷地發生變化,當數據變化達到某一個程度時將 會影響到索引的使用。這時 須要用戶本身來維護索引。索引的維護包括:
一、重建索引
隨着數據行的插入、刪除和數據頁的分裂,有些索引頁可能只包含幾頁數據,另外應用在執行大塊I/O的時候,重建非聚簇索引能夠下降分片,維護大塊I/O的效率。重建索引其實是從新組織B-樹空間。在下面狀況下須要重建索引:
(1)、數據和使用模式大幅度變化。
(2)、排序的順序發生改變。
(3)、要進行大量插入操做或已經完成。
(4)、使用大塊I/O的查詢的磁盤讀次數比預料的要多。
(5)、因爲大量數據修改,使得數據頁和索引頁沒有充分使用而致使空間的使用超出估算。
(6)、dbcc檢查出索引有問題。
當重建聚簇索引時,這張表的全部非聚簇索引將被重
建.
二、索引統計信息的更新
當在一個包含數據的表上建立索引的時候,SQL Server會建立分佈數據頁來存放有關索引的兩種統計信息:分佈表和密度表。優化器利用這個頁來判斷該索引對某個特定查詢是否有用。但這個統計信息並不動態地從新計算。這意味着,當表的數據改變以後,統計信息有多是過期的,從而影響優化器追求最有工做的目標。所以,在下面狀況下應該運行update statistics命令:
(1)、數據行的插入和刪除修改了數據的分佈。
(2)、對用truncate table刪除數據的表上增長數據行。
(3)、修改索引列的值。
6、結束語
實踐代表,不恰當的索引不但於事無補,反而會下降系統的執行性能。由於大量的索引在插入、修改和刪除操做時比沒有索引花費更多的系統時間。例以下面狀況下創建的索引是不恰當的:
● 在查詢中不多或從不引用的列不會受益於索引,由於索引不多或歷來沒必要搜索基於這些列的行。
● 只有兩個或三個值的列,如男性和女性(是或否),從不會從索引中獲得好處。
另外,鑑於索引加快了查詢速度,但減慢了數據更新速度的特色。可經過在一個段上建表,而在另外一個段上建其非聚簇索引,而這兩段分別在單獨的物理設備上來改善操做性能。