sql語句優化

性能不理想的系統中除了一部分是由於應用程序的負載確實超過了服務器的實際處理能力外,更多的是由於系統存在大量的SQL語句須要優化。java

爲了得到穩定的執行性能,SQL語句越簡單越好。對複雜的SQL語句,要設法對之進行簡化。mysql


常見的簡化規則以下:
 
1)不要有超過5個以上的錶鏈接(JOIN)
2)考慮使用臨時表或表變量存放中間結果。
3)少用子查詢
4)視圖嵌套不要過深,通常視圖嵌套不要超過2個爲宜。
 git

鏈接的表越多,其編譯的時間和鏈接的開銷也越大,性能越很差控制。sql

最好是把鏈接拆開成較小的幾個部分逐個順序執行。數據庫

優先執行那些可以大量減小結果的鏈接。編程

拆分的好處不只僅是減小SQL Server優化的時間,更使得SQL語句可以以你能夠預測的方式和順序執行。緩存


若是必定須要鏈接不少表才能獲得數據,那麼極可能意味着設計上的缺陷。服務器

 


鏈接是outer join,很是很差。由於outer join意味着必須對左表或右表查詢全部行。網絡

若是表很大而沒有相應的where語句,那麼outer join很容易致使table scan或index scan。併發

要儘可能使用inner join避免scan整個表。


優化建議:
 
1)使用臨時表存放t1表的結果,能大大減小logical reads(或返回行數)的操做要優先執行。

 仔細分析語句,你會發現where中的條件全是針對表t1的,因此直接使用上面的where子句查詢表t1,而後把結果存放再臨時表#t1中:
 
Select t1….. into #tt1 from t1 where…(和上面的where同樣)
 
2)再把#tt1和其餘表進行鏈接:
 
Select #t1…
Left outer join …
Left outer join…
 
 
3)修改 like 程序,去掉前置百分號。like語句卻由於前置百分號而沒法使用索引
4)從系統設計的角度修改語句,去掉outer join。
5)考慮組合索引或覆蓋索引消除clustered index scan。
 
上面1和2點建議當即消除了worktable,性能提升了幾倍以上,效果很是明顯。

 

 

 

1)限制結果集
 
要儘可能減小返回的結果行,包括行數和字段列數。

返回的結果越大,意味着相應的SQL語句的logical reads 就越大,對服務器的性能影響就越甚。

一個很很差的設計就是返回表的全部數據:
 
Select * from tablename
 
即便表很小也會致使併發問題。更壞的狀況是,若是表有上百萬行的話,那後果將是災難性的。

它不但可能帶來極重的磁盤IO,更有可能把數據庫緩衝區中的其餘緩存數據擠出,使得這些數據下次必須再從磁盤讀取。

必須設計良好的SQL語句,使得其有where語句或TOP語句來限制結果集大小。


2)合理的表設計
 
SQL Server 2005將支持表分區技術。利用表分區技術能夠實現數據表的流動窗口功能。

在流動窗口中能夠輕易的把歷史數據移出,把新的數據加入,從而使表的大小基本保持穩定。
 
另外,表的設計未必須要很是範式化。有必定的字段冗餘能夠增長SQL語句的效率,減小JOIN的數目,提升語句的執行速度。


3)OLAP和OLTP模塊要分開
 
OLAP和OLTP類型的語句是大相徑庭的。前者每每須要掃描整個表作統計分析,索引對這樣的語句幾乎沒有多少用處。

索引只可以加快那些如sum,group by之類的聚合運算。由於這個緣由,幾乎很難對OLAP類型的SQL語句進行優化。

而OLTP語句則只須要訪問表的很小一部分數據,並且這些數據每每能夠從內存緩存中獲得。

爲了不OLAP 和OLTP語句相互影響,這兩類模塊須要分開運行在不一樣服務器上。

由於OLAP語句幾乎都是讀取數據,沒有更新和寫入操做,因此一個好的經驗是配置一臺standby 服務器,而後OLAP只訪問standby服務器。


4)使用存儲過程
 
能夠考慮使用存儲過程封裝那些複雜的SQL語句或商業邏輯,這樣作有幾個好處。

一是存儲過程的執行計劃能夠被緩存在內存中較長時間,減小了從新編譯的時間。

二是存儲過程減小了客戶端和服務器的繁複交互。

三是若是程序發佈後須要作某些改變你能夠直接修改存儲過程而不用修改程序,避免須要從新安裝部署程序。


 

 

 索引優化

 
 
 
 
不少數據庫系統性能不理想是由於系統沒有通過總體優化,存在大量性能低下的SQL 語句。
 
這類SQL語句性能很差的首要緣由是缺少高效的索引。
 
沒有索引除了致使語句自己運行速度慢外,更是致使大量的磁盤讀寫操做,使得整個系統性能都受之影響而變差。
 
解決這類系統的首要辦法是優化這些沒有索引或索引不夠好的SQL語句。
 
 
 

建立索引的關鍵
 
 
優化SQL語句的關鍵是儘量減小語句的logical reads。
 
 
這裏說的logical reads是指語句執行時須要訪問的單位爲8K的數據頁總數。
 
logical reads 越少,其須要的內存和CPU時間也就越少,語句執行速度就越快。
 

不言而喻,索引的最大好處是它能夠極大減小SQL語句的logical reads數目,從而極大減小語句的執行時間。
 

建立索引的關鍵是索引要可以大大減小語句的logical reads。一個索引好很差,主要看它減小的logical reads多很少。
 
運行set statistics io命令能夠獲得SQL語句的logical reads信息。
 
 

set statistics io on
select au_id,au_lname ,au_fname 
from pubs..authors where au_lname ='Green'
set statistics io on
 

若是Logical reads很大,而返回的行數不多,也即二者相差較大,那麼每每意味者語句須要優化。
 

Logical reads中包含該語句從內存數據緩衝區中訪問的頁數和從物理磁盤讀取的頁數。
 

而physical reads表示那些沒有駐留在內存緩衝區中須要從磁盤讀取的數據頁。
 

Read-ahead reads是SQL Server爲了提升性能而產生的預讀。預讀可能會多讀取一些數據。 
 

優化的時候咱們主要關注Logical Reads就能夠了。
 

注意若是physical Reads或Read-ahead reads很大,那麼每每意味着語句的執行時間(duration)裏面會有一部分耗費在等待物理磁盤IO上。
 
 
 
 

2、單字段索引,組合索引和覆蓋索引
 

單字段索引是指只有一個字段的索引,而組合索引指有多個字段構成的索引。
 

1. 對出如今where子句中的字段加索引
 

set statistics profile on
set statistics io on
go
select .... from tb where ...
go
set statistics profile off
set statistics io off
 

set statistics profile命令將輸出語句的執行計劃。
 

也許你會問,爲何不用SET SHOWPLAN_ALL呢?使用SET SHOWPLAN_ALL也是能夠的。
 

不過set statistics profile輸出的是SQL 語句的運行時候真正使用的執行計劃,
 

而SET SHOWPLAN_ALL輸出的是預計(Estimate)的執行計劃。
 

使用SET SHOWPLAN_ALL是後面的語句並不會真正運行。
 
 
 

用了Table Scan,也就是對整個表進行了全表掃描。全表掃描的性能一般是不好的,要儘可能避免。
 

若是上面的select語句是數據庫系統常常運行的關鍵語句, 那麼應該對它建立相應的索引。
 

建立索引的技巧之一是對常常出如今where條件中的字段建立索引
 

Table Scan也變成了Index Seek,性能極大提升
 

設法避免Table scan或Index scan是優化SQL 語句使用的經常使用技巧。一般Index Seek須要的logical reads比前二者要少得多。
 
 
 
 
 
 

2.組合索引
 
若是where語句中有多個字段,那麼能夠考慮建立組合索引。
 

組合索引中字段的順序是很是重要的,越是惟一的字段越是要靠前。
 

另外,不管是組合索引仍是單個列的索引,儘可能不要選擇那些惟一性很低的字段。
 

好比說,在只有兩個值0和1的字段上創建索引沒有多大意義。
 
 
 

因此若是對單字段進行索引,建議使用set statistics profile來驗證索引確實被充分使用。logical reads越少的索引越好。
 
 
 

3.覆蓋索引
 

覆蓋索引可以使得語句不須要訪問表僅僅訪問索引就可以獲得全部須要的數據。
 

由於彙集索引葉子節點就是數據因此無所謂覆蓋與否,因此覆蓋索引主要是針對非彙集索引而言。

執行計劃中除了index seek外,還有一個Bookmark Lookup關鍵字。
 
 
Bookmark Lookup表示語句在訪問索引後還須要對錶進行額外的Bookmark Lookup操做才能獲得數據。
 

也就是說爲獲得一行數據起碼有兩次IO,一次訪問索引,一次訪問基本表。
 

若是語句返回的行數不少,那麼Bookmark Lookup操做的開銷是很大的。
 

覆蓋索引可以避免昂貴的Bookmark Lookup操做,減小IO的次數,提升語句的性能。
 

覆蓋索引須要包含select子句和WHERE子句中出現的全部字段。Where語句中的字段在前面,select中的在後面。
 

logical reads,是大大減小了。Bookmark Lookup操做也消失了。因此建立覆蓋索引是減小logical reads提高語句性能的很是有用的優化技巧。
 
 
 

實際上索引的建立原則是比較複雜的。有時候你沒法在索引中包含了Where子句中全部的字段。
 

在考慮索引是否應該包含一個字段時,應考慮該字段在語句中的做用。
 

好比說若是常常以某個字段做爲where條件做精確匹配返回不多的行,那麼就絕對值得爲這個字段創建索引。
 

再好比說,對那些很是惟一的字段如主鍵和外鍵,常常出如今group by,order by中的字段等等都值得建立索引。
 
 
 
 
 
 

問題1,是否值得在identity字段上創建彙集索引。
 

答案取決於identity 字段如何在語句中使用。若是你常常根據該字段搜索返回不多的行,那麼在其上創建索引是值得的。
 

反之若是identity字段根本不多在語句中使用,那麼就不該該對其創建任何索引。
 

 
問題2,一個表應該創建多少索引合適。
 

若是表的80%以上的語句都是讀操做,那麼索引能夠多些。可是不要太多。
 

特別是不要對那些更新頻繁的表其創建不少的索引。不多表有超過5個以上的索引。
 

過多的索引不但增長其佔用的磁盤空間,也增長了SQL Server 維護索引的開銷。
 

 
問題4:爲何SQL Server 在執行計劃中沒有使用你認爲應該使用的索引?緣由是多樣的。
 

一種緣由是該語句返回的結果超過了表的20%數據,使得SQL Server 認爲scan比seek更有效。
 
另外一種緣由多是表字段的statistics過時了,不能準確反映數據的分佈狀況。
 

你可使用命令UPDATE STATISTICS tablename with FULLSCAN來更新它。
 

只有同步的準確的statistics才能保證SQL Server 產生正確的執行計劃。
 

過期的老的statistics常會致使SQL Server生成不夠優化的甚至愚蠢的執行計劃。
 

因此若是你的表頻繁更新,而你又以爲和之相關的SQL語句運行緩慢,不妨試試UPDATE STATISTIC with FULLSCAN 語句。
 
 
 

問題五、什麼使用匯集索引,何時使用非彙集索引
 
在SQL Server 中索引有彙集索引和非彙集索引兩種。它們的主要差異是前者的索引葉子就是數據自己,然後者的葉子節點包含的是指向數據的書籤(即數據行號或彙集索引的key)。
 
 
對一個表而言彙集索引只能有一個,而非彙集索引能夠有多個。
 
 
 
只是彙集索引沒有Bookmark Lookup操做。
 
 
何時應該使用匯集索引?  何時使用非彙集索引? 取決於應用程序的訪問模式。
 
 
個人建議是在那些關鍵的字段上使用匯集索引。一個表通常都須要創建一個彙集索引。
 
 
對於何時使用匯集索引,SQL Server 2000聯機手冊中有以下描述:
 
在建立彙集索引以前,應先了解您的數據是如何被訪問的。可考慮將彙集索引用於:
 
 
包含大量非重複值的列。
 
 
使用下列運算符返回一個範圍值的查詢:BETWEEN、>、>=、< 和 <=。
 
 
被連續訪問的列。
 
 
返回大型結果集的查詢。
 
 
常常被使用聯接或 GROUP BY 子句的查詢訪問的列;通常來講,這些是外鍵列。
 
 
對 ORDER BY 或 GROUP BY 子句中指定的列進行索引,可使 SQL Server 沒必要對數據進行排序,由於這些行已經排序。這樣能夠提升查詢性能。
 
 
OLTP 類型的應用程序,這些程序要求進行很是快速的單行查找(通常經過主鍵)。應在主鍵上建立彙集索引。
 
 
 
彙集索引不適用於:
 
 
頻繁更改的列
 
 
這將致使整行移動(由於 SQL Server 必須按物理順序保留行中的數據值)。這一點要特別注意,由於在大數據量事務處理系統中數據是易失的。
 
 
寬鍵
 
  
來自彙集索引的鍵值由全部非彙集索引做爲查找鍵使用,所以存儲在每一個非彙集索引的葉條目內。
 
 
 
 
 
 
總結:
 
 
如何使一個性能緩慢的系統運行更快更高效,不但須要總體分析數據庫系統,找出系統的性能瓶頸,更須要優化數據庫系統發出的SQL 語句。
 
一旦找出關鍵的SQL 語句並加與優化,性能問題就會迎刃而解。
 
 
 

 

 

 

 

 

《 數據庫技術內幕 》

處理百萬級以上的數據提升查詢速度的方法:

 1.應儘可能避免在 where 子句中使用!=或<>操做符,不然將引擎放棄使用索引而進行全表掃描。

 2.對查詢進行優化,應儘可能避免全表掃描,首先應考慮在 where 及 order by 涉及的列上創建索引。

 3.應儘可能避免在 where 子句中對字段進行 null 值判斷,不然將致使引擎放棄使用索引而進行全表掃描,如:
     select id from t where num is null
     能夠在num上設置默認值0,確保表中num列沒有null值,而後這樣查詢:
     select id from t where num=0

 4.應儘可能避免在 where 子句中使用 or 來鏈接條件,不然將致使引擎放棄使用索引而進行全表掃描,如:
     select id from t where num=10 or num=20
     能夠這樣查詢:
     select id from t where num=10
     union all
     select id from t where num=20

 5.下面的查詢也將致使全表掃描:(不能前置百分號)
     select id from t where name like ‘%abc%’
    若要提升效率,能夠考慮全文檢索。

 6.in 和 not in 也要慎用,不然會致使全表掃描,如:
     select id from t where num in(1,2,3)
     對於連續的數值,能用 between 就不要用 in 了:
     select id from t where num between 1 and 3

select xx,phone FROM send  a JOIN (
 select '13891030091' phone  union select '13992085916' …………  UNION  SELECT '13619100234' ) b 
  on  a.Phone=b.phone
--替代下面  不少數據隔開的時候
in('13891030091','13992085916','13619100234'…………)

 

 

7.若是在 where 子句中使用參數,也會致使全表掃描。由於SQL只有在運行時纔會解析局部變量,但優化程序不能將訪問計劃的選擇推遲到運行時;它必須在編譯時進行選擇。然 而,若是在編譯時創建訪問計劃,變量的值仍是未知的,於是沒法做爲索引選擇的輸入項。以下面語句將進行全表掃描:
     select id from t where num=@num     能夠改成強制查詢使用索引:
     select id from t with(index(索引名)) where num=@num

 8.應儘可能避免在 where 子句中對字段進行表達式操做,這將致使引擎放棄使用索引而進行全表掃描。如:
     select id from t where num/2=100
     應改成:
     select id from t where num=100*2

 9.應儘可能避免在where子句中對字段進行函數操做,這將致使引擎放棄使用索引而進行全表掃描。如:
     select id from t where substring(name,1,3)=’abc’–name以abc開頭的id
     select id from t where datediff(day,createdate,’2005-11-30′)=0–’2005-11-30′生成的id
     應改成:
     select id from t where name like ‘abc%’
     select id from t where createdate>=’2005-11-30′ and createdate<’2005-12-1′

 10.不要在 where 子句中的「=」左邊進行函數、算術運算或其餘表達式運算,不然系統將可能沒法正確使用索引。

 11.在使用索引字段做爲條件時,若是該索引是複合索引,那麼必須使用到該索引中的第一個字段做爲條件時才能保證系統使用該索引,不然該索引將不會被使 用,而且應儘量的讓字段順序與索引順序相一致。

 12.不要寫一些沒有意義的查詢,如須要生成一個空表結構:
     select col1,col2 into #t from t where 1=0
     這類代碼不會返回任何結果集,可是會消耗系統資源的,應改爲這樣:
     create table #t(…)

 13.不少時候用 exists 代替 in 是一個好的選擇:
     select num from a where num in(select num from b)
     用下面的語句替換:
     select num from a where exists(select 1 from b where num=a.num)

 14.並非全部索引對查詢都有效,SQL是根據表中數據來進行查詢優化的,當索引列有大量數據重複時,SQL查詢可能不會去利用索引,如一表中有字段 sex,male、female幾乎各一半,那麼即便在sex上建了索引也對查詢效率起不了做用。

 15.索引並非越多越好,索引當然能夠提升相應的 select 的效率,但同時也下降了 insert 及 update 的效率,由於 insert 或 update 時有可能會重建索引,因此怎樣建索引須要慎重考慮,視具體狀況而定。一個表的索引數最好不要超過6個,若太多則應考慮一些不常使用到的列上建的索引是否有 必要。

 16.應儘量的避免更新 clustered 索引數據列,由於 clustered 索引數據列的順序就是表記錄的物理存儲順序,一旦該列值改變將致使整個表記錄的順序的調整,會耗費至關大的資源。若應用系統須要頻繁更新 clustered 索引數據列,那麼須要考慮是否應將該索引建爲 clustered 索引。

 17.儘可能使用數字型字段,若只含數值信息的字段儘可能不要設計爲字符型,這會下降查詢和鏈接的性能,並會增長存儲開銷。這是由於引擎在處理查詢和鏈接時會 逐個比較字符串中每個字符,而對於數字型而言只須要比較一次就夠了。

 18.儘量的使用 varchar/nvarchar 代替 char/nchar ,由於首先變長字段存儲空間小,能夠節省存儲空間,其次對於查詢來講,在一個相對較小的字段內搜索效率顯然要高些。

 19.任何地方都不要使用 select * from t ,用具體的字段列表代替「*」,不要返回用不到的任何字段。

 20.儘可能使用表變量來代替臨時表。若是表變量包含大量數據,請注意索引很是有限(只有主鍵索引)。

 21.避免頻繁建立和刪除臨時表,以減小系統表資源的消耗。

 22.臨時表並非不可以使用,適當地使用它們可使某些例程更有效,例如,當須要重複引用大型表或經常使用表中的某個數據集時。可是,對於一次性事件,最好使 用導出表。

 23.在新建臨時表時,若是一次性插入數據量很大,那麼可使用 select into 代替 create table,避免形成大量 log ,以提升速度;若是數據量不大,爲了緩和系統表的資源,應先create table,而後insert。

 24.若是使用到了臨時表,在存儲過程的最後務必將全部的臨時表顯式刪除,先 truncate table ,而後 drop table ,這樣能夠避免系統表的較長時間鎖定。

 25.儘可能避免使用遊標,由於遊標的效率較差,若是遊標操做的數據超過1萬行,那麼就應該考慮改寫。

 26.使用基於遊標的方法或臨時表方法以前,應先尋找基於集的解決方案來解決問題,基於集的方法一般更有效。

 27.與臨時表同樣,遊標並非不可以使用。對小型數據集使用 FAST_FORWARD 遊標一般要優於其餘逐行處理方法,尤爲是在必須引用幾個表才能得到所需的數據時。在結果集中包括「合計」的例程一般要比使用遊標執行的速度快。若是開發時 間容許,基於遊標的方法和基於集的方法均可以嘗試一下,看哪種方法的效果更好。

 28.在全部的存儲過程和觸發器的開始處設置 SET NOCOUNT ON ,在結束時設置 SET NOCOUNT OFF 。無需在執行存儲過程和觸發器的每一個語句後向客戶端發送 DONE_IN_PROC 消息。

 29.儘可能避免向客戶端返回大數據量,若數據量過大,應該考慮相應需求是否合理。

 30.儘可能避免大事務操做,提升系統併發能力。



查詢速度慢的緣由:

一、沒有索引或者沒有用到索引(這是查詢慢最多見的問題,是程序設計的缺陷) 
 
二、I/O吞吐量小,造成了瓶頸效應。  

三、沒有建立計算列致使查詢不優化。 
 
四、內存不足  

五、網絡速度慢  

六、查詢出的數據量過大(能夠採用屢次查詢,其餘的方法下降數據量)  

七、鎖或者死鎖(這也是查詢慢最多見的問題,是程序設計的缺陷)  

八、sp_lock,sp_who,活動的用戶查看,緣由是讀寫競爭資源。
  
九、返回了沒必要要的行和列  

十、查詢語句很差,沒有優化  

能夠經過以下方法來優化查詢  

一、把數據、日誌、索引放到不一樣的I/O設備上,增長讀取速度,之前能夠將Tempdb應放在RAID0上,SQL2000不在支持。數據量(尺寸)越大,提升I/O越重要.  

二、縱向、橫向分割表,減小表的尺寸(sp_spaceuse)  

三、升級硬件  

四、根據查詢條件,創建索引,優化索引、優化訪問方式,限制結果集的數據量。注意填充因子要適當(最好是使用默認值0)。索引應該儘可能小,使用字節數小的列建索引好(參照索引的建立),不要對有限的幾個值的字段建單一索引如性別字段  

五、提升網速;  

六、擴大服務器的內存,Windows   2000和SQL   server   2000能支持4-8G的內存。配置虛擬內存:虛擬內存大小應基於計算機上併發運行的服務進行配置。運行   Microsoft   SQL   Server?   2000   時,可考慮將虛擬內存大小設置爲計算機中安裝的物理內存的   1.5   倍。若是另外安裝了全文檢索功能,並打算運行   Microsoft   搜索服務以便執行全文索引和查詢,可考慮:將虛擬內存大小配置爲至少是計算機中安裝的物理內存的   3   倍。將   SQL   Server   max   server   memory   服務器配置選項配置爲物理內存的   1.5   倍(虛擬內存大小設置的一半)。  

七、增長服務器CPU個數;可是必須明白並行處理串行處理更須要資源例如內存。使用並行仍是串行程是MsSQL自動評估選擇的。單個任務分解成多個任務,就能夠在處理器上運行。例如耽擱查詢的排序、鏈接、掃描和GROUP   BY字句同時執行,SQL   SERVER根據系統的負載狀況決定最優的並行等級,複雜的須要消耗大量的CPU的查詢最適合並行處理。可是更新操做UPDATE,INSERT, DELETE還不能並行處理。  

八、若是是使用like進行查詢的話,簡單的使用index是不行的,可是全文索引,耗空間。   like   'a%'   使用索引   like   '%a'   不使用索引用   like   '%a%'   查詢時,查詢耗時和字段值總長度成正比,因此不能用CHAR類型,而是VARCHAR。對於字段的值很長的建全文索引。  

九、DB   Server   和APPLication   Server   分離;OLTP和OLAP分離  

十、分佈式分區視圖可用於實現數據庫服務器聯合體。聯合體是一組分開管理的服務器,但它們相互協做分擔系統的處理負荷。這種經過分區數據造成數據庫服務器聯合體的機制可以擴大一組服務器,以支持大型的多層   Web   站點的處理須要。有關更多信息,參見設計聯合數據庫服務器。(參照SQL幫助文件'分區視圖')  
    a、在實現分區視圖以前,必須先水平分區表  
    b、在建立成員表後,在每一個成員服務器上定義一個分佈式分區視圖,而且每一個視圖具備相同的名稱。這樣,引用分佈式分區視圖名的查詢能夠在任何一個成員服務器上運行。系統操做如同每一個成員服務器上都有一個原始表的複本同樣,但其實每一個服務器上只有一個成員表和一個分佈式分區視圖。數據的位置對應用程序是透明的。  

十一、重建索引   DBCC   REINDEX   ,DBCC   INDEXDEFRAG,收縮數據和日誌   DBCC   SHRINKDB,DBCC   SHRINKFILE.   設置自動收縮日誌.對於大的數據庫不要設置數據庫自動增加,它會下降服務器的性能。   在T-sql的寫法上有很大的講究,下面列出常見的要點:首先,DBMS處理查詢計劃的過程是這樣的:  
    一、   查詢語句的詞法、語法檢查          
    二、   將語句提交給DBMS的查詢優化器  
    三、   優化器作代數優化和存取路徑的優化  
    四、   由預編譯模塊生成查詢規劃  
    五、   而後在合適的時間提交給系統處理執行  
    六、   最後將執行結果返回給用戶其次,看一下SQL   SERVER的數據存放的結構:一個頁面的大小爲8K(8060)字節,8個頁面爲一個盤區,按照B樹存放。  

十二、Commit和rollback的區別   Rollback:回滾全部的事物。   Commit:提交當前的事物.   沒有必要在動態SQL裏寫事物,若是要寫請寫在外面如:   begin   tran   exec(@s)   commit   trans   或者將動態SQL   寫成函數或者存儲過程。  

1三、在查詢Select語句中用Where字句限制返回的行數,避免表掃描,若是返回沒必要要的數據,浪費了服務器的I/O資源,加劇了網絡的負擔下降性能。若是表很大,在表掃描的期間將表鎖住,禁止其餘的聯接訪問表,後果嚴重。  

1四、SQL的註釋申明對執行沒有任何影響  

1五、儘量不使用遊標,它佔用大量的資源。若是須要row-by-row地執行,儘可能採用非光標技術,如:在客戶端循環,用臨時表,Table變量,用子查詢,用Case語句等等。遊標能夠按照它所支持的提取選項進行分類:   只進   必須按照從第一行到最後一行的順序提取行。FETCH   NEXT   是惟一容許的提取操做,也是默認方式。可滾動性   能夠在遊標中任何地方隨機提取任意行。遊標的技術在SQL2000下變得功能很強大,他的目的是支持循環。  
有四個併發選項  
READ_ONLY:不容許經過遊標定位更新(Update),且在組成結果集的行中沒有鎖。  
OPTIMISTIC   WITH   valueS:樂觀併發控制是事務控制理論的一個標準部分。樂觀併發控制用於這樣的情形,即在打開遊標及更新行的間隔中,只有很小的機會讓第二個用戶更新某一行。當某個遊標以此選項打開時,沒有鎖控制其中的行,這將有助於最大化其處理能力。若是用戶試圖修改某一行,則此行的當前值會與最後一次提取此行時獲取的值進行比較。若是任何值發生改變,則服務器就會知道其餘人已更新了此行,並會返回一個錯誤。若是值是同樣的,服務器就執行修改。   選擇這個併發選項OPTIMISTIC   WITH   ROW   VERSIONING:此樂觀併發控制選項基於行版本控制。使用行版本控制,其中的表必須具備某種版本標識符,服務器可用它來肯定該行在讀入遊標後是否有所更改。  
在   SQL   Server   中,這個性能由   timestamp   數據類型提供,它是一個二進制數字,表示數據庫中更改的相對順序。每一個數據庫都有一個全局當前時間戳值:@@DBTS。每次以任何方式更改帶有   timestamp   列的行時,SQL   Server   先在時間戳列中存儲當前的   @@DBTS   值,而後增長   @@DBTS   的值。若是某   個表具備   timestamp   列,則時間戳會被記到行級。服務器就能夠比較某行的當前時間戳值和上次提取時所存儲的時間戳值,從而肯定該行是否已更新。服務器沒必要比較全部列的值,只需比較   timestamp   列便可。若是應用程序對沒有   timestamp   列的表要求基於行版本控制的樂觀併發,則遊標默認爲基於數值的樂觀併發控制。  
SCROLL   LOCKS   這個選項實現悲觀併發控制。在悲觀併發控制中,在把數據庫的行讀入遊標結果集時,應用程序將試圖鎖定數據庫行。在使用服務器遊標時,將行讀入遊標時會在其上放置一個更新鎖。若是在事務內打開遊標,則該事務更新鎖將一直保持到事務被提交或回滾;當提取下一行時,將除去遊標鎖。若是在事務外打開遊標,則提取下一行時,鎖就被丟棄。所以,每當用戶須要徹底的悲觀併發控制時,遊標都應在事務內打開。更新鎖將阻止任何其它任務獲取更新鎖或排它鎖,從而阻止其它任務更新該行。  
然而,更新鎖並不阻止共享鎖,因此它不會阻止其它任務讀取行,除非第二個任務也在要求帶更新鎖的讀取。滾動鎖根據在遊標定義的   SELECT   語句中指定的鎖提示,這些遊標併發選項能夠生成滾動鎖。滾動鎖在提取時在每行上獲取,並保持到下次提取或者遊標關閉,以先發生者爲準。下次提取時,服務器爲新提取中的行獲取滾動鎖,並釋放上次提取中行的滾動鎖。滾動鎖獨立於事務鎖,並能夠保持到一個提交或回滾操做以後。若是提交時關閉遊標的選項爲關,則   COMMIT   語句並不關閉任何打開的遊標,並且滾動鎖被保留到提交以後,以維護對所提取數據的隔離。所獲取滾動鎖的類型取決於遊標併發選項和遊標   SELECT   語句中的鎖提示。  
鎖提示   只讀   樂觀數值   樂觀行版本控制   鎖定無提示   未鎖定   未鎖定   未鎖定   更新   NOLOCK   未鎖定   未鎖定   未鎖定   未鎖定   HOLDLOCK   共享   共享   共享   更新   UPDLOCK   錯誤   更新   更新   更新   TABLOCKX   錯誤   未鎖定   未鎖定   更新其它   未鎖定   未鎖定   未鎖定   更新   *指定   NOLOCK   提示將使指定了該提示的表在遊標內是隻讀的。  

1六、用Profiler來跟蹤查詢,獲得查詢所需的時間,找出SQL的問題所在;用索引優化器優化索引  

1七、注意UNion和UNion   all   的區別。UNION   all好  

1八、注意使用DISTINCT,在沒有必要時不要用,它同UNION同樣會使查詢變慢。重複的記錄在查詢裏是沒有問題的  

1九、查詢時不要返回不須要的行、列  

20、用sp_configure   'query   governor   cost   limit'或者SET   QUERY_GOVERNOR_COST_LIMIT來限制查詢消耗的資源。當評估查詢消耗的資源超出限制時,服務器自動取消查詢,在查詢以前就扼殺掉。 SET   LOCKTIME設置鎖的時間  

2一、用select   top   100   /   10   Percent   來限制用戶返回的行數或者SET   ROWCOUNT來限制操做的行  

2二、在SQL2000之前,通常不要用以下的字句 「IS   NULL",   " <> ",   "!=",   "!> ",   "! <",   "NOT",   "NOT   EXISTS",   "NOT   IN",   "NOT   LIKE",   and   "LIKE   '%500'",由於他們不走索引全是表掃描。
也不要在WHere字句中的列名加函數,如Convert,substring等,若是必須用函數的時候,建立計算列再建立索引來替代.還能夠變通寫法:WHERE   SUBSTRING(firstname,1,1)   =   'm'改成WHERE   firstname   like   'm%'(索引掃描),必定要將函數和列名分開。而且索引不能建得太多和太大。
NOT   IN會屢次掃描表,使用EXISTS、NOT   EXISTS   ,IN   ,   LEFT   OUTER   JOIN   來替代,特別是左鏈接,而Exists比IN更快,最慢的是NOT操做.若是列的值含有空,之前它的索引不起做用,如今2000的優化器可以處理了。相同的是IS   NULL,「NOT",   "NOT   EXISTS",   "NOT   IN"能優化她,而」 <> 」等仍是不能優化,用不到索引。  

2三、使用Query   Analyzer,查看SQL語句的查詢計劃和評估分析是不是優化的SQL。通常的20%的代碼佔據了80%的資源,咱們優化的重點是這些慢的地方。  

2四、若是使用了IN或者OR等時發現查詢沒有走索引,使用顯示申明指定索引:   SELECT   *   FROM   PersonMember   (INDEX   =   IX_Title)   WHERE   processid   IN   (‘男’,‘女’)  

2五、將須要查詢的結果預先計算好放在表中,查詢的時候再SELECT。這在SQL7.0之前是最重要的手段。例如醫院的住院費計算。  

2六、MIN()   和   MAX()能使用到合適的索引  

2七、數據庫有一個原則是代碼離數據越近越好,因此優先選擇Default,依次爲Rules,Triggers,   Constraint(約束如外健主健CheckUNIQUE……,數據類型的最大長度等等都是約束),Procedure.這樣不只維護工做小,編寫程序質量高,而且執行的速度快。  

2八、若是要插入大的二進制值到Image列,使用存儲過程,千萬不要用內嵌INsert來插入(不知Java是否)。由於這樣應用程序首先將二進制值轉換成字符串(尺寸是它的兩倍),服務器受到字符後又將他轉換成二進制值.存儲過程就沒有這些動做:   方法:Create   procedure   p_insert   as   insert   into   table(Fimage)   values   (@image),   在前臺調用這個存儲過程傳入二進制參數,這樣處理速度明顯改善。  

2九、Between在某些時候比IN速度更快,Between可以更快地根據索引找到範圍。用查詢優化器可見到差異。   select   *   from   chineseresume   where   title   in   ('男','女')   Select   *   from   chineseresume   where   between   '男'   and   '女'   是同樣的。因爲in會在比較屢次,因此有時會慢些。  

30、在必要是對全局或者局部臨時表建立索引,有時可以提升速度,但不是必定會這樣,由於索引也耗費大量的資源。他的建立同是實際表同樣。  

3一、不要建沒有做用的事物例如產生報表時,浪費資源。只有在必要使用事物時使用它。  

3二、用OR的字句能夠分解成多個查詢,而且經過UNION   鏈接多個查詢。他們的速度只同是否使用索引有關,若是查詢須要用到聯合索引,用UNION   all執行的效率更高.多個OR的字句沒有用到索引,改寫成UNION的形式再試圖與索引匹配。一個關鍵的問題是否用到索引。  

3三、儘可能少用視圖,它的效率低。對視圖操做比直接對錶操做慢,能夠用stored   procedure來代替她。特別的是不要用視圖嵌套,嵌套視圖增長了尋找原始資料的難度。咱們看視圖的本質:它是存放在服務器上的被優化好了的已經產生了查詢規劃的SQL。對單個表檢索數據時,不要使用指向多個表的視圖,直接從表檢索或者僅僅包含這個表的視圖上讀,不然增長了沒必要要的開銷,查詢受到干擾.爲了加快視圖的查詢,MsSQL增長了視圖索引的功能。  

3四、沒有必要時不要用DISTINCT和ORDER   BY,這些動做能夠改在客戶端執行。它們增長了額外的開銷。這同UNION   和UNION   ALL同樣的道理。   SELECT   top   20   ad.companyname,comid,position,ad.referenceid,worklocation,   convert(varchar(10),ad.postDate,120)   as   postDate1,workyear,degreedescription   FROM   jobcn_query.dbo.COMPANYAD_query   ad   where   referenceID   in('JCNAD00329667','JCNAD132168','JCNAD00337748','JCNAD00338345','JCNAD00333138','JCNAD00303570',   'JCNAD00303569','JCNAD00303568','JCNAD00306698','JCNAD00231935','JCNAD00231933','JCNAD00254567',   'JCNAD00254585','JCNAD00254608','JCNAD00254607','JCNAD00258524','JCNAD00332133','JCNAD00268618',   'JCNAD00279196','JCNAD00268613')   order   by   postdate   desc  

3五、在IN後面值的列表中,將出現最頻繁的值放在最前面,出現得最少的放在最後面,減小判斷的次數  

3六、當用SELECT   INTO時,它會鎖住系統表(sysobjects,sysindexes等等),阻塞其餘的鏈接的存取。建立臨時表時用顯示申明語句,而不是 select   INTO.   drop   table   t_lxh   begin   tran   select   *   into   t_lxh   from   chineseresume   where   name   =   'XYZ'   --commit   在另外一個鏈接中SELECT   *   from   sysobjects能夠看到   SELECT   INTO   會鎖住系統表,Create   table   也會鎖系統表(無論是臨時表仍是系統表)。因此千萬不要在事物內使用它!!!這樣的話若是是常常要用的臨時表請使用實表,或者臨時表變量。  

3七、通常在GROUP   BY   個HAVING字句以前就能剔除多餘的行,因此儘可能不要用它們來作剔除行的工做。他們的執行順序應該以下最優:select   的Where字句選擇全部合適的行,Group   By用來分組個統計行,Having字句用來剔除多餘的分組。這樣Group   By   個Having的開銷小,查詢快.對於大的數據行進行分組和Having十分消耗資源。若是Group   BY的目的不包括計算,只是分組,那麼用Distinct更快  

3八、一次更新多條記錄比分屢次更新每次一條快,就是說批處理好  

3九、少用臨時表,儘可能用結果集和Table類性的變量來代替它,Table   類型的變量比臨時表好  

40、在SQL2000下,計算字段是能夠索引的,須要知足的條件以下:  

  a、計算字段的表達是肯定的  
  b、不能用在TEXT,Ntext,Image數據類型  
  c、必須配製以下選項   ANSI_NULLS   =   ON,   ANSI_PADDINGS   =   ON,   …….  

4一、儘可能將數據的處理工做放在服務器上,減小網絡的開銷,如使用存儲過程。存儲過程是編譯好、優化過、而且被組織到一個執行規劃裏、且存儲在數據庫中的 SQL語句,是控制流語言的集合,速度固然快。反覆執行的動態SQL,可使用臨時存儲過程,該過程(臨時表)被放在Tempdb中。之前因爲SQL   SERVER對複雜的數學計算不支持,因此不得不將這個工做放在其餘的層上而增長網絡的開銷。SQL2000支持UDFs,如今支持複雜的數學計算,函數的返回值不要太大,這樣的開銷很大。用戶自定義函數象光標同樣執行的消耗大量的資源,若是返回大的結果採用存儲過程  

4二、不要在一句話裏再三的使用相同的函數,浪費資源,將結果放在變量裏再調用更快  

4三、SELECT   COUNT(*)的效率教低,儘可能變通他的寫法,而EXISTS快.同時請注意區別:   select   count(Field   of   null)   from   Table   和   select   count(Field   of   NOT   null)   from   Table   的返回值是不一樣的。  

4四、當服務器的內存夠多時,配製線程數量   =   最大鏈接數+5,這樣能發揮最大的效率;不然使用   配製線程數量 <最大鏈接數啓用SQL   SERVER的線程池來解決,若是仍是數量   =   最大鏈接數+5,嚴重的損害服務器的性能。  

4五、按照必定的次序來訪問你的表。若是你先鎖住表A,再鎖住表B,那麼在全部的存儲過程當中都要按照這個順序來鎖定它們。若是你(不經意的)某個存儲過程當中先鎖定表B,再鎖定表A,這可能就會致使一個死鎖。若是鎖定順序沒有被預先詳細的設計好,死鎖很難被發現  

4六、經過SQL   Server   Performance   Monitor監視相應硬件的負載   Memory:   Page   Faults   /   sec計數器若是該值偶爾走高,代表當時有線程競爭內存。若是持續很高,則內存多是瓶頸。   Process:  

    一、%   DPC   Time   指在範例間隔期間處理器用在緩延程序調用(DPC)接收和提供服務的百分比。(DPC   正在運行的爲比標準間隔優先權低的間隔)。   因爲   DPC   是以特權模式執行的,DPC   時間的百分比爲特權時間   百分比的一部分。這些時間單獨計算而且不屬於間隔計算總數的一部   分。這個總數顯示了做爲實例時間百分比的平均忙時。  
    二、%Processor   Time計數器 若是該參數值持續超過95%,代表瓶頸是CPU。能夠考慮增長一個處理器或換一個更快的處理器。  
    三、%   Privileged   Time   指非閒置處理器時間用於特權模式的百分比。(特權模式是爲操做系統組件和操縱硬件驅動程序而設計的一種處理模式。它容許直接訪問硬件和全部內存。另外一種模式爲用戶模式,它是一種爲應用程序、環境分系統和整數分系統設計的一種有限處理模式。操做系統將應用程序線程轉換成特權模式以訪問操做系統服務)。   特權時間的   %   包括爲間斷和   DPC   提供服務的時間。特權時間比率高多是因爲失敗設備產生的大數量的間隔而引發的。這個計數器將平均忙時做爲樣本時間的一部分顯示。      四、%   User   Time表示耗費CPU的數據庫操做,如排序,執行aggregate   functions等。若是該值很高,可考慮增長索引,儘可能使用簡單的表聯接,水平分割大表格等方法來下降該值。   Physical   Disk:   Curretn   Disk   Queue   Length計數器該值應不超過磁盤數的1.5~2倍。要提升性能,可增長磁盤。   SQLServer:Cache   Hit   Ratio計數器該值越高越好。若是持續低於80%,應考慮增長內存。   注意該參數值是從SQL   Server啓動後,就一直累加記數,因此運行通過一段時間後,該值將不能反映系統當前值。  4七、分析select   emp_name   form   employee   where   salary   >   3000   在此語句中若salary是Float類型的,則優化器對其進行優化爲Convert(float,3000),由於3000是個整數,咱們應在編程時使用3000.0而不要等運行時讓DBMS進行轉化。一樣字符和整型數據的轉換。

相關文章
相關標籤/搜索