在SQL Server中Count(*)或者Count(1)或者Count([列])或許是最經常使用的聚合函數。不少人其實對這三者之間是區分不清的。本文會闡述這三者的做用,關係以及背後的原理。數據庫
往常我常常會看到一些所謂的優化建議不使用Count(* )而是使用Count(1),從而能夠提高性能,給出的理由是Count( *)會帶來全表掃描。而實際上如何寫Count並無區別。 Count(1)和Count(*)實際上的意思是,評估Count()中的表達式是否爲NULL,若是爲NULL則不計數,而非NULL則會計數。好比咱們看代碼1所示,在Count中指定NULL(優化器不容許顯式指定NULL,所以須要賦值給變量才能指定)。
DECLARE @xx INT SET @xx=NULL函數
SELECT COUNT(@xx) FROM [AdventureWorks2012].[Sales].[SalesOrderHeader]性能
代碼清單1.Count中指定NULL優化
因爲全部行都爲NULL,則結果全不計數爲0,結果如圖1所示。
imagecode
圖1.顯而易見,結果爲0索引
所以當你指定Count(*) 或者Count(1)或者不管Count(‘anything’)時結果都會同樣,由於這些值都不爲NULL,如圖2所示。
image變量
圖2.只要在Count中指定非NULL表達式,結果沒有任何區別原理
那Count列呢?數據類型
對於Count(列)來講,一樣適用於上面規則,評估列中每一行的值是否爲NULL,若是爲NULL則不計數,不爲NULL則計數。所以Count(列)會計算列或這列的組合不爲空的計數。
那Count(*)具體如何執行?im
前面提到Count( )有不爲NULL的值時,在SQL Server中只須要找出具體表中不爲NULL的行數便可,也就是全部行(若是一行值全爲NULL則該行至關於不存在)。那麼最簡單的執行辦法是找一列NOT NULL的列,若是該列有索引,則使用該索引,固然,爲了性能,SQL Server會選擇最窄的索引以減小IO。 咱們在Adventureworks2012示例數據庫的[Person].[Address]表上刪除全部的非彙集索引,在ModifyDate這個數據類型爲DateTime的列上創建索引,咱們看執行計劃,如圖3所示:
image
圖3.使用了CreateDate的索引
咱們繼續在StateProvinceID列上創建索引,該列爲INT列,佔4字節,相比以前8字節 DateTime類型的列更短,所以SQL Server選擇了StateProvinceID索引。如圖4所示。
image
圖4.選擇了更短的StateProvinceID索引
所以,若是某個表上Count(*)用的比較多時,考慮在一個最短的列創建一個單列索引,會極大的提高性能。