Select count(*)和Count（1）的區別和執行方式

時間 2019-11-07

標籤 select count 區別執行方式简体版

原文原文鏈接

在SQL Server中Count(*)或者Count(1)或者Count([列])或許是最經常使用的聚合函數。不少人其實對這三者之間是區分不清的。本文會闡述這三者的做用，關係以及背後的原理。數據庫

往常我常常會看到一些所謂的優化建議不使用Count(* )而是使用Count（1），從而能夠提高性能，給出的理由是Count( *)會帶來全表掃描。而實際上如何寫Count並無區別。

Count(1)和Count(*)實際上的意思是，評估Count（）中的表達式是否爲NULL，若是爲NULL則不計數，而非NULL則會計數。好比咱們看代碼1所示，在Count中指定NULL（優化器不容許顯式指定NULL，所以須要賦值給變量才能指定）。

DECLARE @xx INT SET @xx=NULL函數

SELECT COUNT(@xx) FROM [AdventureWorks2012].[Sales].[SalesOrderHeader]性能

代碼清單1.Count中指定NULL優化

因爲全部行都爲NULL，則結果全不計數爲0，結果如圖1所示。

imagecode

圖1.顯而易見，結果爲0索引

所以當你指定Count(*） 或者Count（1）或者不管Count(‘anything’)時結果都會同樣，由於這些值都不爲NULL，如圖2所示。

image變量

圖2.只要在Count中指定非NULL表達式，結果沒有任何區別原理

那Count列呢？數據類型

對於Count（列）來講，一樣適用於上面規則，評估列中每一行的值是否爲NULL，若是爲NULL則不計數，不爲NULL則計數。所以Count（列）會計算列或這列的組合不爲空的計數。

那Count（*）具體如何執行？im

前面提到Count( )有不爲NULL的值時，在SQL Server中只須要找出具體表中不爲NULL的行數便可，也就是全部行（若是一行值全爲NULL則該行至關於不存在）。那麼最簡單的執行辦法是找一列NOT NULL的列，若是該列有索引，則使用該索引，固然，爲了性能，SQL Server會選擇最窄的索引以減小IO。

咱們在Adventureworks2012示例數據庫的[Person].[Address]表上刪除全部的非彙集索引，在ModifyDate這個數據類型爲DateTime的列上創建索引，咱們看執行計劃，如圖3所示：

image

圖3.使用了CreateDate的索引

咱們繼續在StateProvinceID列上創建索引，該列爲INT列，佔4字節，相比以前8字節 DateTime類型的列更短，所以SQL Server選擇了StateProvinceID索引。如圖4所示。

image

圖4.選擇了更短的StateProvinceID索引

所以，若是某個表上Count（*)用的比較多時，考慮在一個最短的列創建一個單列索引，會極大的提高性能。

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。