從新認識MySQL中的COUNT語句

時間 2019-11-08

標籤從新認識 mysql count 語句欄目 MySQL 简体版

原文原文鏈接

在數據庫的增刪改查操做中，使用最頻繁的就是查詢操做。html

而在全部查詢操做中，統計數量操做更是常常被用到。數據庫

關於數據庫中行數統計，不管是MySQL仍是Oracle亦或者是SqlServer，都有一個函數可使用，那就是COUNT。緩存

而對於COUNT，有幾個問題很值得去思考：網絡

一、COUNT有幾種用法？併發

二、COUNT(字段名)和COUNT()的查詢結果有什麼不一樣？函數

三、COUNT(1)和COUNT()之間有什麼不一樣？性能

四、COUNT(1)和COUNT()之間的效率哪一個更高？優化

五、爲何《阿里巴巴Java開發手冊》建議使用COUNT()code

六、MySQL的MyISAM引擎對COUNT()作了哪些優化？orm

七、MySQL的InnoDB引擎對COUNT()作了哪些優化？

八、上面提到的MySQL對COUNT()作的優化，有一個關鍵的前提是什麼？

九、SELECT COUNT() 的時候，加不加where條件有差異嗎？

十、COUNT()、COUNT(1)和COUNT(字段名)的執行過程是怎樣的？

若是以上10道題，所有準確無誤的回答的話，那說明你真的很瞭解COUNT函數了，若是有哪些知識點是不瞭解的，那麼本文正好能夠從新幫你認識一下Count，也爲數據庫優化作一些思考。

認識COUNT

關於COUNT函數的介紹：

一、COUNT(expr) ，返回SELECT語句檢索的行中expr的值不爲NULL的數量。結果是一個BIGINT值。

二、若是查詢結果沒有命中任何記錄，則返回0

三、可是，值得注意的是，COUNT() 的統計結果中，會包含值爲NULL的行數。

例：

create table #bla(id int,id2 int)
insert #bla values(null,null)
insert #bla values(1,null)
insert #bla values(null,1)
insert #bla values(1,null)
insert #bla values(null,1)
insert #bla values(1,null)
insert #bla values(null,null)

使用語句count(),count(id),count(id2)查詢結果以下：

select count(),count(id),count(id2)
from #bla
results 7 3 2

除了COUNT(id)和COUNT()之外，還可使用COUNT(常量)（如COUNT(1)）來統計行數，那麼這三條SQL語句有什麼區別呢？

到底哪一種效率更高呢？

爲何《阿里巴巴Java開發手冊》中強制要求不讓使用 COUNT(列名)或 COUNT(常量)來替代COUNT()呢？

COUNT(列名)、COUNT(常量)和COUNT()之間的區別

前面咱們提到過COUNT(expr)用於作行數統計，統計的是expr不爲NULL的行數，那麼COUNT(列名)、 COUNT(常量) 和 COUNT()這三種語法中，expr分別是列名、常量和。

那麼列名、常量和這三個條件中，常量是一個固定值，確定不爲NULL。

能夠理解爲查詢整行，因此確定也不爲NULL，那麼就只有列名的查詢結果有多是NULL了。

因此， COUNT(常量) 和 COUNT()表示的是直接查詢符合條件的數據庫表的行數。

而COUNT(列名)表示的是查詢符合條件的列的值不爲NULL的行數。

除了查詢獲得結果集有區別以外，COUNT()相比COUNT(常量) 和 COUNT(列名)來說，COUNT()是SQL92定義的標準統計行數的語法，由於他是標準語法，因此MySQL數據庫對他進行過不少優化。

SQL92，是數據庫的一個ANSI/ISO標準。

它定義了一種語言（SQL）以及數據庫的行爲（事務、隔離級別等）。

COUNT()的優化

前面提到了COUNT()是SQL92定義的標準統計行數的語法，因此MySQL數據庫對他進行過不少優化。

那麼，具體都作過哪些事情呢？

這裏的介紹要區分不一樣的執行引擎。

MySQL中比較經常使用的執行引擎就是InnoDB和MyISAM。MyISAM和InnoDB有不少區別，其中有一個關鍵的區別和咱們接下來要介紹的COUNT()有關，那就是MyISAM不支持事務，MyISAM中的鎖是表級鎖；

而InnoDB支持事務，而且支持行級鎖。

由於MyISAM的鎖是表級鎖，因此同一張表上面的操做須要串行進行，因此，MyISAM作了一個簡單的優化，那就是它能夠把表的總行數單獨記錄下來，若是從一張表中使用COUNT()進行查詢的時候，能夠直接返回這個記錄下來的數值就能夠了，固然，前提是不能有where條件。

MyISAM之因此能夠把表中的總行數記錄下來供COUNT()查詢使用，那是由於MyISAM數據庫是表級鎖，不會有併發的數據庫行數修改，因此查詢獲得的行數是準確的。

可是，對於InnoDB來講，就不能作這種緩存操做了，由於InnoDB支持事務，其中大部分操做都是行級鎖，因此可能表的行數可能會被併發修改，那麼緩存記錄下來的總行數就不許確了。

可是，InnoDB仍是針對COUNT()語句作了些優化的。

在InnoDB中，使用COUNT()查詢行數的時候，不可避免的要進行掃表了，那麼，就能夠在掃表過程當中下功夫來優化效率了。

從MySQL 8.0.13開始，針對InnoDB的SELECT COUNT() FROM tblname語句，確實在掃表的過程當中作了一些優化。

前提是查詢語句中不包含WHERE或GROUP BY等條件。

咱們知道，COUNT()的目的只是爲了統計總行數，因此，他根本不關心本身查到的具體值，他若是可以在掃表的過程當中，選擇一個成本較低的索引進行的話，那就能夠大大節省時間。

咱們知道，InnoDB中索引分爲聚簇索引（主鍵索引）和非聚簇索引（非主鍵索引），聚簇索引的葉子節點中保存的是整行記錄，而非聚簇索引的葉子節點中保存的是該行記錄的主鍵的值。

因此，相比之下，非聚簇索引要比聚簇索引小不少，因此MySQL會優先選擇最小的非聚簇索引來掃表。

當咱們建表的時候，除了主鍵索引之外，建立一個非主鍵索引仍是有必要的。

至此，咱們介紹完了MySQL數據庫對於COUNT()的優化，這些優化的前提都是查詢語句中不包含WHERE以及GROUP BY條件。

COUNT()和COUNT(1)

介紹完了COUNT()，接下來看看COUNT(1)，對於，這兩者到底有沒有區別，網上的說法衆說紛紜。

有的說COUNT()執行時會轉換成COUNT(1)，因此COUNT(1)少了轉換步驟，因此更快。

還有的說，由於MySQL針對COUNT()作了特殊優化，因此COUNT()更快。

那麼，到底哪一種說法是對的呢？

看下MySQL官方文檔是怎麼說的：

InnoDB handles SELECT COUNT() and SELECT COUNT(1) operations in the same way. There is no performance difference.

畫重點：

same way , no performance difference。

因此，對於COUNT(1)和COUNT()，MySQL的優化是徹底同樣的，根本不存在誰比誰快！

那既然COUNT()和COUNT(1)同樣，建議用哪一個呢？

建議使用COUNT()！

由於這個是SQL92定義的標準統計行數的語法，並且本文只是基於MySQL作了分析，關於Oracle中的這個問題，也是衆說紛紜的呢。

COUNT(字段)

最後，就是咱們一直還沒提到的COUNT(字段)，他的查詢就比較簡單粗暴了，就是進行全表掃描，而後判斷指定字段的值是否是爲NULL，不爲NULL則累加。相比COUNT()，COUNT(字段)多了一個步驟就是判斷所查詢的字段是否爲NULL，因此他的性能要比COUNT()慢。

總結

本文介紹了COUNT函數的用法，主要用於統計表行數。

主要用法有COUNT()、COUNT(字段)和COUNT(1)。

由於COUNT()是SQL92定義的標準統計行數的語法，因此MySQL對他進行了不少優化，MyISAM中會直接把表的總行數單獨記錄下來供COUNT()查詢，而InnoDB則會在掃表的時候選擇最小的索引來下降成本。固然，這些優化的前提都是沒有進行where和group的條件查詢。

在InnoDB中COUNT()和COUNT(1)實現上沒有區別，並且效率同樣，可是COUNT(字段)須要進行字段的非NULL判斷，因此效率會低一些。

由於COUNT()是SQL92定義的標準統計行數的語法，而且效率高，因此請直接使用COUNT()查詢表的行數！*

本文來自木莊網絡博客> 從新認識MySQL中的COUNT語句

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。