數據庫查詢相信不少人都不陌生,全部常常有人調侃程序員就是CRUD專員,這所謂的CRUD指的就是數據庫的增刪改查。在數據庫的增刪改查操做中,使用最頻繁的就是查詢操做。而在全部查詢操做中,統計數量操做更是常常被用到。關於數據庫中行數統計,不管是MySQL仍是Oracle,都有一個函數可使用,那就是COUNT。可是,就是這個經常使用的COUNT函數,卻暗藏着不少玄機,尤爲是在面試的時候,一不當心就會被虐。不信的話請嘗試回答下如下問題:java
一、COUNT有幾種用法? 二、COUNT(字段名)和COUNT(*)的查詢結果有什麼不一樣? 三、COUNT(1)和COUNT(*)之間有什麼不一樣? 四、COUNT(1)和COUNT(*)之間的效率哪一個更高? 五、爲何《阿里巴巴Java開發手冊》建議使用COUNT(*) 六、MySQL的MyISAM引擎對COUNT(*)作了哪些優化? 七、MySQL的InnoDB引擎對COUNT(*)作了哪些優化? 八、上面提到的MySQL對COUNT(*)作的優化,有一個關鍵的前提是什麼? 九、SELECT COUNT(*) 的時候,加不加where條件有差異嗎? 十、COUNT(*)、COUNT(1)和COUNT(字段名)的執行過程是怎樣的?
以上10道題,若是您能夠所有準確無誤的回答的話,那說明你真的很瞭解COUNT函數了,若是有哪些知識點是不瞭解的,那麼本文正好能夠幫你答疑解惑。一、認識COUNT關於COUNT函數,在MySQL官網中有詳細介紹:程序員
簡單翻譯一下:一、COUNT(expr) ,返回SELECT語句檢索的行中expr的值不爲NULL的數量。結果是一個BIGINT值。二、若是查詢結果沒有命中任何記錄,則返回0三、可是,值得注意的是,COUNT(*)
的統計結果中,會包含值爲NULL的行數。即如下表記錄面試
create table #bla(id int,id2 int) insert #bla values(null,null) insert #bla values(1,null) insert #bla values(null,1) insert #bla values(1,null) insert #bla values(null,1) insert #bla values(1,null) insert #bla values(null,null)
使用語句count(*),count(id),count(id2)查詢結果以下數據庫
select count(*),count(id),count(id2) from #bla results 7 3 2
除了COUNT(id)
和COUNT(*)
之外,還可使用COUNT(常量)
(如COUNT(1)
)來統計行數,那麼這三條SQL語句有什麼區別呢?到底哪一種效率更高呢?爲何《阿里巴巴Java開發手冊》中強制要求不讓使用 COUNT(列名)
或 COUNT(常量)
來替代 COUNT(*)
呢?後端
COUNT(列名)、COUNT(常量)和COUNT(*)之間的區別緩存
前面咱們提到過COUNT(expr)
用於作行數統計,統計的是expr不爲NULL的行數,那麼COUNT(列名)
、 COUNT(常量)
和 COUNT(*)
這三種語法中,expr分別是列名
、 常量
和 *
。那麼列名
、 常量
和 *
這三個條件中,常量
是一個固定值,確定不爲NULL。*
能夠理解爲查詢整行,因此確定也不爲NULL,那麼就只有列名
的查詢結果有多是NULL了。因此, COUNT(常量)
和 COUNT(*)
表示的是直接查詢符合條件的數據庫表的行數。而COUNT(列名)
表示的是查詢符合條件的列的值不爲NULL的行數。除了查詢獲得結果集有區別以外,COUNT(*)
相比COUNT(常量)
和 COUNT(列名)
來說,COUNT(*)是SQL92定義的標準統計行數的語法,由於他是標準語法,因此MySQL數據庫對他進行過不少優化。微信
SQL92,是數據庫的一個ANSI/ISO標準。它定義了一種語言(SQL)以及數據庫的行爲(事務、隔離級別等)。
COUNT(*)的優化併發
前面提到了COUNT(*)
是SQL92定義的標準統計行數的語法,因此MySQL數據庫對他進行過不少優化。那麼,具體都作過哪些事情呢?這裏的介紹要區分不一樣的執行引擎。MySQL中比較經常使用的執行引擎就是InnoDB和MyISAM。MyISAM和InnoDB有不少區別,其中有一個關鍵的區別和咱們接下來要介紹的COUNT(*)
有關,那就是MyISAM不支持事務,MyISAM中的鎖是表級鎖;而InnoDB支持事務,而且支持行級鎖。由於MyISAM的鎖是表級鎖,因此同一張表上面的操做須要串行進行,因此,MyISAM作了一個簡單的優化,那就是它能夠把表的總行數單獨記錄下來,若是從一張表中使用COUNT(*)進行查詢的時候,能夠直接返回這個記錄下來的數值就能夠了,固然,前提是不能有where條件。MyISAM之因此能夠把表中的總行數記錄下來供COUNT(*)查詢使用,那是由於MyISAM數據庫是表級鎖,不會有併發的數據庫行數修改,因此查詢獲得的行數是準確的。可是,對於InnoDB來講,就不能作這種緩存操做了,由於InnoDB支持事務,其中大部分操做都是行級鎖,因此可能表的行數可能會被併發修改,那麼緩存記錄下來的總行數就不許確了。可是,InnoDB仍是針對COUNT(*)語句作了些優化的。在InnoDB中,使用COUNT(*)查詢行數的時候,不可避免的要進行掃表了,那麼,就能夠在掃表過程當中下功夫來優化效率了。從MySQL 8.0.13開始,針對InnoDB的SELECT COUNT(*) FROM tbl_name
語句,確實在掃表的過程當中作了一些優化。前提是查詢語句中不包含WHERE或GROUP BY等條件。咱們知道,COUNT(*)的目的只是爲了統計總行數,因此,他根本不關心本身查到的具體值,因此,他若是可以在掃表的過程當中,選擇一個成本較低的索引進行的話,那就能夠大大節省時間。咱們知道,InnoDB中索引分爲聚簇索引(主鍵索引)和非聚簇索引(非主鍵索引),聚簇索引的葉子節點中保存的是整行記錄,而非聚簇索引的葉子節點中保存的是該行記錄的主鍵的值。因此,相比之下,非聚簇索引要比聚簇索引小不少,因此MySQL會優先選擇最小的非聚簇索引來掃表。因此,當咱們建表的時候,除了主鍵索引之外,建立一個非主鍵索引仍是有必要的。至此,咱們介紹完了MySQL數據庫對於COUNT(*)的優化,這些優化的前提都是查詢語句中不包含WHERE以及GROUP BY條件。函數
介紹完了COUNT(*)
,接下來看看COUNT(1)
,對於,這兩者到底有沒有區別,網上的說法衆說紛紜。有的說COUNT(*)
執行時會轉換成COUNT(1)
,因此COUNT(1)少了轉換步驟,因此更快。還有的說,由於MySQL針對COUNT(*)
作了特殊優化,因此COUNT(*)
更快。性能
那麼,到底哪一種說法是對的呢?看下MySQL官方文檔是怎麼說的:
InnoDB handles SELECT COUNT(*) and SELECT COUNT(1) operations in the same way. There is no performance difference.
畫重點:same way
, no performance difference
。因此,對於COUNT(1)和COUNT(*),MySQL的優化是徹底同樣的,根本不存在誰比誰快!那既然COUNT(*)
和COUNT(1)
同樣,建議用哪一個呢?建議使用COUNT(*)
!由於這個是SQL92定義的標準統計行數的語法,並且本文只是基於MySQL作了分析,關於Oracle中的這個問題,也是衆說紛紜的呢。
最後,就是咱們一直還沒提到的COUNT(字段),他的查詢就比較簡單粗暴了,就是進行全表掃描,而後判斷指定字段的值是否是爲NULL,不爲NULL則累加。相比COUNT(*)
,COUNT(字段)
多了一個步驟就是判斷所查詢的字段是否爲NULL,因此他的性能要比COUNT(*)
慢。
本文介紹了COUNT函數的用法,主要用於統計表行數。主要用法有COUNT(*)
、COUNT(字段)
和COUNT(1)
。由於COUNT(*)
是SQL92定義的標準統計行數的語法,因此MySQL對他進行了不少優化,MyISAM中會直接把表的總行數單獨記錄下來供COUNT(*)
查詢,而InnoDB則會在掃表的時候選擇最小的索引來下降成本。固然,這些優化的前提都是沒有進行where和group的條件查詢。在InnoDB中COUNT(*)
和COUNT(1)
實現上沒有區別,並且效率同樣,可是COUNT(字段)
須要進行字段的非NULL判斷,因此效率會低一些。由於COUNT(*)
是SQL92定義的標準統計行數的語法,而且效率高,因此請直接使用COUNT(*)
查詢表的行數!
java後端技術微信公衆號-以上文章來源於Hollis ,做者Hollis