Mysql 多種Count寫法的區別

時間 2020-07-11

標籤 mysql 多種 count 寫法區別欄目 MySQL 简体版

原文原文鏈接

今天咱們來看看count的不一樣實現方式數據庫

**count(*) 的實現方式**

先來看一下 coun(*)的實現，MyISAM和InnoDB的實現上是不一樣的緩存

MyISAM 引擎把一個表的總行數存在了磁盤上，所以執行 count() 的時候會直接返回這個數，效率很高; 而 InnoDB 引擎就麻煩了，它執行 count() 的時候，須要把數據一行一行地從引擎裏面讀出來，而後累積計數併發

若是加了 where條件的話，MyISAM 表也是不能返回得這麼快的函數

爲何 InnoDB 不跟 MyISAM 同樣，也把數字存起來呢?性能

這是由於即便是在同一個時刻的多個查詢，因爲多版本併發控制(MVCC)的緣由， InnoDB 表應該返回多少行也是不肯定的優化

這和 InnoDB 的事務設計有關係，可重複讀是它默認的隔離級別，在代碼上就是經過MVCC 來實現的。每一行記錄都要判斷本身是否對這個會話可見，所以對於 count(*) 請求來講，InnoDB只好把數據一行一行地讀出依次判斷，可見的行才能夠用於計算「基於這個查詢」的表的總行數線程

InnoDB 是索引組織表，主鍵索引樹的葉子節點是數據，而普通索引樹的葉子節點是主鍵值。因此，普通索引樹比主鍵索引樹小不少。對於count(*) 這樣的操做，遍歷哪一個索引樹獲得的結果邏輯上都是同樣的。所以，MySQL 優化器會找到最小的那棵樹來遍歷。在保證邏輯正確的前提下，儘可能減小掃描的數據量，是數據庫系統設計的通用法則之一設計

若是你用過 show table status 命令的話，就會發現這個命令的輸出結果裏面也有一個 TABLE_ROWS 用於顯示這個表當前有多少行，這個命令執行挺快的，那這個 TABLE_ROWS 能代替 count(*) 嗎server

索引統計的值是經過採樣來估算的。實際上，TABLE_ROWS 就是從這個採樣估算得來的，所以它也很不許。有多不許呢，官方文檔說偏差可能達到 40% 到 50%。因此，show table status 命令顯示的行數也不能直接使用排序