關係數據庫如何快速查詢表的記錄數

時間 2019-12-07

標籤關係數據庫如何快速查詢記錄欄目 SQL 简体版

原文原文鏈接

在數據庫中，不少人員習慣使用SELECT COUNT（*）、SELECT COUNT（1)、SELECT COUNT(COL)來查詢一個表有多少記錄，對於小表，這種SQL的開銷倒不是很大，可是對於大表，這種查詢表記錄數的作法就是一個很是消耗資源了，並且效率不好。下面介紹一下SQL Server、 Oracle、MySQL中如何快速獲取表的記錄數。 mysql

SQL SERVER 數據庫 sql

在SQL Server數據庫中, 對象目錄視圖sys.partitions中有一個字段rows會記錄表的記錄數。咱們以AdventureWorks2014爲測試數據庫。數據庫

 
  SELECT OBJECT_NAME(object_id)    AS Object_Name,  
   
         i.name                    AS Index_Name, 
   
         p.rows                    AS Table_Rows 
   
  FROM sys.partitions  p 
   
  LEFT JOIN sys.sysindexes i ON p.object_id = i.id AND  p.index_id = i.indid   
   
  WHERE 
   
       object_id = OBJECT_ID('TableName')

那麼咱們還有一些疑問，咱們先來看看這些問題吧！ app

1：沒有索引的表是否也能夠使用上面腳本？ 函數

2：只有非彙集索引的堆表是否能夠使用上面腳本？ 測試

3：有多個索引的表，是否記錄數會存在不一致的狀況？ spa

4：統計信息不許確的表，是否rows也會不許確 3d

5: 分區表的狀況又是怎麼樣？ code

6：對象目錄視圖sys.partitions與sp_spaceused獲取的表記錄函數是否準確。 對象

以下所示，咱們先構造測試案例：

 
  IF EXISTS(SELECT 1 FROM sys.objects WHERE type='U' AND name='TEST_TAB_ROW') 
   
  BEGIN 
   
      DROP TABLE TEST_TAB_ROW; 
   
  END 
   
  IF NOT EXISTS(SELECT 1 FROM sys.objects WHERE type='U' AND name='TEST_TAB_ROW') 
   
  BEGIN 
   
          CREATE TABLE TEST_TAB_ROW 
   
          ( 
   
              ID        INT, 
   
              NAME      CHAR(200) 
   
          ) 
   
  END 
   
  GO 
   
  SET NOCOUNT ON; 
   
  BEGIN TRAN 
   
  DECLARE @Index INT =1; 
   
  WHILE @Index <= 100000 
   
  BEGIN 
   
      INSERT INTO TEST_TAB_ROW 
   
      VALUES(@Index, NEWID()); 
   
      SET @Index+=1; 
   
      IF (@Index % 5000)  = 0  
   
         BEGIN 
   
          IF @@TRANCOUNT > 0  
   
              BEGIN  
   
                  COMMIT; 
   
                  BEGIN TRAN 
   
              END 
   
      END 
   
  END 
   
  IF @@TRANCOUNT > 0  
   
  BEGIN  
   
      COMMIT; 
   
  END 
   
  GO

關於問題一、問題2，均可以使用上面腳本，以下測試所示：

 
  SELECT OBJECT_NAME(object_id)    AS Object_Name,  
   
         i.name                    AS Index_Name, 
   
         p.rows                    AS Table_Rows 
   
  FROM sys.partitions  p 
   
  LEFT JOIN sys.sysindexes i ON p.object_id = i.id AND  p.index_id = i.indid   
   
  WHERE 
   
       object_id = OBJECT_ID('dbo.TEST_TAB_ROW')

在表dbo.TEST_TAB_ROW 上建立非彙集索引後，查詢結果以下所示：

 
  CREATE INDEX IX_TEST_TAB_ROW ON TEST_TAB_ROW(ID);

咱們插入500條記錄，此時，這個數據量不足以觸發統計信息更新，以下所示， Rows Sampled仍是1000000

 
  DECLARE @Index INT =1; 
   
  WHILE @Index <= 500 
   
  BEGIN 
   
      INSERT INTO TEST_TAB_ROW 
   
      VALUES(100000 +@Index, NEWID()); 
   
      SET @Index+=1; 
   
  END

以下所示，發現sys.partitions中的記錄變成了100500了，可見rows這個值的計算不依賴統計信息。

固然，若是你用sp_spaceused，發現這裏面的記錄也是100500

sp_spaceused 'dbo.TEST_TAB_ROW'

關於問題3：有多個索引的表，是否記錄數會存在不一致的狀況？

答案：我的測試以及統計來看，暫時發現多個索引的狀況下，sys.partitions中的rows記錄數都是一致的。暫時沒有發現不一致的狀況，固然也不排除有特殊狀況。

關於問題5: 分區表的狀況又是怎麼樣？

答案：分區表和普通表沒有任何區別。

關於問題6：對象目錄視圖sys.partitions與sp_spaceused獲取的表記錄函數是否準確？

答案：對象目錄視圖sys.partitions與sp_spaceused獲取的表記錄數是準確的。

ORACLE 數據庫

在ORACLE數據庫中，能夠經過DBA_TABLES、ALL_TABLES、USER_TABLES視圖查看錶的記錄數，不過這個值（NUM_ROWS）跟統計信息有很大的關係，有時候統計信息沒有更新或採樣比例會致使這個值不是很準確。

 
  SELECT OWNER     ,  
   
         TABLE_NAME,  
   
         NUM_ROWS  , 
   
         LAST_ANALYZED 
   
  FROM   DBA_TABLES  
   
  WHERE  OWNER = '&OWNER'  
   
         AND TABLE_NAME = '&TABLE_NAME';  
   
  SELECT OWNER, 
   
        TABLE_NAME, 
   
        NUM_ROWS  , 
   
        LAST_ANALYZED 
   
  FROM ALL_TABLES 
   
  WHERE OWNER   ='&OWNER' 
   
  AND TABLE_NAME='&TABLE_NAME'; 
   
  SELECT TABLE_NAME, 
   
         NUM_ROWS  , 
   
         LAST_ANALYZED 
   
  FROM USER_TABLES 
   
  WHERE TABLE_NAME='&TABLE_NAME'

更新統計信息後，就能獲得準確的行數。因此若是須要獲得正確的數據，最好更新目標表的統計信息，進行100%採樣分析。對於分區表，那麼就須要從dba_tab_partitions裏面查詢相關數據了。

SQL>execute dbms_stats.gather_table_stats(ownname => 'username', tabname =>'tablename', estimate_percent =>100, cascade=>true);

MySQL數據庫

在MySQL中比較特殊，雖然INFORMATION_SCHEMA.TABLES也能夠查到表的記錄數，可是很是不許確。以下所示，即便使用ANALYZE TABLE更新了統計信息，從INFORMATION_SCHEMA.TABLES中獲取的記錄依然不許確。

 
  SELECT TABLE_ROWS  
   
  FROM INFORMATION_SCHEMA.TABLES 
   
  WHERE TABLE_NAME='table_name'

 
  mysql> SELECT TABLE_ROWS  
   
      -> FROM INFORMATION_SCHEMA.TABLES 
   
      -> WHERE TABLE_NAME='jiraissue' 
   
      -> ; 
   
  +------------+ 
   
  | TABLE_ROWS | 
   
  +------------+ 
   
  |      36487 | 
   
  +------------+ 
   
  1 row in set (0.01 sec) 
   
  mysql> select count(*) from jiraissue; 
   
  +----------+ 
   
  | count(*) | 
   
  +----------+ 
   
  |    36973 | 
   
  +----------+ 
   
  1 row in set (0.05 sec) 
   
  mysql> analyze table jiraissue; 
   
  +----------------+---------+----------+----------+ 
   
  | Table          | Op      | Msg_type | Msg_text | 
   
  +----------------+---------+----------+----------+ 
   
  | jira.jiraissue | analyze | status   | OK       | 
   
  +----------------+---------+----------+----------+ 
   
  1 row in set (1.41 sec) 
   
  mysql> SELECT TABLE_ROWS  
   
      -> FROM INFORMATION_SCHEMA.TABLES 
   
      -> WHERE TABLE_NAME='jiraissue'; 
   
  +------------+ 
   
  | TABLE_ROWS | 
   
  +------------+ 
   
  |      34193 | 
   
  +------------+ 
   
  1 row in set (0.00 sec) 
   
  mysql>