關係數據庫如何快速查詢表的記錄數

    在數據庫中,不少人員習慣使用SELECT COUNT(*)、SELECT COUNT(1)、SELECT COUNT(COL)來查詢一個表有多少記錄,對於小表,這種SQL的開銷倒不是很大,可是對於大表,這種查詢表記錄數的作法就是一個很是消耗資源了,並且效率不好。下面介紹一下SQL Server、 Oracle、MySQL中如何快速獲取表的記錄數。 mysql

 

SQL SERVER 數據庫 sql

 

在SQL Server數據庫中, 對象目錄視圖sys.partitions中有一個字段rows會記錄表的記錄數。咱們以AdventureWorks2014爲測試數據庫。 數據庫

 

clip_image001

 

 
SELECT OBJECT_NAME(object_id)    AS Object_Name, 
       i.name                    AS Index_Name,
       p.rows                    AS Table_Rows
FROM sys.partitions  p
LEFT JOIN sys.sysindexes i ON p.object_id = i.id AND  p.index_id = i.indid  
WHERE
     object_id = OBJECT_ID('TableName') 

 

clip_image002

 

那麼咱們還有一些疑問,咱們先來看看這些問題吧! app

 

   1:沒有索引的表是否也能夠使用上面腳本? 函數

   2:只有非彙集索引的堆表是否能夠使用上面腳本? 測試

   3:有多個索引的表,是否記錄數會存在不一致的狀況? spa

   4:統計信息不許確的表,是否rows也會不許確 3d

   5: 分區表的狀況又是怎麼樣? code

   6:對象目錄視圖sys.partitions與sp_spaceused獲取的表記錄函數是否準確。 對象

 

以下所示,咱們先構造測試案例:

IF EXISTS(SELECT 1 FROM sys.objects WHERE type='U' AND name='TEST_TAB_ROW')
BEGIN
    DROP TABLE TEST_TAB_ROW;
END
 
IF NOT EXISTS(SELECT 1 FROM sys.objects WHERE type='U' AND name='TEST_TAB_ROW')
BEGIN
        CREATE TABLE TEST_TAB_ROW
        (
            ID        INT,
            NAME      CHAR(200)
        )
END
GO
 
SET NOCOUNT ON;
BEGIN TRAN
DECLARE @Index INT =1;
 
WHILE @Index <= 100000
BEGIN
 
    INSERT INTO TEST_TAB_ROW
    VALUES(@Index, NEWID());
 
    SET @Index+=1;
    
    IF (@Index % 5000)  = 0 
       BEGIN
        IF @@TRANCOUNT > 0 
            BEGIN 
                COMMIT;
                BEGIN TRAN
            END
    END
END
 
IF @@TRANCOUNT > 0 
BEGIN 
    COMMIT;
END
GO

 

關於問題一、問題2,均可以使用上面腳本, 以下測試所示:

 

SELECT OBJECT_NAME(object_id)    AS Object_Name, 
       i.name                    AS Index_Name,
       p.rows                    AS Table_Rows
FROM sys.partitions  p
LEFT JOIN sys.sysindexes i ON p.object_id = i.id AND  p.index_id = i.indid  
WHERE
     object_id = OBJECT_ID('dbo.TEST_TAB_ROW') 

clip_image003

 

在表dbo.TEST_TAB_ROW 上建立非彙集索引後,查詢結果以下所示:

 

CREATE INDEX IX_TEST_TAB_ROW ON TEST_TAB_ROW(ID);

 

clip_image004

 

咱們插入500條記錄,此時,這個數據量不足以觸發統計信息更新,以下所示, Rows Sampled仍是1000000

DECLARE @Index INT =1;
 
WHILE @Index <= 500
BEGIN
 
    INSERT INTO TEST_TAB_ROW
    VALUES(100000 +@Index, NEWID());
 
    SET @Index+=1;
    
END

 

clip_image005

 

以下所示,發現sys.partitions中的記錄變成了100500了,可見rows這個值的計算不依賴統計信息。

 

clip_image006

 

固然,若是你用sp_spaceused,發現這裏面的記錄也是100500

sp_spaceused 'dbo.TEST_TAB_ROW'

clip_image007

 

關於問題3:有多個索引的表,是否記錄數會存在不一致的狀況?

 

   答案:我的測試以及統計來看,暫時發現多個索引的狀況下,sys.partitions中的rows記錄數都是一致的。暫時沒有發現不一致的狀況,固然也不排除有特殊狀況。

 

關於問題5: 分區表的狀況又是怎麼樣?

 

   答案:分區表和普通表沒有任何區別。

 

關於問題6:對象目錄視圖sys.partitions與sp_spaceused獲取的表記錄函數是否準確?

 

   答案:對象目錄視圖sys.partitions與sp_spaceused獲取的表記錄數是準確的。

 

 

ORACLE 數據庫

 

在ORACLE數據庫中,能夠經過DBA_TABLES、ALL_TABLES、USER_TABLES視圖查看錶的記錄數,不過這個值(NUM_ROWS)跟統計信息有很大的關係,有時候統計信息沒有更新或採樣比例會致使這個值不是很準確。

SELECT OWNER     , 
       TABLE_NAME, 
       NUM_ROWS  ,
       LAST_ANALYZED
FROM   DBA_TABLES 
WHERE  OWNER = '&OWNER' 
       AND TABLE_NAME = '&TABLE_NAME'; 
 
 
SELECT OWNER,
      TABLE_NAME,
      NUM_ROWS  ,
      LAST_ANALYZED
FROM ALL_TABLES
WHERE OWNER   ='&OWNER'
AND TABLE_NAME='&TABLE_NAME';
 
 
SELECT TABLE_NAME,
       NUM_ROWS  ,
       LAST_ANALYZED
FROM USER_TABLES
WHERE TABLE_NAME='&TABLE_NAME'

 

更新統計信息後,就能獲得準確的行數。因此若是須要獲得正確的數據,最好更新目標表的統計信息,進行100%採樣分析。對於分區表,那麼就須要從dba_tab_partitions裏面查詢相關數據了。

 

SQL>execute dbms_stats.gather_table_stats(ownname => 'username', tabname =>'tablename', estimate_percent =>100, cascade=>true);

 

MySQL數據庫

 

   在MySQL中比較特殊,雖然INFORMATION_SCHEMA.TABLES也能夠查到表的記錄數,可是很是不許確。以下所示,即便使用ANALYZE TABLE更新了統計信息,從INFORMATION_SCHEMA.TABLES中獲取的記錄依然不許確。

SELECT TABLE_ROWS 
FROM INFORMATION_SCHEMA.TABLES
WHERE TABLE_NAME='table_name'

 

mysql> SELECT TABLE_ROWS 
    -> FROM INFORMATION_SCHEMA.TABLES
    -> WHERE TABLE_NAME='jiraissue'
    -> ;
+------------+
| TABLE_ROWS |
+------------+
|      36487 |
+------------+
1 row in set (0.01 sec)
 
mysql> select count(*) from jiraissue;
+----------+
| count(*) |
+----------+
|    36973 |
+----------+
1 row in set (0.05 sec)
 
mysql> analyze table jiraissue;
+----------------+---------+----------+----------+
| Table          | Op      | Msg_type | Msg_text |
+----------------+---------+----------+----------+
| jira.jiraissue | analyze | status   | OK       |
+----------------+---------+----------+----------+
1 row in set (1.41 sec)
 
mysql> SELECT TABLE_ROWS 
    -> FROM INFORMATION_SCHEMA.TABLES
    -> WHERE TABLE_NAME='jiraissue';
+------------+
| TABLE_ROWS |
+------------+
|      34193 |
+------------+
1 row in set (0.00 sec)
 
mysql> 

clip_image008

image

 

如上所示,MySQL這種查詢表記錄數的方法看來仍是有缺陷的。固然若是不是要求很是精確的值,這個方法也是不錯的。

 

固然,上面介紹的SQL Server、Oracle、MySQL數據庫中的方法,仍是有一些侷限性的。例如,只能查詢整張表的記錄數,對於那些查詢記錄數帶有查詢條件(WHERE)這類SQL。仍是必須使用SELECT COUNT(*)這種方法。

相關文章
相關標籤/搜索