分享一個百萬數量級的測試學習用的mysql數據集

TEST_DB

帶有集成測試套件的示例數據庫,用於測試應用程序和數據庫服務器html

此存儲庫已從Launchpad遷移mysql

請參閱MySQL文檔中的用法git

它來自哪裏

原始數據由西門子企業研究中心的Fusheng Wang和Carlo Zaniolo建立。數據採用XML格式。http://timecenter.cs.aau.dk/software.htmgithub

Giuseppe Maxia製做了關係模式,Patrick Crews以關係格式導出數據。sql

該數據庫包含大約300,000個員工記錄,其中包含280萬個工資條目。導出數據是167 MB,這不是很大,可是足夠重,不足以進行測試。數據庫

生成了數據,所以存在不一致和微妙的問題。咱們決定不更改內容,而是將其刪除,並將這些問題用做數據清理練習。服務器

先決條件

您須要一個MySQL數據庫服務器(5.0+)並經過具備如下權限的用戶運行如下命令:測試

SELECT, INSERT, UPDATE, DELETE, 
CREATE, DROP, RELOAD, REFERENCES, 
INDEX, ALTER, SHOW DATABASES, 
CREATE TEMPORARY TABLES, 
LOCK TABLES, EXECUTE, CREATE VIEW

安裝:

  1. 下載存儲庫
  2. 將目錄更改成存儲庫

而後跑ui

mysql < employees.sql

若是要使用兩個大型分區表進行安裝,請運行spa

mysql < employees_partitioned.sql

測試安裝

安裝後,您能夠運行如下之一

mysql -t < test_employees_md5.sql
# OR
mysql -t < test_employees_sha.sql

例如:

mysql  -t < test_employees_md5.sql
+----------------------+
| INFO                 |
+----------------------+
| TESTING INSTALLATION |
+----------------------+
+--------------+------------------+----------------------------------+
| table_name   | expected_records | expected_crc                     |
+--------------+------------------+----------------------------------+
| employees    |           300024 | 4ec56ab5ba37218d187cf6ab09ce1aa1 |
| departments  |                9 | d1af5e170d2d1591d776d5638d71fc5f |
| dept_manager |               24 | 8720e2f0853ac9096b689c14664f847e |
| dept_emp     |           331603 | ccf6fe516f990bdaa49713fc478701b7 |
| titles       |           443308 | bfa016c472df68e70a03facafa1bc0a8 |
| salaries     |          2844047 | fd220654e95aea1b169624ffe3fca934 |
+--------------+------------------+----------------------------------+
+--------------+------------------+----------------------------------+
| table_name   | found_records    | found_crc                        |
+--------------+------------------+----------------------------------+
| employees    |           300024 | 4ec56ab5ba37218d187cf6ab09ce1aa1 |
| departments  |                9 | d1af5e170d2d1591d776d5638d71fc5f |
| dept_manager |               24 | 8720e2f0853ac9096b689c14664f847e |
| dept_emp     |           331603 | ccf6fe516f990bdaa49713fc478701b7 |
| titles       |           443308 | bfa016c472df68e70a03facafa1bc0a8 |
| salaries     |          2844047 | fd220654e95aea1b169624ffe3fca934 |
+--------------+------------------+----------------------------------+
+--------------+---------------+-----------+
| table_name   | records_match | crc_match |
+--------------+---------------+-----------+
| employees    | OK            | ok        |
| departments  | OK            | ok        |
| dept_manager | OK            | ok        |
| dept_emp     | OK            | ok        |
| titles       | OK            | ok        |
| salaries     | OK            | ok        |
+--------------+---------------+-----------+

免責聲明

據我所知,這些數據是僞造的,並不符合真實的人。與現有人的任何類似之處純屬巧合。

源地址: https://github.com/datacharmer/test_db

相關文章
相關標籤/搜索