OPTIMIZE TABLE 當您的庫中刪除了大量的數據後,您可能會發現數據文件尺寸並無減少。這是由於刪除操做後在數據文件中留下碎片所致。OPTIMIZE TABLE 是指對錶進行優化。若是已經刪除了表的一大部分數據,或者若是已經對含有可變長度行的表(含有 VARCHAR 、 BLOB 或 TEXT 列的表)進行了不少更改,就應該使用 OPTIMIZE TABLE 命令來進行表優化。這個命令能夠將表中的空間碎片進行合併,而且能夠消除因爲刪除或者更新形成的空間浪費 。OPTIMIZE TABLE 命令只對 MyISAM 、 BDB 和 InnoDB 表起做用 。表優化的工做能夠每週或者每個月按期執行,對提升表的訪問效率有必定的好處,可是須要注意的是,優化表期間會鎖定表,因此必定要安排在空閒時段進行。php
一,原始數據mysql
mysql> select count(*) as total from ad_visit_history; +---------+ | total | +---------+ | 1187096 | //總共有118萬多條數據 +---------+ 1 row in set (0.04 sec)
2,存放在硬盤中的表文件大小程序員
[root@BlackGhost test1]# ls |grep visit |xargs -i du {} 382020 ad_visit_history.MYD //數據文件佔了380M 127116 ad_visit_history.MYI //索引文件佔了127M 12 ad_visit_history.frm //結構文件佔了12K
3,查看一下索引信息sql
mysql> show index from ad_visit_history from test1; //查看一下該表的索引信息 +------------------+------------+-------------------+--------------+---------------+-----------+-------------+----------+--------+------+------------+---------+ | Table | Non_unique | Key_name | Seq_in_index | Column_name | Collation | Cardinality | Sub_part | Packed | Null | Index_type | Comment | +------------------+------------+-------------------+--------------+---------------+-----------+-------------+----------+--------+------+------------+---------+ | ad_visit_history | 0 | PRIMARY | 1 | id | A | 1187096 | NULL | NULL | | BTREE | | | ad_visit_history | 1 | ad_code | 1 | ad_code | A | 46 | NULL | NULL | YES | BTREE | | | ad_visit_history | 1 | unique_id | 1 | unique_id | A | 1187096 | NULL | NULL | YES | BTREE | | | ad_visit_history | 1 | ad_code_ind | 1 | ad_code | A | 46 | NULL | NULL | YES | BTREE | | | ad_visit_history | 1 | from_page_url_ind | 1 | from_page_url | A | 30438 | NULL | NULL | YES | BTREE | | | ad_visit_history | 1 | ip_ind | 1 | ip | A | 593548 | NULL | NULL | YES | BTREE | | | ad_visit_history | 1 | port_ind | 1 | port | A | 65949 | NULL | NULL | YES | BTREE | | | ad_visit_history | 1 | session_id_ind | 1 | session_id | A | 1187096 | NULL | NULL | YES | BTREE | | +------------------+------------+-------------------+--------------+---------------+-----------+-------------+----------+--------+------+------------+---------+ 8 rows in set (0.28 sec)
索引信息中的列的信息說明。
shell
Table :表的名稱。 Non_unique :若是索引不能包括重複詞,則爲0。若是能夠,則爲1。 Key_name :索引的名稱。 Seq_in_index :索引中的列序列號,從1開始。 Column_name :列名稱。 Collation :列以什麼方式存儲在索引中。在MySQLSHOW INDEX語法中,有值’A’(升序)或NULL(無分類)。 Cardinality :索引中惟一值的數目的估計值。經過運行ANALYZE TABLE或myisamchk -a能夠更新。基數根據被存儲爲整數的統計數據來計數,因此即便對於小型表,該值也沒有必要是精確的。基數越大,當進行聯合時,MySQL使用該索引的機會就越大。 Sub_part :若是列只是被部分地編入索引,則爲被編入索引的字符的數目。若是整列被編入索引,則爲NULL。 Packed :指示關鍵字如何被壓縮。若是沒有被壓縮,則爲NULL。 Null :若是列含有NULL,則含有YES。若是沒有,則爲空。 Index_type :存儲索引數據結構方法(BTREE, FULLTEXT, HASH, RTREE)數據庫
二,刪除一半數據session
mysql> delete from ad_visit_history where id>598000; //刪除一半數據 Query OK, 589096 rows affected (4 min 28.06 sec) [root@BlackGhost test1]# ls |grep visit |xargs -i du {} //相對應的MYD,MYI文件大小沒有變化 382020 ad_visit_history.MYD 127116 ad_visit_history.MYI 12 ad_visit_history.frm
按常規思想來講,若是在數據庫中刪除了一半數據後,相對應的.MYD,.MYI文件也應當變爲以前的一半。可是刪除一半數據後,.MYD.MYI盡然連1KB都沒有減小 ,這是多麼的可怕啊。
數據結構
咱們在來看一看,索引信息優化
+------------------+------------+-------------------+--------------+---------------+-----------+-------------+----------+--------+------+------------+---------+ | Table | Non_unique | Key_name | Seq_in_index | Column_name | Collation | Cardinality | Sub_part | Packed | Null | Index_type | Comment | +------------------+------------+-------------------+--------------+---------------+-----------+-------------+----------+--------+------+------------+---------+ | ad_visit_history | 0 | PRIMARY | 1 | id | A | 598000 | NULL | NULL | | BTREE | | | ad_visit_history | 1 | ad_code | 1 | ad_code | A | 23 | NULL | NULL | YES | BTREE | | | ad_visit_history | 1 | unique_id | 1 | unique_id | A | 598000 | NULL | NULL | YES | BTREE | | | ad_visit_history | 1 | ad_code_ind | 1 | ad_code | A | 23 | NULL | NULL | YES | BTREE | | | ad_visit_history | 1 | from_page_url_ind | 1 | from_page_url | A | 15333 | NULL | NULL | YES | BTREE | | | ad_visit_history | 1 | ip_ind | 1 | ip | A | 299000 | NULL | NULL | YES | BTREE | | | ad_visit_history | 1 | port_ind | 1 | port | A | 33222 | NULL | NULL | YES | BTREE | | | ad_visit_history | 1 | session_id_ind | 1 | session_id | A | 598000 | NULL | NULL | YES | BTREE | | +------------------+------------+-------------------+--------------+---------------+-----------+-------------+----------+--------+------+------------+---------+ 8 rows in set (0.00 sec)
對比一下,此次索引查詢和上次索引查詢,裏面的數據信息基本上是上次一次的一本,這點仍是合乎常理。
網站
三,用optimize table來優化一下
mysql> optimize table ad_visit_history; //刪除數據後的優化 +------------------------+----------+----------+----------+ | Table | Op | Msg_type | Msg_text | +------------------------+----------+----------+----------+ | test1.ad_visit_history | optimize | status | OK | +------------------------+----------+----------+----------+ 1 row in set (1 min 21.05 sec)
1,查看一下.MYD,.MYI文件的大小
[root@BlackGhost test1]# ls |grep visit |xargs -i du {} 182080 ad_visit_history.MYD //數據文件差很少爲優化前的一半 66024 ad_visit_history.MYI //索引文件也同樣,差很少是優化前的一半 12 ad_visit_history.frm
2,查看一下索引信息
+------------------+------------+-------------------+--------------+---------------+-----------+-------------+----------+--------+------+------------+---------+ | Table | Non_unique | Key_name | Seq_in_index | Column_name | Collation | Cardinality | Sub_part | Packed | Null | Index_type | Comment | +------------------+------------+-------------------+--------------+---------------+-----------+-------------+----------+--------+------+------------+---------+ | ad_visit_history | 0 | PRIMARY | 1 | id | A | 598000 | NULL | NULL | | BTREE | | | ad_visit_history | 1 | ad_code | 1 | ad_code | A | 42 | NULL | NULL | YES | BTREE | | | ad_visit_history | 1 | unique_id | 1 | unique_id | A | 598000 | NULL | NULL | YES | BTREE | | | ad_visit_history | 1 | ad_code_ind | 1 | ad_code | A | 42 | NULL | NULL | YES | BTREE | | | ad_visit_history | 1 | from_page_url_ind | 1 | from_page_url | A | 24916 | NULL | NULL | YES | BTREE | | | ad_visit_history | 1 | ip_ind | 1 | ip | A | 598000 | NULL | NULL | YES | BTREE | | | ad_visit_history | 1 | port_ind | 1 | port | A | 59800 | NULL | NULL | YES | BTREE | | | ad_visit_history | 1 | session_id_ind | 1 | session_id | A | 598000 | NULL | NULL | YES | BTREE | | +------------------+------------+-------------------+--------------+---------------+-----------+-------------+----------+--------+------+------------+---------+ 8 rows in set (0.00 sec)
從以上數據咱們能夠得出,ad_code,ad_code_ind,from_page_url_ind等索引機會差很少都提升了85%,這樣效率提升了好多。
四,小結
結合mysql官方網站的信息,我的是這樣理解的。當你刪除數據 時,mysql並不會回收,被已刪除數據的佔據的存儲空間,以及索引位。而是空在那裏,而是等待新的數據來彌補這個空缺,這樣就有一個缺乏,若是一時半 會,沒有數據來填補這個空缺,那這樣就太浪費資源了。因此對於寫比較頻煩的表,要按期進行optimize,一個月一次,看實際狀況而定了。
舉個例子來講吧。有100個php程序員辭職了,可是呢只是人走了,php的職位還在那裏,這些職位不會撤銷,要等新的php程序來填補這些空位。招一個好的程序員,比較難。我想大部分時間會空在那裏。哈哈。
五,手冊中關於OPTIMIZE的一些用法和描述
OPTIMIZE [LOCAL | NO_WRITE_TO_BINLOG] TABLE tbl_name [, tbl_name] ...
若是您已經刪除了表的一大部分,或者若是您已經對含有可變長度行的表(含有VARCHAR, BLOB或TEXT列的表)進行了不少更改,則應使用 OPTIMIZE TABLE。被刪除的記錄被保持在連接清單中,後續的INSERT操做會從新使用舊的記錄位置。您可使用OPTIMIZE TABLE來從新 利用未使用的空間,並整理數據文件的碎片。
在多數的設置中,您根本不須要運行OPTIMIZE TABLE。即便您對可變長度的行進行了大量的更新,您也不須要常常運行,每週一次或每個月一次 便可,只對特定的表運行。
OPTIMIZE TABLE只對MyISAM, BDB和InnoDB表起做用。
注意,在OPTIMIZE TABLE運行過程當中,MySQL會鎖定表。