MySQL優化索引及優化漢字模糊查詢語句

時間 2019-11-18

標籤 mysql 優化索引漢字模糊查詢語句欄目 MySQL 简体版

原文原文鏈接

轉 http://blog.csdn.net/firstboy0513/article/details/6912632mysql

利用MySQL這種關係型數據庫來作索引，的確有些勉強了，也只能看狀況來講了，有些簡單的功能仍是能夠考慮的。sql

對於模糊查詢語句，最不利的狀況是要like '%key%'這樣的查詢，可是若是是like 'key%'這種狀況，那麼mysql的索引在些查詢方式上仍是能夠優化的。數據庫

網上常見的是ASCII的英文字符優化，以下：優化

[sql] view plain copy

select corp_code, corp_corp from tb_Z_Corp where corp_code like '0008%';

舉個例子來看看問題的來源吧：編碼

先看一下要試驗表的建立語句和結構，這是一個只包含股票代碼和股票名稱的數據表，主鍵爲股票代碼：spa

[sql] view plain copy

mysql> show create table tb_Z_Corp;
+-----------+-----------------------------------+
| Table | Create Table |
+-----------+-----------------------------------+
| tb_Z_Corp | CREATE TABLE `tb_Z_Corp` (
`corp_code` char(10) NOT NULL,
`corp_corp` varchar(60) NOT NULL,
PRIMARY KEY (`corp_code`),
KEY `idx_Z_Corp_corp_corp` (`corp_corp`)
) ENGINE=MyISAM DEFAULT CHARSET=utf8 |
+-----------+-----------------------------------+
mysql> desc tb_Z_Corp;
+---------------+-------------+------+-----+---------+-------+
| Field | Type | Null | Key | Default | Extra |
+---------------+-------------+------+-----+---------+-------+
| corp_code | char(10) | NO | PRI | | |
| corp_corp | varchar(60) | NO | MUL | | |
+---------------+-------------+------+-----+---------+-------+

表裏面的數據舉例以下（股票代碼和股票名稱）：.net

[sql] view plain copy

+-----------+--------------+
| corp_code | corp_corp |
+-----------+--------------+
| 000800 | 一汽轎車 |
| 000801 | 四川九洲 |
| 000802 | 北京旅遊 |
| 000803 | 金宇車城 |
| 000805 | *ST炎黃 |
| 000806 | 銀河科技 |
| 000807 | 雲鋁股份 |
| 000809 | 中匯醫藥 |

看一下要待優化的語句（一個英文、一個中文的）：code

[sql] view plain copy

select corp_code, corp_corp from tb_Z_Corp where corp_code like '0008%';
select corp_code, corp_corp from tb_Z_Corp where corp_corp like '江%';

對於第一個待優化的SQL語句來講，比較簡單，很多地方都介紹過怎樣優化：blog

[sql] view plain copy

select corp_code, corp_corp from tb_Z_Corp where corp_code >= '0008' and corp_code < '0009';

而對於第二個是中文字符，立刻想到是加一個最大編碼的漢字，這裏數據庫存儲的是UTF-8格式存儲，而漢字的編碼爲3字節，因此按其最大編碼的規則應該是：
Unicode編碼是從U+0800到U+FFFF先標記一下這16位：「zzzzyyyy yyxxxxxx」；
而後把這16位對應到UTF-8的編碼：「1110zzzz 10yyyyyy 10xxxxxx」。
因此最大的3個字節的編碼爲「11101111 10111111 10111111」，也就是十六進制的「EFBFBF」。
在MySQL中，用x'EFBFBF'代表這裏面是用16進制編碼的字符串，因此咱們優化後的語句應該是這樣的：索引

[sql] view plain copy