MySQL快速回顧：高級查詢操做

時間 2020-01-16

標籤 mysql 快速回顧高級查詢欄目 MySQL 简体版

原文原文鏈接

8.1 排序數據

檢索出的數據並非以純粹的隨機順序顯示的。若是不排序，數據通常將以它在底層表中出現的順序顯示。這能夠是數據最初添加到表中的順序。可是，若是數據後來進行過更新或刪除，則此順序將會受到MySQL重用回收存儲空間的影響。所以，若是不明確控制的話，不能依賴該排序順序。git

關係數據庫設計理論認爲，若是不明確規定排序順序，則不該該假定檢索出的數據的順序有意義。正則表達式

子句的解釋：一個子句一般由一個關鍵字和所提供的數據組成。SQL語句由子句構成，有些子句是必需的，而有些是可選的。數據庫

爲了明確地排序用SELECT語句檢索出的數據，可以使用ORDER BY子句。ORDER BY子句取一個或多個列的名字，據此對輸出進行排序。排序順序有兩種：升序（ASC關鍵字）和降序（DESC關鍵字），api

格式：數據庫設計

# 升序（默認不寫就是升序）
SELECT field1,field2,... FROM <table_name> ORDER BY field1,field2,...;
SELECT field1,field2,... FROM <table_name> ORDER BY field1,field2,... ;
# 降序
SELECT field1,field2,... FROM <table_name> ORDER BY field1,field2,... DESC;
# 對field1降序，對field2升序（相似這樣的例子也是能夠的）
SELECT field1,field2,... FROM <table_name> ORDER BY field1 DESC,field2 ASC,... ;

注意：函數

一般，BRDER BY子句中使用的列將是爲顯示所選擇的列，可是，實際上並不必定要這樣，用非檢索的列排序數據也是徹底合法的。
對於多列的排序，僅在多個行具備相同的field1值時纔會按field2排序。也就是優先按ORDER BY子句後的第一個列進行排序，當遇到相同的列，則會按照ORDER BY子句後的第二列來排序，以此類推。
也能夠先對ORDER BY子句後的第一個列進行升序或降序，對ORDER BY子句後的第二個列進行降序或升序。
在對文本數據性的數據進行排序時，A與a相同嗎？a位於B以前仍是位於Z以後？這些問題不是理論問題，其答案取決於數據庫如何設置。
在字典（dictionary）排序順序中，A被視爲與a相同，這是MySQL（和大多數數據庫管理系統）的默認行爲。可是，許多數據庫管理員可以在須要時改變這種行爲（若是數據庫包含大量外語字符，可能必須這樣作）。若是確實須要改變這種排序順序，用ORDER BY子句作不到，必需要有數據庫管理員的幫助。
ORDER BY子句的位置，應該保證它位於FROM 子句以後。 由於不少關鍵字是能夠組合一塊兒的，好比使用LIMIT，它必須位於ORDER BY子句以後。使用子句的次序不對將產生錯誤消息。
對於字符串（varchar）的排序：
- 對於英文字符串的排序，通常會根據字符串的首字母：大些字母>小寫字母>特殊字符>數字。若是首位相同繼續排列第二位，直到不一樣的位。
- 對於中文的排序：中文字符串都大於英文字符串，其餘的還得根據數據庫所設置的字符集。好比UTF8,GBK等。對於GBK直接排序便可，對於UTF8須要對字段進行轉碼後排序。而後會從中文字符串的第一個字符的首個字母開始排序。

# UTF8
SELECT fiedl1,... FROM <表名>
    ORDER BY CONVERT(field1 using gbk);

單列，多列的升序和降序排序例子就不說了，若是使用ORDER BY子句和LIMIT的組合，則能夠找出表的一個列中的最大或最小的值。學習

小結：學習瞭如何用SELECT語句的ORDER BY子句對檢索出的數據進行排序。測試

8.2 過濾數據

若是想要按某條件從表中查詢數據，那麼就須要使用WHERE子句來指定搜索條件（過濾條件）進行過濾。WHERE子句在表名（FROM子句）後給出。優化

格式：spa

SELECT  field1,field2,... FROM <表名> WHERE condition1 AND/OR condition2 ...;

在同時使用ORDER BY和WHERE子句時，應該讓ORDER BY位於WHERE以後，不然將會產生錯誤。
MySQL在執行匹配時默認不區分大小寫。
用非檢索的列作搜索條件也是能夠的。

搜索條件是一個表達式，它支持如下操做符

操做符	說明
=	等於
<>	不等於
!=	不等於
<	小於
<=	小於等於
>	大於
>=	大於等於
BETWEEN..AND..	在指定兩個值之間（都包括）

單值查詢：查詢學生表中名爲李四的學生

SELECT stu_name, stu_sex FROM student WHERE stu_name='李四';

不匹配查詢：查詢學生表中女性的學生

SELECT stu_name, stu_sex FROM student WHERE stu_sex<>'男';

範圍查詢：查詢學生表中id從2到4的學生

SELECT stu_name, stu_sex FROM student WHERE stu_id BETWEEN 2 AND 4;

BETWEEN匹配範圍中全部的值，包括指定的開始值和結束值。

空值檢查：空值就是NULL，空值不是0不是空字符串，使用WHERE子句也能夠查詢，下面的例子不是很好，但搜索條件的格式就是：IS NULL。

SELECT stu_name, stu_sex FROM student WHERE stu_sex IS NULL;

小結：介紹瞭如何使用SELECT語句的WHERE子句過濾返回的數據。也學習瞭如何對相等、不相等、大於、小於、值得範圍以及NULL值等測試。

8.3 組合WHERE子句

可使用邏輯操做符來進行多個條件的組合查詢。

8.3.1 AND操做符

AND：用在WHERE子句中的關鍵字，表示檢索知足全部給定條件的行。

格式：

SELECT  field1,field2,... FROM <表名> WHERE condition1 AND condition2 AND ...;

能夠有多個過濾條件。

8.3.2 OR操做符

OR：用在WHERE子句中的關鍵字，表示檢索匹配任一給定條件的行。（也就是有任意一個條件知足就輸出，不用所有同時匹配）

格式：

SELECT  field1,field2,... FROM <表名> WHERE condition1 OR condition2 OR ...;

8.3.3 計算次序

WHERE子句可包含任意數目的AND和OR操做符。而且容許二者結合以進行復雜和高級的過濾。

可是要注意這兩個操做符的優先級問題：MySQL優先處理AND操做符.

任什麼時候候使用具備AND和OR操做符的WHERE子句，都應該使用圓括號明確地分組操做符。不要過度依賴默認計算次序，即便它確實是你想要的結果也是如此。並且使用圓括號也沒什麼壞處，還能夠消除歧義。

8.3.4 IN操做符

IN：用來指定條件範圍，範圍中的每個條件均可以進行匹配。IN取合法值的由逗號分隔的清單，全都括在圓括號中。

格式：

SELECT  field1,field2,... FROM <表名> WHERE field1 IN(n,m,...);

IN操做符跟OR操做符的功能是同樣的。

SELECT  field1,field2,... FROM <表名> WHERE field1 IN(n,m,...);
# 等於
SELECT  field1,field2,... FROM <表名> WHERE field1=n OR field1=m OR ...;

IN操做符的優勢以下：

在使用長的合法選項清單時，IN操做符的語法更清楚且更直觀。
在使用IN時，計算的次序更容易管理（由於使用的操做符更少）。
IN操做符通常比OR操做符清單執行更快。
IN的最大優勢是能夠包含其餘SELECT語句，使得可以更動態地創建WHERE子句。（子查詢之後再說）

8.3.5 NOT操做符

WHERE子句中得NOT操做符有且只有一個功能，那就是否認它以後所跟得任何條件。

MySQL支持使用NOT對IN、BETWEEN和EXIST子句取反，這與多數其餘DBMS容許使用NOT對各類條件取反有很大差異。

例子：

# 查詢學生表中學生的性別不爲空的學生
SELECT stu_name, stu_sex FROM student WHERE stu_sex IS NOT NULL;
# 查詢學生表中學生的姓名不爲小喬的學生
SELECT stu_name, stu_sex FROM student WHERE NOT stu_name='小喬';
# 若是是帶有邏輯運算符，NOT只做用於一個搜索條件，除非用括號括起來
SELECT stu_name, stu_sex FROM student WHERE NOT (stu_name='小喬' OR stu_name='大喬');

8.4 用通配符進行過濾

前面的都是針對具體值過濾的。但有時須要進行模糊查詢，好比：查詢某個字符或子字符串開頭的字符串，有時查詢包含某個字符或子字符串的字符串，有時查詢某個字符或子字符串結尾的字符串。那麼就須要構造一個通配符搜索模式來查詢。

通配符（wildcard）：用來匹配值的一部分的特殊字符。通配符能夠在搜索模式中任意位置使用，而且可使用多個通配符。

搜索模式（search pattern）由字面值，通配符或二者組合構成的搜索條件

爲在搜索子句中使用通配符，必須使用LIKE操做符。LIKE操做符表示MySQL後跟的搜索模式利用通配符匹配而不是直接相等匹配進行比較。

8.4.1 百分號通配符

百分號通配符（%）：表示任何字符出現任意次數。也就是可以匹配出現0次以上的字符。

# 以xx開頭或以XX開頭的字符串
SELECT field1,field2,... FROM <table_name> WHERE field1 LIKE 'xx%';
# 包含xx或包含XX的字符串
SELECT field1,field2,... FROM <table_name> WHERE field1 LIKE '%xx%';
# 以xx結尾或以XX結尾的字符串
SELECT field1,field2,... FROM <table_name> WHERE field1 LIKE '%xx';

注意：MySQL是不區分大小寫的，也就是'xx%'能夠匹配'XX%'和'xx%'。

若是想要在查詢時區分大小寫，能夠加個BINARY關鍵字來區分大小寫：

# 包含xx的字符串
SELECT field1,field2,... FROM <table_name> WHERE BINARY field1 LIKE '%xx%';

也能夠在建立表的時候，在列定義上加上BINARY關鍵字，就表示該列區分大小寫。

CREATE TABLE <table_name>(
    field1 BINARY,
    ...
);

雖然看似%通配符能夠匹配任何字符，可是有一個例外，即NULL。即便用搜索模式：'%'，也不會匹配到NULL。

還得注意尾空格，尾空格可能會干擾通配符匹配，好比搜索模式爲：'%xx '（有個空格）就不會匹配以xx結尾或以XX結尾的字符串，而是會匹配以xx 結尾（有個空格）或以XX 結尾（有個空格）的字符串。即加了尾空格表示匹配具體的值了，即尾空格。若是想要避免，最好使用函數（TRIM(搜索模式)）來去掉。(函數待說，能夠先看這個去空格的函數)

SELECT stu_name FROM student WHERE stu_name LIKE TRIM('%xx ');

8.4.2 下劃線通配符

下劃線通配符（_）:只匹配單個字符。即1個，不能多也不能少，不然就沒有。

# 以xx開頭或以XX開頭長度爲3的字符串
SELECT field1,field2,... FROM <table_name> WHERE field1 LIKE 'xx_';
# 包含xx或包含XX長度爲4的字符串
SELECT field1,field2,... FROM <table_name> WHERE field1 LIKE '_xx_';
# 以xx結尾或以XX結尾長度爲3的的字符串
SELECT field1,field2,... FROM <table_name> WHERE field1 LIKE '_xx';

百分號通配符和下劃線通配符能夠一塊兒使用。

8.4.3 使用通配符的技巧

可能注意到了，在搜索模式中不使用通配符，即具體值也能夠匹配，以下：

SELECT field1,field2,... FROM <table_name> WHERE field1 LIKE 'xx';
# 等於
SELECT field1,field2,... FROM <table_name> WHERE field1 = 'xx%';

二者均可以搜索具體值，使用哪一種好？通配符搜索的處理通常要比前面討論的其餘搜索所花時間更長。

下面給出使用通配符要記住的技巧：

不要過渡使用通配符。若是其餘操做符能達到相同的目的，應該使用其餘操做符。
在確實須要使用通配符時，除非絕對有必要，不然不要把它們用在搜索模式的開始處。把通配符置於搜索模式的開始處，搜索起來是最慢的。
仔細注意通配符的位置。若是放錯地方，可能不會返回想要的數據。

總結目前能夠優化數據庫的點子：

表定義數據類型的選擇；
不要過渡使用通配符，要使用時，除非有必要，不然別使用通配符開搜索模式的開始處。

小結：介紹瞭如何用AND和OR操做符組合成WHERE子句，並且還介紹瞭如何明確地管理計算的次序，如何使用IN和NOT操做符。

8.5 使用正則表達式進行搜索

前面的過濾例子容許使用匹配、比較和通配操做符查詢數據。對於基本的過濾，學這些就足夠了。可是隨着過濾條件的複雜性的增長，WHERE子句自己的複雜性也有必要增長。

這就是正則表達式變得有用的地方。正則表達式是用來匹配文本的特殊的串（字符集合）。

下面只是作個基礎的正則表達式學習，若是要完整覆蓋正則表達式的之後再整。

正則表達式的做用是匹配文本，將一個模式（正則表達式）和一個文本串進行比較。MySQL用WHERE子句對正則表達式提供了初步的支持，，使用REGEXP關鍵字指定正則表達式，過濾SELECT檢索出的數據。

MySQL僅支持多數正則表達式實現的一個很小的子集。

8.5.1 基本字符匹配

格式：

# fieldN的N表示一個整數。
SELECT field1,field2,... FROM <table_name> WHERE fieldN REGEXP '字符串';

好比：

# 會匹配包含喬的姓名的學生。
SELECT stu_name FROM student WHERE stu_name REGEXP '喬';

固然這個例子也可使用LIKE和通配符來操做。下面說一下它們的區別：

LIKE匹配整個列。若是被匹配的文本在列值中出現，LIKE將不會找到它，相應的行也不被返回（除非使用通配符）。
REGEXP關鍵字在列值內進行匹配，若是被匹配的文本在列值中出現，REGEXP將會找到它，相應的行將被返回。

MySQL的正則表達式匹配仍是不區分大小寫。若是要區分大小寫，使用BINARY關鍵字，上面也有說。好比：

..... WHERE BINARY fieldN REGEXP '...';
# 或
..... WHERE fieldN REGEXP BINARY  '...';

還可用使用 . （點），. （點）是正則表達式語言中一個特殊的字符，它表示匹配任意一個字符。

# fieldN的N表示一個整數。
SELECT field1,field2,... FROM <table_name> WHERE fieldN REGEXP '.字符串';

注意：上面語句中的 .（點）是表示匹配任意一個字符。而不是表示普通鍵盤上的特殊字符.（點）。待會會將怎麼匹配特殊字符。

8.5.2 進行OR匹配

OR操做符前面講了，在這裏的功能也是同樣：爲搜索兩個串之一，可是注意寫法：

SELECT field1,field2,... FROM <table_name> WHERE fieldN REGEXP '字符串1|字符串2|...';

即：使用 | 表示OR操做符。

8.5.3 匹配幾個字符之一

正則表達式OR操做符的另外一種寫法：[]，好比：

SELECT field1,field2,... FROM <table_name> WHERE fieldN REGEXP '[字符1字符2...] ...';

[字符1字符2...]：定義一組字符，它的意思是匹配字符1或匹配字符2等等。

也能夠匹配字符串

SELECT field1,field2,... FROM <table_name> WHERE fieldN REGEXP '[字符串1, 字符串2...] ...';

[字符串1, 字符串2...]：定義一組字符串，匹配字符串1或匹配字符串1中的字符或匹配字符串2或匹配字符串2中的字符等等。

[] 形式的使用主要是用於有公共的部分，好比我要查詢姓周，周後面帶有傑或雨的同窗（注意：不是包含）就能夠這樣使用。

SELECT stu_name FROM student WHERE stu_name REGEXP BINARY '周[雨傑]';

匹配：周杰、周雨、周杰XXX、周雨XXX等。

按上面的例子，下面的這種寫法：

SELECT stu_name FROM student WHERE stu_name REGEXP BINARY '周杰|雨';

若是這樣寫，匹配的是：周杰或雨。

上面的例子除非把字符|括在一個集合中，如：(傑|雨)，不然它將應用於整個串。懂了爲何有OR爲何要有：[]的形式了吧。

字符集合還能夠被否認，即，它們將匹配指定字符外的任何東西。只須要在集合的開始放置一個^便可。好比：[^123]表示匹配除1或2或3外的任何東西。

8.5.4 匹配範圍

集合可用來定義要匹配的一個或多個字符。例如，下面的集合將匹配數字0到9：

[0123456789]

爲簡化這種類型的集合，可以使用-來定義個範圍。下面的式子等同於上述數字列表：

[0-9]

範圍不限於完整的集合，[1-3]和[4-9]都是合法的範圍。

下面是一些基礎的字符集總結：

[abc]：表示多是字符a或是字符b或是字符c中的任意一位
[^abc]：表示不是字符a或是字符b或是字符c中的任意一位
[a-z]：全部的小寫字母
[^a-z]: 不匹配全部的小寫字母
[a-zA-Z]：字母中的任意一位
[^a-zA-Z]或[^(a-zA-Z)]：不匹配字母
[A-Z]：全部的大寫字母
[^A-Z]：不匹配全部的大寫字母
[0-9]：表示任意一位數字（只有一位，則範圍爲0到9）
[^0-9]：表示不是任意一位數字

8.5.5 匹配特殊字符

正則表達式語言由具備特定含義的特殊字符構成。好比前面學的.（點）、[]、|、-等，還有一些其餘字符。可是這些字符是有特殊含義的，若是要匹配這些特殊字符要怎麼作？

爲了匹配特殊字符，必須使用\\爲前導。即：\\- 表示查詢特殊字符-； \\. 表示查詢特殊字符.（點），\\\ 表示查詢特殊字符。
這種處理稱爲轉義（escaping），正則表達式內具備特殊意義的全部字符都必須以這種方式轉義。

\\也用來引用元字符（具備特殊含義的字符）：

元字符	說明
\\f	換頁
\\n	換行
\\r	回車
\\t	製表
\\v	縱向製表

多半正則表達式實現使用單個反斜槓轉義特殊字符，以便能使用這些字符自己。但MySQL要求兩個反斜槓（MySQL本身解釋一個，正則表達式解釋另外一個）

8.5.6 匹配字符類

存在找出本身常用的數字、全部的字母字符或全部數字字符等的匹配。爲了方便工做，可用使用預約義的字符集，稱爲字符類（character class）

類	說明
[:alnum:]	任意字母和數字（同[a-zA-Z0-9]）
[:alpha:]	任意字符（同[a-zA-Z]）
[:blank:]	空格和製表（同[\\t]）
[:cntrl:]	ASCII控制字符（ASCII 0到31和127）
[:digit:]	任意數字（同[0-9）
[:graph:]	與[:print:]相同，但不包括空格
[:lower:]	任意小寫字母（同[a-z]）
[:print:]	任意可打印字符
[:punct:]	即不在[:alnum:]又不在[:cntrl:]中的任意字符
[:space:]	包括空格在內的任意空白字符（同[\\f\\n\\r\\t\\v]）
[:upper:]	任意大寫字母（同[A-Z]）
[:xdigit:]	任意十六進制數字（同[a-fA-F0-9]）

不用死記，忘了就看。

8.5.7 匹配多個實例

到目前爲止的全部正則表達式都是試圖匹配單次出現。有時須要對匹配的數目進行更強的控制，那麼就須要下面的重複元字符來完成：

元字符	說明
*	0個或多個匹配
+	1個或多個匹配（等一{1,}）
?	0個或1個匹配（等於{0,1}）
{n}	指定數目的匹配
{n,}	很多於指定數目的匹配
{n,m}	匹配數目的範圍（m不超過255）

好比：
匹配17級學生的全部學號，17級都是以2017開頭的，而後後面有8位任意數字

... REGEXP '2017[0-9]{8}';
# 或
... REGEXP '2017[[:digit:]]{8}';

[[:digit:]]{8}的解釋：[:digit:]匹配任意數字，於是它爲數字的一個集合。{8}確切要求它前面的字符（任意數字）出現8次，因此應該寫成這樣[[:digit:]]{8}：匹配連在一塊兒的任意4位數字。

固然也能夠這樣寫：

... REGEXP '2017[0-9][0-9][0-9][0-9][0-9][0-9][0-9][0-9]';

8.5.8 定位符

目前爲止的全部例子都是匹配一個串中的任意位置的文本。爲了匹配特定的位置，須要定位符：
元字符 | 說明
---|---
^ | 文本的開始（^有兩種意義）
$ | 文本的結尾
[[:<:]] | 詞的開始
[[:>:]] | 詞的結尾

例如，若是想要找出以一個數（包括小數點開始的數）開始的全部產品，要怎麼辦？簡單搜索[0-9\\.]（或[[:digit:]\\.]）嗎？這樣是不行的，由於它將在文本內的任意位置查找匹配。解決的方式就是使用^定位符，以下：

... REGEXP '^[0-9\\.]';

^有兩種用法：

在集合中（用[和]定義），用它來否認改集合。好比：[^0-9] 表示查詢除任意一個數字外的串，只要有包含一個數字的就不匹配，不論位置在哪。
用來指串的開始處。好比：^[0-9] 表示在文本中查找以一個數字開頭的串。

前面說過，LIKE匹配整個串而REGEXO匹配子串。利用定位符，經過用^開始每一個表達式，用%結束每一個表達式，可用是REGEXP的做用跟LIKE同樣。

額外：可用在不使用數據庫表的狀況下用SELECT來測試正則表達式。REGEXP檢查老是返回0（不匹配）或1（匹配）。可用用待文字串的REGEXP來測試表達式。好比

SELECT 'hello' REGEXP '[0-9]';

結果很明顯返回0。

小結：介紹了正則表達式的基礎知識，學習瞭如何在MySQL的SELECT語句中經過REGEXP關鍵字使用它們。

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。