檢索出的數據並非以純粹的隨機順序顯示的。若是不排序,數據通常將以它在底層表中出現的順序顯示。這能夠是數據最初添加到表中的順序。可是,若是數據後來進行過更新或刪除,則此順序將會受到MySQL重用回收存儲空間的影響。所以,若是不明確控制的話,不能依賴該排序順序。git
關係數據庫設計理論認爲,若是不明確規定排序順序,則不該該假定檢索出的數據的順序有意義。正則表達式
子句的解釋:一個子句一般由一個關鍵字和所提供的數據組成。SQL語句由子句構成,有些子句是必需的,而有些是可選的。數據庫
爲了明確地排序用SELECT語句檢索出的數據,可以使用ORDER BY子句。ORDER BY子句取一個或多個列的名字,據此對輸出進行排序。排序順序有兩種:升序(ASC關鍵字)和降序(DESC關鍵字),api
格式:數據庫設計
# 升序(默認不寫就是升序) SELECT field1,field2,... FROM <table_name> ORDER BY field1,field2,...; SELECT field1,field2,... FROM <table_name> ORDER BY field1,field2,... ; # 降序 SELECT field1,field2,... FROM <table_name> ORDER BY field1,field2,... DESC; # 對field1降序,對field2升序(相似這樣的例子也是能夠的) SELECT field1,field2,... FROM <table_name> ORDER BY field1 DESC,field2 ASC,... ;
注意:函數
# UTF8 SELECT fiedl1,... FROM <表名> ORDER BY CONVERT(field1 using gbk);
單列,多列的升序和降序排序例子就不說了,若是使用ORDER BY子句和LIMIT的組合,則能夠找出表的一個列中的最大或最小的值。學習
小結:學習瞭如何用SELECT語句的ORDER BY子句對檢索出的數據進行排序。測試
若是想要按某條件從表中查詢數據,那麼就須要使用WHERE子句來指定搜索條件(過濾條件)進行過濾。WHERE子句在表名(FROM子句)後給出。優化
格式:spa
SELECT field1,field2,... FROM <表名> WHERE condition1 AND/OR condition2 ...;
搜索條件是一個表達式,它支持如下操做符
操做符 | 說明 |
---|---|
= | 等於 |
<> | 不等於 |
!= | 不等於 |
< | 小於 |
<= | 小於等於 |
> | 大於 |
>= | 大於等於 |
BETWEEN..AND.. | 在指定兩個值之間(都包括) |
單值查詢:查詢學生表中名爲李四的學生
SELECT stu_name, stu_sex FROM student WHERE stu_name='李四';
不匹配查詢:查詢學生表中女性的學生
SELECT stu_name, stu_sex FROM student WHERE stu_sex<>'男';
範圍查詢:查詢學生表中id從2到4的學生
SELECT stu_name, stu_sex FROM student WHERE stu_id BETWEEN 2 AND 4;
空值檢查:空值就是NULL,空值不是0不是空字符串,使用WHERE子句也能夠查詢,下面的例子不是很好,但搜索條件的格式就是:IS NULL。
SELECT stu_name, stu_sex FROM student WHERE stu_sex IS NULL;
小結:介紹瞭如何使用SELECT語句的WHERE子句過濾返回的數據。也學習瞭如何對相等、不相等、大於、小於、值得範圍以及NULL值等測試。
可使用邏輯操做符來進行多個條件的組合查詢。
AND:用在WHERE子句中的關鍵字,表示檢索知足全部給定條件的行。
格式:
SELECT field1,field2,... FROM <表名> WHERE condition1 AND condition2 AND ...;
能夠有多個過濾條件。
OR:用在WHERE子句中的關鍵字,表示檢索匹配任一給定條件的行。(也就是有任意一個條件知足就輸出,不用所有同時匹配)
格式:
SELECT field1,field2,... FROM <表名> WHERE condition1 OR condition2 OR ...;
WHERE子句可包含任意數目的AND和OR操做符。而且容許二者結合以進行復雜和高級的過濾。
可是要注意這兩個操做符的優先級問題:MySQL優先處理AND操做符.
任什麼時候候使用具備AND和OR操做符的WHERE子句,都應該使用圓括號明確地分組操做符。不要過度依賴默認計算次序,即便它確實是你想要的結果也是如此。並且使用圓括號也沒什麼壞處,還能夠消除歧義。
IN:用來指定條件範圍,範圍中的每個條件均可以進行匹配。IN取合法值的由逗號分隔的清單,全都括在圓括號中。
格式:
SELECT field1,field2,... FROM <表名> WHERE field1 IN(n,m,...);
IN操做符跟OR操做符的功能是同樣的。
SELECT field1,field2,... FROM <表名> WHERE field1 IN(n,m,...); # 等於 SELECT field1,field2,... FROM <表名> WHERE field1=n OR field1=m OR ...;
IN操做符的優勢以下:
WHERE子句中得NOT操做符有且只有一個功能,那就是否認它以後所跟得任何條件。
MySQL支持使用NOT對IN、BETWEEN和EXIST子句取反,這與多數其餘DBMS容許使用NOT對各類條件取反有很大差異。
例子:
# 查詢學生表中學生的性別不爲空的學生 SELECT stu_name, stu_sex FROM student WHERE stu_sex IS NOT NULL; # 查詢學生表中學生的姓名不爲小喬的學生 SELECT stu_name, stu_sex FROM student WHERE NOT stu_name='小喬'; # 若是是帶有邏輯運算符,NOT只做用於一個搜索條件,除非用括號括起來 SELECT stu_name, stu_sex FROM student WHERE NOT (stu_name='小喬' OR stu_name='大喬');
前面的都是針對具體值過濾的。但有時須要進行模糊查詢,好比:查詢某個字符或子字符串開頭的字符串,有時查詢包含某個字符或子字符串的字符串,有時查詢某個字符或子字符串結尾的字符串。那麼就須要構造一個通配符搜索模式來查詢。
通配符(wildcard):用來匹配值的一部分的特殊字符。通配符能夠在搜索模式中任意位置使用,而且可使用多個通配符。
搜索模式(search pattern)由字面值,通配符或二者組合構成的搜索條件
爲在搜索子句中使用通配符,必須使用LIKE操做符。LIKE操做符表示MySQL後跟的搜索模式利用通配符匹配而不是直接相等匹配進行比較。
百分號通配符(%):表示任何字符出現任意次數。也就是可以匹配出現0次以上的字符。
# 以xx開頭或以XX開頭的字符串 SELECT field1,field2,... FROM <table_name> WHERE field1 LIKE 'xx%'; # 包含xx或包含XX的字符串 SELECT field1,field2,... FROM <table_name> WHERE field1 LIKE '%xx%'; # 以xx結尾或以XX結尾的字符串 SELECT field1,field2,... FROM <table_name> WHERE field1 LIKE '%xx';
注意:MySQL是不區分大小寫的,也就是'xx%'能夠匹配'XX%'和'xx%'。
若是想要在查詢時區分大小寫,能夠加個BINARY關鍵字來區分大小寫:
# 包含xx的字符串 SELECT field1,field2,... FROM <table_name> WHERE BINARY field1 LIKE '%xx%';
也能夠在建立表的時候,在列定義上加上BINARY關鍵字,就表示該列區分大小寫。
CREATE TABLE <table_name>( field1 BINARY, ... );
雖然看似%通配符能夠匹配任何字符,可是有一個例外,即NULL。即便用搜索模式:'%',也不會匹配到NULL。
還得注意尾空格,尾空格可能會干擾通配符匹配,好比搜索模式爲:'%xx '(有個空格)就不會匹配以xx結尾或以XX結尾的字符串,而是會匹配以xx 結尾(有個空格)或以XX 結尾(有個空格)的字符串。即加了尾空格表示匹配具體的值了,即尾空格。若是想要避免,最好使用函數(TRIM(搜索模式))來去掉。(函數待說,能夠先看這個去空格的函數)
SELECT stu_name FROM student WHERE stu_name LIKE TRIM('%xx ');
下劃線通配符(_):只匹配單個字符。即1個,不能多也不能少,不然就沒有。
# 以xx開頭或以XX開頭長度爲3的字符串 SELECT field1,field2,... FROM <table_name> WHERE field1 LIKE 'xx_'; # 包含xx或包含XX長度爲4的字符串 SELECT field1,field2,... FROM <table_name> WHERE field1 LIKE '_xx_'; # 以xx結尾或以XX結尾長度爲3的的字符串 SELECT field1,field2,... FROM <table_name> WHERE field1 LIKE '_xx';
百分號通配符和下劃線通配符能夠一塊兒使用。
可能注意到了,在搜索模式中不使用通配符,即具體值也能夠匹配,以下:
SELECT field1,field2,... FROM <table_name> WHERE field1 LIKE 'xx'; # 等於 SELECT field1,field2,... FROM <table_name> WHERE field1 = 'xx%';
二者均可以搜索具體值,使用 哪一種好?通配符搜索的處理通常要比前面討論的其餘搜索所花時間更長。
下面給出使用通配符要記住的技巧:
總結目前能夠優化數據庫的點子:
小結:介紹瞭如何用AND和OR操做符組合成WHERE子句,並且還介紹瞭如何明確地管理計算的次序,如何使用IN和NOT操做符。
前面的過濾例子容許使用匹配、比較和通配操做符查詢數據。對於基本的過濾,學這些就足夠了。可是隨着過濾條件的複雜性的增長,WHERE子句自己的複雜性也有必要增長。
這就是正則表達式變得有用的地方。正則表達式是用來匹配文本的特殊的串(字符集合)。
下面只是作個基礎的正則表達式學習,若是要完整覆蓋正則表達式的之後再整。
正則表達式的做用是匹配文本,將一個模式(正則表達式)和一個文本串進行比較。MySQL用WHERE子句對正則表達式提供了初步的支持,,使用REGEXP關鍵字指定正則表達式,過濾SELECT檢索出的數據。
MySQL僅支持多數正則表達式實現的一個很小的子集。
格式:
# fieldN的N表示一個整數。 SELECT field1,field2,... FROM <table_name> WHERE fieldN REGEXP '字符串';
好比:
# 會匹配包含喬的姓名的學生。 SELECT stu_name FROM student WHERE stu_name REGEXP '喬';
固然這個例子也可使用LIKE和通配符來操做。下面說一下它們的區別:
MySQL的正則表達式匹配仍是不區分大小寫。若是要區分大小寫,使用BINARY關鍵字,上面也有說。好比:
..... WHERE BINARY fieldN REGEXP '...'; # 或 ..... WHERE fieldN REGEXP BINARY '...';
還可用使用 . (點),. (點)是正則表達式語言中一個特殊的字符,它表示匹配任意一個字符。
# fieldN的N表示一個整數。 SELECT field1,field2,... FROM <table_name> WHERE fieldN REGEXP '.字符串';
注意:上面語句中的 .(點)是表示匹配任意一個字符。而不是表示普通鍵盤上的特殊字符.(點)。待會會將怎麼匹配特殊字符。
OR操做符前面講了,在這裏的功能也是同樣:爲搜索兩個串之一,可是注意寫法:
SELECT field1,field2,... FROM <table_name> WHERE fieldN REGEXP '字符串1|字符串2|...';
即:使用 | 表示OR操做符。
正則表達式OR操做符的另外一種寫法:[],好比:
SELECT field1,field2,... FROM <table_name> WHERE fieldN REGEXP '[字符1字符2...] ...';
[字符1字符2...]:定義一組字符,它的意思是 匹配字符1或匹配字符2等等。
也能夠匹配字符串
SELECT field1,field2,... FROM <table_name> WHERE fieldN REGEXP '[字符串1, 字符串2...] ...';
[字符串1, 字符串2...]:定義一組字符串,匹配字符串1或匹配字符串1中的字符或匹配字符串2或匹配字符串2中的字符等等。
[] 形式的使用主要是用於有公共的部分,好比我要查詢姓周,周後面帶有 傑 或 雨 的同窗(注意:不是包含)就能夠這樣使用。
SELECT stu_name FROM student WHERE stu_name REGEXP BINARY '周[雨傑]';
匹配:周杰、周雨、周杰XXX、周雨XXX等。
按上面的例子,下面的這種寫法:
SELECT stu_name FROM student WHERE stu_name REGEXP BINARY '周杰|雨';
若是這樣寫,匹配的是:周杰或雨。
上面的例子除非把字符|括在一個集合中,如:(傑|雨),不然它將應用於整個串。 懂了爲何有OR爲何要有:[]的形式了吧。
字符集合還能夠被否認,即,它們將匹配指定字符外的任何東西。只須要在集合的開始放置一個^便可。好比:[^123]表示匹配除1或2或3外的任何東西。
集合可用來定義要匹配的一個或多個字符。例如,下面的集合將匹配數字0到9:
[0123456789]
爲簡化這種類型的集合,可以使用-來定義個範圍。下面的式子等同於上述數字列表:
[0-9]
範圍不限於完整的集合,[1-3]和[4-9]都是合法的範圍。
下面是一些基礎的字符集總結:
[abc]:表示多是字符a或是字符b或是字符c中的任意一位 [^abc]:表示不是字符a或是字符b或是字符c中的任意一位 [a-z]:全部的小寫字母 [^a-z]: 不匹配全部的小寫字母 [a-zA-Z]:字母中的任意一位 [^a-zA-Z]或[^(a-zA-Z)]:不匹配字母 [A-Z]:全部的大寫字母 [^A-Z]:不匹配全部的大寫字母 [0-9]:表示任意一位數字(只有一位,則範圍爲0到9) [^0-9]:表示不是任意一位數字
正則表達式語言由具備特定含義的特殊字符構成。好比前面學的.(點)、[]、|、-等,還有一些其餘字符。可是這些字符是有特殊含義的,若是要匹配這些特殊字符要怎麼作?
爲了匹配特殊字符,必須使用\\爲前導。即:\\- 表示查詢特殊字符-; \\. 表示查詢特殊字符.(點),\\\ 表示查詢特殊字符。
這種處理稱爲轉義(escaping),正則表達式內具備特殊意義的全部字符都必須以這種方式轉義。
\\也用來引用元字符(具備特殊含義的字符):
元字符 | 說明 |
---|---|
\\f | 換頁 |
\\n | 換行 |
\\r | 回車 |
\\t | 製表 |
\\v | 縱向製表 |
多半正則表達式實現使用單個反斜槓轉義特殊字符,以便能使用這些字符自己。但MySQL要求兩個反斜槓(MySQL本身解釋一個,正則表達式解釋另外一個)
存在找出本身常用的數字、全部的字母字符或全部數字字符等的匹配。爲了方便工做,可用使用預約義的字符集,稱爲字符類(character class)
類 | 說明 |
---|---|
[:alnum:] | 任意字母和數字(同[a-zA-Z0-9]) |
[:alpha:] | 任意字符(同[a-zA-Z]) |
[:blank:] | 空格和製表(同[\\t]) |
[:cntrl:] | ASCII控制字符(ASCII 0到31和127) |
[:digit:] | 任意數字(同[0-9) |
[:graph:] | 與[:print:]相同,但不包括空格 |
[:lower:] | 任意小寫字母(同[a-z]) |
[:print:] | 任意可打印字符 |
[:punct:] | 即不在[:alnum:]又不在[:cntrl:]中的任意字符 |
[:space:] | 包括空格在內的任意空白字符(同[\\f\\n\\r\\t\\v]) |
[:upper:] | 任意大寫字母(同[A-Z]) |
[:xdigit:] | 任意十六進制數字(同[a-fA-F0-9]) |
不用死記,忘了就看。
到目前爲止的全部正則表達式都是試圖匹配單次出現。有時須要對匹配的數目進行更強的控制,那麼就須要下面的重複元字符來完成:
元字符 | 說明 |
---|---|
* | 0個或多個匹配 |
+ | 1個或多個匹配(等一{1,}) |
? | 0個或1個匹配(等於{0,1}) |
{n} | 指定數目的匹配 |
{n,} | 很多於指定數目的匹配 |
{n,m} | 匹配數目的範圍(m不超過255) |
好比:
匹配17級學生的全部學號,17級都是以2017開頭的,而後後面有8位任意數字
... REGEXP '2017[0-9]{8}'; # 或 ... REGEXP '2017[[:digit:]]{8}';
[[:digit:]]{8}的解釋:[:digit:]匹配任意數字,於是它爲數字的一個集合。{8}確切要求它前面的字符(任意數字)出現8次,因此應該寫成這樣[[:digit:]]{8}:匹配連在一塊兒的任意4位數字。
固然也能夠這樣寫:
... REGEXP '2017[0-9][0-9][0-9][0-9][0-9][0-9][0-9][0-9]';
目前爲止的全部例子都是匹配一個串中的任意位置的文本。爲了匹配特定的位置,須要定位符:
元字符 | 說明
---|---
^ | 文本的開始(^有兩種意義)
$ | 文本的結尾
[[:<:]] | 詞的開始
[[:>:]] | 詞的結尾
例如,若是想要找出以一個數(包括小數點開始的數)開始的全部產品,要怎麼辦?簡單搜索[0-9\\.](或[[:digit:]\\.])嗎?這樣是不行的,由於它將在文本內的任意位置查找匹配。解決的方式就是使用^定位符,以下:
... REGEXP '^[0-9\\.]';
^有兩種用法:
前面說過,LIKE匹配整個串而REGEXO匹配子串。利用定位符,經過用^開始每一個表達式,用%結束每一個表達式,可用是REGEXP的做用跟LIKE同樣。
額外:可用在不使用數據庫表的狀況下用SELECT來測試正則表達式。REGEXP檢查老是返回0(不匹配)或1(匹配)。可用用待文字串的REGEXP來測試表達式。好比
SELECT 'hello' REGEXP '[0-9]';
結果很明顯返回0。
小結:介紹了正則表達式的基礎知識,學習瞭如何在MySQL的SELECT語句中經過REGEXP關鍵字使用它們。