MySQL裏面的子查詢

時間 2019-12-14

標籤 mysql 裏面查詢欄目 MySQL 简体版

原文原文鏈接

1、子查詢定義

　　定義：mysql

　　子查詢容許把一個查詢嵌套在另外一個查詢當中。sql

　　子查詢，又叫內部查詢，相對於內部查詢，包含內部查詢的就稱爲外部查詢。數據庫

　　子查詢能夠包含普通select能夠包括的任何子句，好比：distinct、 group by、order by、limit、join和union等；可是對應的外部查詢必須是如下語句之一：select、insert、update、delete、set或者do。express

　　子查詢的位置：
　　　　select 中、from 後、where 中.group by 和order by 中無實用意義。函數

2、子查詢分類

　　子查詢分爲以下幾類：
　　　　1. 標量子查詢：返回單一值的標量，最簡單的形式。
　　　　2. 列子查詢：返回的結果集是 N 行一列。
　　　　3. 行子查詢：返回的結果集是一行 N 列。
　　　　4. 表子查詢：返回的結果集是 N 行 N 列。
　　可使用的操做符：= > < >= <= <> ANY IN SOME ALL EXISTS post

　　一個子查詢會返回一個標量（就一個值）、一個行、一個列或一個表，這些子查詢稱之爲標量、行、列和表子查詢。性能

　　若是子查詢返回一個標量值（就一個值），那麼外部查詢就可使用：=、>、<、>=、<=和<>符號進行比較判斷；若是子查詢返回的不是一個標量值，而外部查詢使用了比較符和子查詢的結果進行了比較，那麼就會拋出異常。優化

　　1. 標量子查詢：ui

　　　　是指子查詢返回的是單一值的標量，如一個數字或一個字符串，也是子查詢中最簡單的返回形式。可使用 = > < >= <= <> 這些操做符對子查詢的標量結果進行比較，一般子查詢的位置在比較式的右側
　　　　示例：　　spa

 
           SELECT * FROM article WHERE uid = (SELECT uid FROM user WHERE status=1 ORDER BY uid DESC LIMIT 1) 
          
           SELECT * FROM t1 WHERE column1 = (SELECT MAX(column2) FROM t2) 
          
           SELECT * FROM article AS t WHERE 2 = (SELECT COUNT(*) FROM article WHERE article.uid = t.uid)

　　2. MySQL 列子查詢：

　　　　指子查詢返回的結果集是 N 行一列，該結果一般來自對錶的某個字段查詢返回。
　　　　可使用 = > < >= <= <> 這些操做符對子查詢的標量結果進行比較，一般子查詢的位置在比較式的右側
　　　　可使用 IN、ANY、SOME 和 ALL 操做符，不能直接使用 = > < >= <= <> 這些比較標量結果的操做符。
　　　　示例：

 
           SELECT * FROM article WHERE uid IN(SELECT uid FROM user WHERE status=1) 
          
           SELECT s1 FROM table1 WHERE s1 > ANY (SELECT s2 FROM table2) 
          
           SELECT s1 FROM table1 WHERE s1 > ALL (SELECT s2 FROM table2)

　　　　NOT IN 是 <> ALL 的別名，兩者相同。
　　　　特殊狀況
　　　　　　若是 table2 爲空表，則 ALL 後的結果爲 TRUE；
　　　　　　若是子查詢返回如 (0,NULL,1) 這種儘管 s1 比返回結果都大，但有空行的結果，則 ALL 後的結果爲 UNKNOWN 。
　　　　注意：對於 table2 空表的狀況，下面的語句均返回 NULL：

 
           SELECT s1 FROM table1 WHERE s1 > (SELECT s2 FROM table2) 
          
           SELECT s1 FROM table1 WHERE s1 > ALL (SELECT MAX(s1) FROM table2)

　　3. MySQL 行子查詢：

　　　　指子查詢返回的結果集是一行 N 列，該子查詢的結果一般是對錶的某行數據進行查詢而返回的結果集。
　　　　例子：

 
           SELECT * FROM table1 WHERE (1,2) = (SELECT column1, column2 FROM table2) 
          
           注：(1,2) 等同於 row(1,2) 
          
           SELECT * FROM article WHERE (title,content,uid) = (SELECT title,content,uid FROM blog WHERE bid=2)

　　4. MySQL 表子查詢：

　　　　指子查詢返回的結果集是 N 行 N 列的一個表數據。
　　　　例子：

 
           SELECT * FROM article WHERE (title,content,uid) IN (SELECT title,content,uid FROM blog)

3、字查詢例舉

　　1. ANY進行子查詢

　　any關鍵詞的意思是「對於子查詢返回的列中的任何一個數值，若是比較結果爲TRUE，就返回TRUE」。

　　比如「10 >any(11, 20, 2, 30)」，因爲10>2，因此，該該判斷會返回TRUE；只要10與集合中的任意一個進行比較，獲得TRUE時，就會返回TRUE。　　

 
           select  
           table1.customer_id,city,count(order_id) 
          
           from  
           table1  
           join  
           table2 
          
           on  
           table1.customer_id=table2.customer_id 
          
           where  
           table1.customer_id<> 
           'tx'  
           and table1.customer_id<> 
           '9you' 
          
           group  
           by  
           customer_id 
          
           having count(order_id) > 
          
           any ( 
          
           select  
           count(order_id) 
          
           from  
           table2 
          
           where  
           customer_id= 
           'tx'  
           or customer_id= 
           '9you' 
          
           group  
           by  
           customer_id);

　　any的意思比較好明白，直譯就是任意一個，只要條件知足任意的一個，就返回TRUE。

　　2. 使用IN進行子查詢

　　使用in進行子查詢，這個咱們在平常寫sql的時候是常常遇到的。in的意思就是指定的一個值是否在這個集合中，如何在就返回TRUE；不然就返回FALSE了。

　　in是「=any」的別名，在使用「=any」的地方，咱們均可以使用「in」來進行替換。

　　有了in，確定就有了not in；not in並非和<>any是一樣的意思，not in和<>all是一個意思。

　　3. 使用SOME進行子查詢

　　some是any的別名，用的比較少。
　　

　　4. 使用ALL進行子查詢

　　all必須與比較操做符一塊兒使用。all的意思是「對於子查詢返回的列中的全部值，若是比較結果爲TRUE，則返回TRUE」。

　　比如「10 >all(2, 4, 5, 1)」，因爲10大於集合中的全部值，因此這條判斷就返回TRUE；而若是爲「10 >all(20, 3, 2, 1, 4)」，這樣的話，因爲10小於20，因此該判斷就會返回FALSE。

　　<>all的同義詞是not in，表示不等於集合中的全部值，這個很容易和<>any搞混，平時多留點心就行了。

　　5.標量子查詢

　　根據子查詢返回值的數量，將子查詢能夠分爲標量子查詢和多值子查詢。在使用比較符進行子查詢時，就要求必須是標量子查詢；若是是多值子查詢時，使用比較符，就會拋出異常。

　　6. 多值子查詢

　　與標量子查詢對應的就是多值子查詢了，多值子查詢會返回一列、一行或者一個表，它們組成一個集合。咱們通常使用的any、in、all和some等詞，將外部查詢與子查詢的結果進行判斷。若是將any、in、all和some等詞與標量子查詢，就會獲得空的結果。

　　7. 獨立子查詢

　　獨立子查詢是不依賴外部查詢而運行的子查詢。什麼叫依賴外部查詢？先看下面兩個sql語句。

　　sql語句1：得到全部hangzhou顧客的訂單號。　

 
           select  
           order_id  
          
           from  
           table2  
          
           where  
           customer_id  
           in 
          
           ( 
           select  
           customer_id  
          
           from  
           table1  
          
           where  
           city= 
           'hangzhou' 
           );

　　sql語句2：得到城市爲hangzhou，而且存在訂單的用戶。

 
           select  
           *  
          
           from  
           table1  
          
           where  
           city= 
           'hangzhou'  
           and exists 
          
           ( 
           select  
           *  
          
           from  
           table2  
          
           where  
           table1.customer_id=table2.customer_id);

　　上面的兩條sql語句，雖然例子舉的有點不是很恰當，可是足以說明這裏的問題了。

　　　　對於sql語句1，咱們將子查詢單獨複製出來，也是能夠單獨執行的，就是子查詢與外部查詢沒有任何關係。

　　　　對於sql語句2，咱們將子查詢單獨複製出來，就沒法單獨執行了，因爲sql語句2的子查詢依賴外部查詢的某些字段，這就致使子查詢就依賴外部查詢，就產生了相關性。

　　對於子查詢，不少時候都會考慮到效率的問題。當咱們執行一個select語句時，能夠加上explain關鍵字，用來查看查詢類型，查詢時使用的索引以及其它等等信息。好比這麼用：

 
           explain  
           select  
           order_id  
          
           from  
           table2  
          
           where  
           customer_id  
           in 
          
           ( 
           select  
           customer_id  
          
           from  
           table1  
          
           where  
           city= 
           'hangzhou' 
           );

　　使用獨立子查詢，若是子查詢部分對集合的最大遍歷次數爲n，外部查詢的最大遍歷次數爲m時，咱們能夠記爲：O(m+n)。而若是使用相關子查詢，它的遍歷次數可能會達到O(m+m*n)。能夠看到，效率就會成倍的降低；因此，大夥在使用子查詢時，必定要考慮到子查詢的相關性。

　　8.相關子查詢

　　相關子查詢是指引用了外部查詢列的子查詢，即子查詢會對外部查詢的每行進行一次計算。可是在MySQL的內部，會進行動態優化，會隨着狀況的不一樣會有所不一樣。使用相關子查詢是最容易出現性能的地方。而關於sql語句的優化，這又是一個很是大的話題了，只能經過實際的經驗積累，才能更好的去理解如何進行優化。

　　9.EXISTS謂詞

　　EXISTS是一個很是牛叉的謂詞，它容許數據庫高效地檢查指定查詢是否產生某些行。根據子查詢是否返回行，該謂詞返回TRUE或FALSE。與其它謂詞和邏輯表達式不一樣的是，不管輸入子查詢是否返回行，EXISTS都不會返回UNKNOWN，對於EXISTS來講，UNKNOWN就是FALSE。仍是上面的語句，得到城市爲hangzhou，而且存在訂單的用戶。

 
           select  
           *  
          
           from  
           table1  
          
           where  
           city= 
           'hangzhou'  
           and exists 
          
           ( 
           select  
           *  
          
           from  
           table2  
          
           where  
           table1.customer_id=table2.customer_id);

　　關於IN和EXISTS的主要區別在於三值邏輯的判斷上。EXISTS老是返回TRUE或FALSE，而對於IN，除了TRUE、FALSE值外，還有可能對NULL值返回UNKNOWN。可是在過濾器中，UNKNOWN的處理方式與FALSE相同，所以使用IN與使用EXISTS同樣，SQL優化器會選擇相同的執行計劃。

　　說到了IN和EXISTS幾乎是同樣的，可是，就不得不說到NOT IN和NOT EXISTS，對於輸入列表中包含NULL值時，NOT EXISTS和NOT IN之間的差別就表現的很是大了。輸入列表包含NULL值時，IN老是返回TRUE和UNKNOWN，所以NOT IN就會獲得NOT TRUE和NOT UNKNOWN，即FALSE和UNKNOWN。

　　10. 派生表

　　上面也說到了，在子查詢返回的值中，也可能返回一個表，若是將子查詢返回的虛擬表再次做爲FROM子句的輸入時，這就子查詢的虛擬表就成爲了一個派生表。語法結構以下：

 
           FROM (subquery expression) AS derived_table_alias

　　因爲派生表是徹底的虛擬表，並無也不可能被物理地具體化。

4、子查詢優化

　　不少查詢中須要使用子查詢。使用子查詢能夠一次性的完成不少邏輯上須要多個步驟才能完成的SQL操做，同時也能夠避免事務或者表鎖死。子查詢可使查詢語句很靈活，但子查詢的執行效率不高。

　　子查詢時，MySQL須要爲內層查詢語句的查詢結果創建一個臨時表。而後外層查詢語句再臨時表中查詢記錄。查詢完畢後，MySQL須要撤銷這些臨時表。所以，子查詢的速度會受到必定的影響。若是查詢的數據量比較大，這種影響就會隨之增大。

　　在MySQL中可使用鏈接查詢來替代子查詢。鏈接查詢不須要創建臨時表，其速度比子查詢要快。

　　　　使用鏈接(JOIN)來代替子查詢
　　　　如：　　

 
           例子1： 
          
           SELECT * FROM t1 
          
           WHERE t1.a1 NOT  
           in  
           (SELECT a2 FROM t2 )  
          
           優化後： 
          
           SELECT * FROM t1  
          
           LEFT JOIN t2 ON t1.a1=t2.a2  
          
           WHERE t2.a2 IS NULL

 
           例子2： 
          
           SELECT * FROM article WHERE (title,content,uid) IN (SELECT title,content,uid FROM blog) 
          
           優化後： 
          
           SELECT * FROM article 
          
           inner  
           join  
           blog  
          
           on  
           (article.title=blog.title AND article.content=blog.content AND article.uid=blog.uid)

　　不能優化的子查詢：　　一、mysql不支持子查詢合併和聚合函數子查詢優化，mariadb對聚合函數子查詢進行物化優化；　　二、mysql不支持from子句子查詢優化，mariadb對from子句子查詢進行子查詢上拉優化；　　三、mysql和mariadb對子查詢展開提供有限的支持，如對主鍵的操做才能進行上拉子查詢優化；　　四、mysql不支持exists子查詢優化，mariadb對exists關聯子查詢進行半鏈接優化，對exists非關聯子查詢沒有進一步進行優化；　　五、mysql和mariadb不支持not exists子查詢優化；　　六、mysql和mariadb對in子查詢，對知足半鏈接語義的查詢進行半鏈接優化，再基於代價評估進行優化，二者對半鏈接的代價評估選擇方式有差別；　　七、mysql不支持not in子查詢優化，mariadb對非關聯not in子查詢使用物化優化，對關聯not in子查詢不作優化；　　八、mysql和mariadb對>all非關聯子查詢使用max函數，<all非關聯子查詢使用min函數，對=all和非關聯子查詢使用exists優化；　　九、對>some和>any非關聯子查詢使用min函數，對<some和<any非關聯子查詢使用max函數，=any 和=some子查詢使用半鏈接進行優化，對>some和>any關聯子查詢以及<some和<any關聯子查詢只有exists 優化。

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。