SQL Server溫故系列(3):SQL 子查詢 & 公用表表達式 CTE

<h2 id="1">一、子查詢 Subqueries</h2> 子查詢是一個嵌套在 SELECT、INSERT、UPDATE 或 DELETE 語句或其餘子查詢中的查詢。通俗來說,子查詢就是嵌套在大「查詢」中的小查詢。子查詢也稱爲內部查詢或內部選擇,而包含子查詢的語句也稱爲外部查詢或外部選擇。html

從概念上說,子查詢結果會代入外部查詢(儘管這不必定是 SQL Server 實際處理帶有子查詢的 T-SQL 語句的方式)。因此子查詢會在其父查詢以前執行,以即可以將內部查詢的結果傳遞給外部查詢。程序員

比較常見的子查詢有:單行子查詢、多行子查詢、相關子查詢、嵌套子查詢等。然而並無一種涇渭分明的子查詢分類方法,換句話說,有可能某個子查詢既是多行子查詢,也是相關子查詢,同時仍是嵌套子查詢。sql

<h4 id="11">1.一、單行子查詢</h4> 顧名思義,單行子查詢就是隻查詢一行數據的內部查詢。若是單行子查詢僅返回單一值,就能夠稱之爲**標量子查詢**。標量子查詢也是最多見的單行子查詢。示例以下:express

-- 查詢年齡最小的學生
SELECT * FROM T_Students WHERE Birthday = (SELECT MAX(Birthday) FROM T_Students);

-- 第 1 次課程 1 考試的成績高於學生 12 的成績
SELECT StudentId,Scores FROM T_ExamResults 
WHERE Counts = 1 AND CourseId = 1 AND Scores > (
    SELECT Scores FROM T_ExamResults WHERE Counts = 1 AND CourseId = 1 AND StudentId = 12);

-- 歷次課程 1 考試的平均分高於學生 12 的成績
SELECT StudentId,AVG(Scores) AvgScore,COUNT(1) ExamCount FROM T_ExamResults 
WHERE CourseId = 1 
GROUP BY StudentId 
HAVING AVG(Scores) > (SELECT AVG(Scores) FROM T_ExamResults WHERE CourseId = 1 AND StudentId = 12);

<h4 id="12">1.二、多行子查詢</h4> 相較於單行子查詢,多行子查詢就是會返回多行的內部查詢。示例以下:oracle

-- 查詢有女生的班級裏的學生
SELECT * FROM T_Students WHERE ClassId IN(SELECT ClassId FROM T_Students WHERE Gender = 0);

-- 查詢有女生的班級以外的全部班級的學生
SELECT * FROM T_Students WHERE ClassId NOT IN(SELECT ClassId FROM T_Students WHERE Gender = 0);

-- 查詢有 2003 年及之後出生的學生的班級
SELECT * FROM T_Classes WHERE Id IN(SELECT ClassId FROM T_Students WHERE Birthday >= '2003-01-01');

<h4 id="13">1.三、相關子查詢</h4> 相關子查詢是指查詢條件引用了外部查詢中字段的內部查詢。相反的,若是外部查詢的字段沒有出如今內部查詢的條件中即爲非相關子查詢。相關子查詢的內部查詢得依靠外部查詢得到值,這意味着內部查詢是重複執行的,爲外部查詢選擇的每一行都要執行一次,所以相關子查詢也被稱之爲重複子查詢。示例以下:性能

-- 查詢在三(1)班和三(2)班的學生
SELECT * FROM T_Students t1 WHERE EXISTS(
    SELECT Id FROM T_Classes t2 WHERE t2.Id = t1.ClassId AND t2.Name IN('三(1)班','三(2)班'));

-- 查詢不在三(1)班和三(2)班的學生
SELECT * FROM T_Students t1 WHERE NOT EXISTS(
    SELECT Id FROM T_Classes t2 WHERE t2.Id = t1.ClassId AND t2.Name IN('三(1)班','三(2)班'));

-- 查詢第 1 次考試的課程及參加了的學生
SELECT (SELECT t2.Name FROM T_Courses t2 WHERE t2.Id=t1.CourseId) CourseName,
       (SELECT t3.Name FROM T_Students t3 WHERE t3.Id=t1.StudentId) StudentName 
FROM T_ExamResults t1 WHERE t1.Counts = 1;

<h4 id="14">1.四、嵌套子查詢</h4> 嵌套子查詢是指查詢內部嵌套一個或多個子查詢的內部查詢。一個 T-SQL 語句中能夠嵌套任意數量的子查詢,儘管一般來講沒有這種必要。示例以下:code

-- 查詢參加了第 1 次課程 1 考試的學生
SELECT * FROM T_Students t3 WHERE t3.Id IN(
    SELECT t2.StudentId FROM T_ExamResults t2 WHERE t2.Counts = 1 AND t2.CourseId = (
        SELECT t1.Id FROM T_Courses t1 WHERE t1.Name = '英語'));

-- 查詢西湖區所在的城市的全部學生
SELECT t3.* FROM T_Students t3 WHERE SUBSTRING(t3.Code,2,6) IN(
    SELECT t2.Code FROM T_Districts t2 WHERE t2.ParentId = (
        SELECT t1.ParentId FROM T_Districts t1 WHERE t1.Name = '西湖區'));

<h4 id="15">1.五、子查詢小結及性能問題</h4> 上文主要講述了查詢語句中的子查詢,其實在增刪改語句中也同樣可以使用子查詢。任何能使用表達式的地方均可以使用子查詢,只要它返回的是單個值便可。不少包含子查詢的語句均可以改寫成鏈接查詢。示例以下:orm

-- 更新語句(子查詢寫法)
UPDATE T_Students SET Remark='考過滿分' 
WHERE Id IN(SELECT t.StudentId FROM T_ExamResults t WHERE t.Scores = 100);

-- 更新語句(鏈接寫法)
UPDATE T_Students SET Remark='考過滿分' 
FROM T_Students t1 JOIN T_ExamResults t2 ON t1.Id = t2.StudentId AND t2.Scores = 100;

-- 刪除語句(子查詢寫法)
DELETE T_ExamResults WHERE Counts = 10 AND StudentId = (
    SELECT t.Id FROM T_Students t WHERE t.Code = 'S330104010');

-- 刪除語句(鏈接寫法)
DELETE T_ExamResults FROM T_ExamResults t1 
JOIN T_Students t2 ON t1.StudentId = t2.Id AND t1.Counts = 10 AND t2.Code = 'S330104010';

在 T-SQL 中,包含子查詢的語句和語義上等效的不包含子查詢的語句在性能上一般是沒有差異的。但在一些須要爲外部查詢的每一個結果都執行內部查詢的狀況下,使用鏈接寫法會產生更好的性能(若是數據不多,這種差異也很難體現出來),如某些非必須的相關子查詢。示例以下:server

-- 查詢全部學生第 1 次課程 2 考試的成績(子查詢寫法)
SELECT (SELECT t2.Name FROM T_Students t2 WHERE t2.Id = t1.StudentId) StudentName,Scores 
FROM T_ExamResults t1 
WHERE t1.Counts = 1 AND t1.CourseId = 2;

-- 查詢全部學生第 1 次課程 2 考試的成績(鏈接寫法)
SELECT t2.Name StudentName,Scores 
FROM T_ExamResults t1 
JOIN T_Students t2 ON t1.StudentId=t2.Id 
WHERE t1.Counts = 1 AND t1.CourseId = 2;

<h2 id="2">二、公用表表達式 CTE</h2> 在 T-SQL 中,WITH 語句用於指定臨時命名的結果集,這些結果集被稱爲公用表表達式(Common Table Expression,簡稱 CTE)。基本語法以下:htm

WITH cte-name (column-names) AS (cte-query) [,...]

參數釋義以下:

  • cte-name 表明公用表表達式的有效標識符。相似於子查詢的別名,在一個語句中不能出現重複的 cte-name,但能夠與 CTE 引用的基表名稱相同。引用 CTE 中的任何字段都得用 cte-name 來限定,而不能使用字段本來所屬的基表來限定。
  • column-names 表明公用表表達式的字段名列表,只要 column-name 的個數與 cte-query 中定義字段數相同便可。若是爲 cte-query 中的全部字段都提供了不一樣的名稱,那麼 column-names 就是可選的了(通常你們都這麼幹,畢竟有誰會喜歡不必的繁瑣呢?)。
  • cte-query 表明一個公用表表達式的查詢語句,能夠是任意合法的 SELECT 語句。

<h4 id="21">2.一、普通公用表表達式</h4> CTE 可在單條 INSERT、DELETE、UPDATE 或 SELECT 語句的執行範圍內定義。

CTE & INSERT 如要把 2000 年以前出生的女生信息插入到好學生表中,用 CTE 定義女生數據,示例以下:

WITH temp AS(
    SELECT t.Id,t.Name,t.Gender,t.Birthday FROM T_Students t WHERE t.Gender = 0
)
INSERT INTO T_GoodStudents(Id,Name,Gender,Birthday) 
SELECT * FROM temp WHERE Birthday < '2000-01-01';

CTE & DELETE 如要把姓名和性別都是空的學生信息刪除,用 CTE 定義姓名爲空的數據,示例以下:

WITH t AS(
    SELECT t.* FROM T_GoodStudents t WHERE t.Name IS NULL
)
DELETE FROM t WHERE t.Gender IS NULL;

CTE & UPDATE 如要把歷次語文成績的平均分更新到學生備註中,用 CTE 定義學平生均分數據,示例以下:

WITH temp AS(
    SELECT t.StudentId,t.CourseId,AVG(t.Scores) AvgScore 
    FROM T_ExamResults t 
    GROUP BY t.StudentId,t.CourseId
)
UPDATE T_Students SET Remark = t1.AvgScore 
FROM temp t1 
JOIN T_Courses t2 ON t1.CourseId = t2.Id 
WHERE T_Students.Id = t1.StudentId AND t2.Name = '語文';

CTE & SELECT(屢次引用同一個 CTE)如要查詢前 3 次考試的總成績及平均成績,用 CTE 定義各次的成績數據,示例以下:

WITH temp AS(
    SELECT t.StudentId,t.Counts,SUM(t.Scores) SumScore 
    FROM T_ExamResults t 
    WHERE t.Counts IN(1,2,3) 
    GROUP BY t.StudentId,t.Counts
)
SELECT t1.Code,t1.Name,
    t2.SumScore FirstSumScore,t3.SumScore SecondSumScore,t4.SumScore ThirdSumScore,
    (t2.SumScore + t3.SumScore + t4.SumScore)/3 AvgSumScore 
FROM T_Students t1 
JOIN temp t2 ON t1.Id = t2.StudentId AND t2.Counts = 1 
JOIN temp t3 ON t1.Id = t3.StudentId AND t3.Counts = 2 
JOIN temp t4 ON t1.Id = t4.StudentId AND t4.Counts = 3;

CTE & SELECT(一個 WITH 定義多個 CTE)如要查詢男生們前 3 次課程 1 的考試成績,用 CTE 定義各次的成績數據,示例以下:

WITH t1 AS(
    SELECT t.StudentId,t.Scores FROM T_ExamResults t WHERE t.CourseId = 1 AND t.Counts = 1
),
t2 AS(
    SELECT t.StudentId,t.Scores FROM T_ExamResults t WHERE t.CourseId = 1 AND t.Counts = 2
),
t3 AS(
    SELECT t.StudentId,t.Scores FROM T_ExamResults t WHERE t.CourseId = 1 AND t.Counts = 3
)
SELECT t4.Code,t4.Name,t1.Scores FirstScore,t2.Scores SecondScore,t3.Scores ThirdScore 
FROM T_Students t4 
JOIN t1 ON t4.Id = t1.StudentId 
JOIN t2 ON t4.Id = t2.StudentId 
JOIN t3 ON t4.Id = t3.StudentId 
WHERE t4.Gender = 1;

<h4 id="22">2.二、遞歸公用表表達式</h4> CTE 能夠包含對自身的引用,這種表達式被稱爲遞歸公用表表達式。一個遞歸 CTE 中至少要包含兩個查詢定義,一個定位點成員和一個遞歸成員,遞歸成員的 FROM 子句只能引用一次 CTE。另外,定位點成員和遞歸成員兩者的字段數必須相同,字段的數據類型也須要保持一致。

從上到下遞歸,如要查詢浙江省及如下各級別的行政區,示例以下:

WITH temp AS(
    SELECT t1.Id,t1.Name FROM T_Districts t1 WHERE t1.Code = '330000' 
    UNION ALL 
    SELECT t2.Id,t2.Name FROM T_Districts t2,temp t1 WHERE t2.ParentId = t1.Id 
)
SELECT temp.Name FROM temp;

從下到上遞歸,如要查詢西湖區及其全部上級行政區,示例以下:

WITH temp AS(
    SELECT t1.ParentId,t1.Name FROM T_Districts t1 WHERE t1.Code = '330106' 
    UNION ALL 
    SELECT t2.ParentId,t2.Name FROM T_Districts t2,temp t1 WHERE t2.Id = t1.ParentId 
)
SELECT temp.Name FROM temp;

能夠定義多個定位點成員和遞歸成員,但必須將全部定位點成員查詢定義置於第一個遞歸成員定義以前。在起點成員之間能夠用任意集合運算符,而在最後一個定位點成員和第一個遞歸成員之間,以及多個遞歸成員之間,必須用 UNION ALL 來鏈接。示例以下(查詢盧小妹的全部祖先):

WITH temp(Id) AS(
    SELECT t1.Father FROM T_Persons t1 WHERE t1.Name = '盧小妹' 
    UNION 
    SELECT t2.Mother FROM T_Persons t2 WHERE t2.Name = '盧小妹' 
    UNION ALL 
    SELECT t3.Father FROM T_Persons t3,temp WHERE t3.Id = temp.Id 
    UNION ALL 
    SELECT t4.Mother FROM T_Persons t4,temp WHERE t4.Id = temp.Id 
)
SELECT t1.Id,t1.Name,t1.Father,t1.Mother 
FROM T_Persons t1,temp 
WHERE t1.Id=temp.Id;

遞歸運算必定要有出口,不然就是死循環了!SQL Server 提供了一個 MAXRECURSION 提示來限制遞歸級數,以防止出現無限循環。但我我的以爲應該儘量的經過 WHERE 條件或業務邏輯來定義更合理的出口。例如要顯示的限定只返回某一遞歸級別的數據,示例以下(查詢浙江省下全部縣一級的行政區):

WITH temp AS(
    SELECT t1.Id,t1.Name,t1.Code,t1.Level 
    FROM T_Districts t1 
    WHERE t1.Code = '330000' 
    UNION ALL 
    SELECT t2.Id,t2.Name,t2.Code,t2.Level 
    FROM T_Districts t2,temp 
    WHERE t2.ParentId = temp.Id
)
SELECT temp.Code,temp.Name,temp.Level FROM temp WHERE temp.Level = 3;

儘管看上去很簡單,但在實際開發中極可能並無相似 Level 這種標識級別的字段可用。若是是這樣,那咱們還能夠經過遞歸成員的遞歸次數來實現一樣的過濾效果。示例以下:

WITH temp AS(
    SELECT t1.Id,t1.Name,t1.Code,t1.Level,0 Step 
    FROM T_Districts t1 
    WHERE t1.Code = '330000' 
    UNION ALL 
    SELECT t2.Id,t2.Name,t2.Code,t2.Level,temp.Step + 1 
    FROM T_Districts t2,temp 
    WHERE t2.ParentId = temp.Id
)
SELECT temp.Code,temp.Name,temp.Level FROM temp WHERE temp.Step = 2;

<h2 id="3">三、本文小結</h2> 本文主要介紹了 T-SQL 中最多見的幾種子查詢以及公用表表達式 CTE。本文還專門說明了遞歸 CTE,它能夠實現相似於 PL/SQL 中的 CONNECT BY 層次查詢。

本文參考連接:

去導航目錄篇下載建立本系列博文通用庫表及數據的 SQL 語句

本文連接http://www.cnblogs.com/hanzongze/p/tsql-subquery.html 版權聲明:本文爲博客園博主 韓宗澤 原創,做者保留署名權!歡迎經過轉載、演繹或其它傳播方式來使用本文,但必須在明顯位置給出做者署名和本文連接!我的博客,能力有限,如有不當之處,敬請批評指正,謝謝!

原文出處:https://www.cnblogs.com/hanzongze/p/tsql-subquery.html

相關文章
相關標籤/搜索