MySQL的select(極客時間學習筆記)

時間 2019-12-09

原文原文鏈接

查詢語句

首先, 準備數據, 地址是: https://github.com/cystanford/sql_heros_data, 除了id之外, 24個字段的含義以下:git

查詢

查詢分爲單列查詢, 多列查詢, 所有查詢等等:github

SELECT name FROM heros; // 單列查詢
SELECT name, hp_max, mp_max, attack_max, defense_max FROM heros; // 多列查詢
SELECT * FROM heros; // 所有查詢

學習階段可使用SELECT *, 可是在生產環境不要用, 由於效率會很是低.sql

起別名

起別名是一種技巧, 能夠對原有名稱進行簡化, 讓SQL語句看起來更加精簡, 這個在多表鏈接查詢的時候很是有用:數據庫

SELECT name AS n, hp_max AS hm, mp_max AS mm, attack_max AS am, defense_max AS dm FROM heros; // 起別名查詢

查詢常數

SELECT 查詢能夠對常數進行查詢, 簡單說就是在SELECT查詢結果中增長一列固定的常數列. 通常用於整合不一樣的數據源, 用常數做爲這個表的標記.網絡

SELECT '王者榮耀' as platform, name FROM heros; // 查詢常數

虛構了一個platform字段, 注意的是, 字符串常數要是用單引引發來, 不然會被當作列名來進行查詢, 會報錯, 若是是數字的話不須要添加單引號.學習

去除重複行

去除重複行是個很是少實用的操做, 關鍵字是DISTINCT:優化

SELECT DISTINCT attack_range FROM heros; 
SELECT DISTINCT attack_range, name FROM heros

須要注意的是:code

DISTINCT須要放在全部的列名以前, 也就是SELECT 以後.
DISTINCT實際上是對後面全部列名的組合進行去除, 並非對某一列進行去重. 這也是爲何DISTINCT要放在全部的列名以前的緣由.

排序檢索數據

檢索數據的時候, 能夠按照某種順序來進行結果的返回, 好比說查詢全部的英雄, 按照最大生命從高到低的順序進行排列, 這個時候排序就要使用到 ORDER BY 子句了, 注意點以下:orm

排序的列名: ORDER BY後面能夠有一個或多個列名, 若是是多個列名進行排序, 會按照後面第一個列先進行排序, 當第一個列的值相同的時候, 再按照第二個列進行排序, 以此類推.
排序的順序: ORDER BY後面能夠註明排序規則, ASC表明遞增排序, DESC表明遞減排序, 沒有註明規則, 默認是遞增排序. 還有對數值類型字段的排序很容易理解, 那若是是文本數據呢? 須要參考數據庫的設置方式, 才能夠進行判斷.
非選擇列排序: ORDER BY 可使用非選擇列進行排序, 也就是說SELECT後面沒有這個列名, 一樣能夠放到ORDER BY後面進行排序.
ORDER BY的位置: ORDER BY一般位於SELECT語句的最後一條子句, 不然會報錯.

SELECT name, hp_max FROM heros ORDER BY hp_max DESC ; // 最大生命排序
SQL：SELECT name, hp_max FROM heros ORDER BY mp_max, hp_max DESC; // 最大法力升序, 法力相同, 生命值降序排序

約束返回結果的數量

約束返回結果的數量, 使用LIMIT關鍵字.blog

SELECT name, hp_max FROM heros ORDER BY hp_max DESC LIMIT 5; // 最大生命值從高到低排序並返回前五條數據

注意的是在不一樣的DBMS中, 使用的關鍵字可能不一樣. 在 MySQL、PostgreSQL、MariaDB 和 SQLite 中使用 LIMIT 關鍵字，並且須要放到 SELECT 語句的最後面。若是是 SQL Server 和 Access，須要使用 TOP 關鍵字

SELECT TOP 5 name, hp_max FROM heros ORDER BY hp_max DESC;

若是是 DB2，使用FETCH FIRST 5 ROWS ONLY這樣的關鍵字

SELECT name, hp_max FROM heros ORDER BY hp_max DESC FETCH FIRST 5 ROWS ONLY;

若是是 Oracle，你須要基於 ROWNUM 來統計行數：

SQL：SELECT name, hp_max FROM heros WHERE ROWNUM <=5 ORDER BY hp_max DESC;

約束返回結果數量能夠減小數據表的網絡傳輸量, 能夠提高查詢效率.

SELECT的執行順序

這裏要說的是兩個順序, 一個是關鍵字的順序, 一個是SELECT語句的執行順序:

關鍵字的順序:

SELECT ... FROM ... WHERE ... GROUP BY ... HAVING ... ORDER BY ...

SELECT語句的執行順序

FROM > WHERE > GROUP BY > HAVING > SELECT 的字段 > DISTINCT > ORDER BY > LIMIT

一條SQL語句, 關鍵字順序和執行順序以下:

SELECT DISTINCT player_id, player_name, count(*) as num # 順序 5
FROM player JOIN team ON player.team_id = team.team_id # 順序 1
WHERE height > 1.80 # 順序 2
GROUP BY player.team_id # 順序 3
HAVING num > 2 # 順序 4
ORDER BY num DESC # 順序 6
LIMIT 2 # 順序 7

在SELECT語句執行這些步驟的時候, 每一個步驟都會生成一張虛擬表, 而後將這個虛擬表傳入下一個步驟做爲輸入. 可是這些步驟是隱含在SQL的執行過程當中, 對咱們是不可見的.

SQL的執行原理

SELECT是先執行FROM這一步的, 這個階段, 若是是多張表聯查, 會經歷下面的步驟:

首先經過笛卡爾積, 獲得虛擬表vt(virtual table)1-1.
經過ON進行篩選, 在虛擬表vt1-1的基礎上進行篩選, 獲得虛擬表vt1-2.
添加外部行. 若是使用的是左鏈接、右鏈接或者是全鏈接, 就會涉及外部行, 也就是虛擬表v1-2的基礎上增長外部行, 獲得虛擬表vt1-3.

兩張以上的表, 會重複上面的步驟, 直到全部的表都被處理完成, 這個過程獲得的最後結論就是如今的原始數據.

拿到原始數據以後, 就能夠在這個基礎上再進行WHERE階段了. 這個過程會再次獲得一個虛擬表,假設爲vt2.

以後進入第三步和第四步, 也就是GROUP BY和HAVING階段, 在vt2上進行分組和分組過濾, 獲得中間的虛擬表vt3.

上面篩序就完成了, 接下來進入到SELECT階段, 固然, 是先查詢出所須要的列(字段), 以後就會進入到DISTINCT階段, 這個也是兩個階段, 也會產生虛擬表.

字段選擇並過濾重複以後就會進入到ORDER BY階段進行排序, 再次獲得虛擬表.

最後進入LIMIT階段, 獲得最終的結果.

在一條SQL中, 不存在的關鍵字, 中間的那部分階段就會省略, 這些就是底層的原理.(疑惑是查詢字段會使用到別名這些, 這些又是如何識別的呢?)

COUNT(*)的優化

通常狀況下：COUNT(*) = COUNT(1) > COUNT(字段), 因此儘可能使用COUNT(*)，固然若是你要統計的是就是某個字段的非空數據行數，那另當別論。畢竟執行效率比較的前提是要結果同樣才行。
若是要統計COUNT(*)，儘可能在數據表上創建二級索引，系統會自動採用key_len小的二級索引進行掃描，這樣當咱們使用SELECT COUNT(*)的時候效率就會提高，有時候提高几倍甚至更高都是有可能的。