首先, 準備數據, 地址是: https://github.com/cystanford/sql_heros_data, 除了id之外, 24個字段的含義以下:git
查詢分爲單列查詢, 多列查詢, 所有查詢等等:github
SELECT name FROM heros; // 單列查詢 SELECT name, hp_max, mp_max, attack_max, defense_max FROM heros; // 多列查詢 SELECT * FROM heros; // 所有查詢
學習階段可使用SELECT *, 可是在生產環境不要用, 由於效率會很是低.sql
起別名是一種技巧, 能夠對原有名稱進行簡化, 讓SQL語句看起來更加精簡, 這個在多表鏈接查詢的時候很是有用:數據庫
SELECT name AS n, hp_max AS hm, mp_max AS mm, attack_max AS am, defense_max AS dm FROM heros; // 起別名查詢
SELECT 查詢能夠對常數進行查詢, 簡單說就是在SELECT查詢結果中增長一列固定的常數列. 通常用於整合不一樣的數據源, 用常數做爲這個表的標記.網絡
SELECT '王者榮耀' as platform, name FROM heros; // 查詢常數
虛構了一個platform字段, 注意的是, 字符串常數要是用單引引發來, 不然會被當作列名來進行查詢, 會報錯, 若是是數字的話不須要添加單引號.學習
去除重複行是個很是少實用的操做, 關鍵字是DISTINCT:優化
SELECT DISTINCT attack_range FROM heros; SELECT DISTINCT attack_range, name FROM heros
須要注意的是:code
檢索數據的時候, 能夠按照某種順序來進行結果的返回, 好比說查詢全部的英雄, 按照最大生命從高到低的順序進行排列, 這個時候排序就要使用到 ORDER BY 子句了, 注意點以下:orm
SELECT name, hp_max FROM heros ORDER BY hp_max DESC ; // 最大生命排序 SQL:SELECT name, hp_max FROM heros ORDER BY mp_max, hp_max DESC; // 最大法力升序, 法力相同, 生命值降序排序
約束返回結果的數量, 使用LIMIT關鍵字.blog
SELECT name, hp_max FROM heros ORDER BY hp_max DESC LIMIT 5; // 最大生命值從高到低排序並返回前五條數據
注意的是在不一樣的DBMS中, 使用的關鍵字可能不一樣. 在 MySQL、PostgreSQL、MariaDB 和 SQLite 中使用 LIMIT 關鍵字,並且須要放到 SELECT 語句的最後面。若是是 SQL Server 和 Access,須要使用 TOP 關鍵字
SELECT TOP 5 name, hp_max FROM heros ORDER BY hp_max DESC;
若是是 DB2,使用FETCH FIRST 5 ROWS ONLY這樣的關鍵字
SELECT name, hp_max FROM heros ORDER BY hp_max DESC FETCH FIRST 5 ROWS ONLY;
若是是 Oracle,你須要基於 ROWNUM 來統計行數:
SQL:SELECT name, hp_max FROM heros WHERE ROWNUM <=5 ORDER BY hp_max DESC;
約束返回結果數量能夠減小數據表的網絡傳輸量, 能夠提高查詢效率.
這裏要說的是兩個順序, 一個是關鍵字的順序, 一個是SELECT語句的執行順序:
SELECT ... FROM ... WHERE ... GROUP BY ... HAVING ... ORDER BY ...
FROM > WHERE > GROUP BY > HAVING > SELECT 的字段 > DISTINCT > ORDER BY > LIMIT
一條SQL語句, 關鍵字順序和執行順序以下:
SELECT DISTINCT player_id, player_name, count(*) as num # 順序 5 FROM player JOIN team ON player.team_id = team.team_id # 順序 1 WHERE height > 1.80 # 順序 2 GROUP BY player.team_id # 順序 3 HAVING num > 2 # 順序 4 ORDER BY num DESC # 順序 6 LIMIT 2 # 順序 7
在SELECT語句執行這些步驟的時候, 每一個步驟都會生成一張虛擬表, 而後將這個虛擬表傳入下一個步驟做爲輸入. 可是這些步驟是隱含在SQL的執行過程當中, 對咱們是不可見的.
SELECT是先執行FROM這一步的, 這個階段, 若是是多張表聯查, 會經歷下面的步驟:
兩張以上的表, 會重複上面的步驟, 直到全部的表都被處理完成, 這個過程獲得的最後結論就是如今的原始數據.
拿到原始數據以後, 就能夠在這個基礎上再進行WHERE階段了. 這個過程會再次獲得一個虛擬表,假設爲vt2.
以後進入第三步和第四步, 也就是GROUP BY和HAVING階段, 在vt2上進行分組和分組過濾, 獲得中間的虛擬表vt3.
上面篩序就完成了, 接下來進入到SELECT階段, 固然, 是先查詢出所須要的列(字段), 以後就會進入到DISTINCT階段, 這個也是兩個階段, 也會產生虛擬表.
字段選擇並過濾重複以後就會進入到ORDER BY階段進行排序, 再次獲得虛擬表.
最後進入LIMIT階段, 獲得最終的結果.
在一條SQL中, 不存在的關鍵字, 中間的那部分階段就會省略, 這些就是底層的原理.(疑惑是查詢字段會使用到別名這些, 這些又是如何識別的呢?)
COUNT(*) = COUNT(1) > COUNT(字段), 因此儘可能使用COUNT(*)
,固然若是你要統計的是就是某個字段的非空數據行數,那另當別論。畢竟執行效率比較的前提是要結果同樣才行。COUNT(*)
,儘可能在數據表上創建二級索引,系統會自動採用key_len小的二級索引進行掃描,這樣當咱們使用SELECT COUNT(*)
的時候效率就會提高,有時候提高几倍甚至更高都是有可能的。