多表鏈接查詢,我感受應該是關係型數據庫最能體現其價值和靈活性的地方吧. 我以爲數據庫的做用, 概括起來無非就是存儲和查詢.mysql
一言蔽之,數據庫就是能靈活地存儲和查詢數據. 存儲上, 也是以文件的方式存的(Linux觀點, 一切皆文件), 文件就是存儲數據的載體, 數據庫文件跟其餘的數據文件區別在於其是有規則的. 有約束和規範, 不像工做那樣,不少地方都在瞎搞,正是由於有事先約定, 所以數據庫檢索數據是很是快速的.sql
固然存儲方式上,我平時本身用的話就單機存便可, 公司的話通常都是分佈式存儲的, 數據其實都是分佈在各臺機器上的,什麼主從配置之類的. 我平時學習用對於存儲倒不太關注,固然也會練習配置下主從.數據庫
顯然查詢時用的最多的, 咱們部門到如今都沒有真正用上數據庫, 每一個系統間的書都有些小問題,平常工做都是從各系統導出查詢集,讓後手工Excel進行Vlookup, 純人工作數即是打算離職的主要緣由了. 畢竟vlookup+sumifs/contifs/pivote table 的工做效率上,是遠不及sql的select ,join, aggregation的. 但兩者完成的工做倒是同樣的,只是效率的差異.編程
表連經常使用的有左(外)鏈接, 右(外)鏈接, 內鏈接, 笛卡爾積等. 平時用的vlookup 其實就是左鏈接. 表與表之間能進行鏈接,必然有進行鏈接的依據,即共同的字段(key), 否則就是直接拼接,而非鏈接了.分佈式
我這大半年的業務,都是vlookup 左鏈接, 基本不用inner join, 爲啥, 業務的要求, 就是要以左表爲作數的基礎, 否則不斷從其餘表(右表)去匹配數據, 致使很難程序程序化.這裏仍然之前面 student, classes 表進行演示.函數
-- 登陸mysql客戶端, 查看下使用的數據集 mysql> use student_db; Database changed mysql> show tables; +----------------------+ | Tables_in_student_db | +----------------------+ | classes | | clock_in | | students | +----------------------+ 3 rows in set (0.04 sec) mysql> select * from classes; +----+------+ | id | name | +----+------+ | 1 | 科學 | | 2 | 藝術 | +----+------+ 2 rows in set (0.09 sec) mysql> select * from students; +----+----------+-----+--------+--------+----------+-----------+ | id | name | age | height | gender | class_id | is_delete | +----+----------+-----+--------+--------+----------+-----------+ | 1 | 愛因斯坦 | 18 | 180.00 | 男 | 1 | 0 | | 2 | 居里夫人 | 18 | 180.00 | 女 | 2 | 1 | | 3 | 小王子 | 14 | 185.00 | 男 | 1 | 0 | | 4 | 李銀河 | 59 | 175.00 | 男 | 2 | 1 | | 5 | 黃蓉 | 38 | 160.00 | 女 | 1 | 0 | | 6 | 冰心 | 28 | 150.00 | 女 | 2 | 1 | | 7 | 王祖賢 | 18 | 172.00 | 女 | 1 | 1 | | 8 | 周杰倫 | 36 | NULL | 男 | 1 | 0 | | 9 | 王小波 | 57 | 181.00 | 男 | 2 | 0 | | 10 | 林徽因 | 25 | 166.00 | 女 | 2 | 0 | | 11 | 小星 | 33 | 162.00 | 未填寫 | 3 | 1 | | 12 | 張愛玲 | 12 | 180.00 | 女 | 4 | 0 | | 13 | 馮唐 | 12 | 170.00 | 男 | 4 | 0 | | 14 | 胡適 | 34 | 176.00 | 男 | 5 | 0 | +----+----------+-----+--------+--------+----------+-----------+ 14 rows in set (0.25 sec)
若是沒有測試數據, 就是本身create database / table, 而後 create table .. 而後 insert into tb_name values (), (),...了呀.學習
關聯依據: students 表的 class_id 和 classes 表的 id 表示的是同一個東西(班級id)測試
補充個寫sql的技巧(大體模擬計算機的運行順序來)spa
select 最後寫, 進行分塊查詢, 再拼接(join, union...), 腦海裏時刻有表的形象.code
-- 檢索出學生和班級能對應上的信息 select s.*, c.* from students s, classes c -- as可省略 where s.class_id = c.id; -- 這種默認的where等值鏈接, 其實就跟 inner join 是同樣的 -- out +----+----------+-----+--------+--------+----------+-----------+----+------+ | id | name | age | height | gender | class_id | is_delete | id | name | +----+----------+-----+--------+--------+----------+-----------+----+------+ | 1 | 愛因斯坦 | 18 | 180.00 | 男 | 1 | 0 | 1 | 科學 | | 2 | 居里夫人 | 18 | 180.00 | 女 | 2 | 1 | 2 | 藝術 | | 3 | 小王子 | 14 | 185.00 | 男 | 1 | 0 | 1 | 科學 | | 4 | 李銀河 | 59 | 175.00 | 男 | 2 | 1 | 2 | 藝術 | | 5 | 黃蓉 | 38 | 160.00 | 女 | 1 | 0 | 1 | 科學 | | 6 | 冰心 | 28 | 150.00 | 女 | 2 | 1 | 2 | 藝術 | | 7 | 王祖賢 | 18 | 172.00 | 女 | 1 | 1 | 1 | 科學 | | 8 | 周杰倫 | 36 | NULL | 男 | 1 | 0 | 1 | 科學 | | 9 | 王小波 | 57 | 181.00 | 男 | 2 | 0 | 2 | 藝術 | | 10 | 林徽因 | 25 | 166.00 | 女 | 2 | 0 | 2 | 藝術 | +----+----------+-----+--------+--------+----------+-----------+----+------+ -- inner join on select s.*, c.* from students s inner join classes c on s.class_id = c.id; -- out +----+----------+-----+--------+--------+----------+-----------+----+------+ | id | name | age | height | gender | class_id | is_delete | id | name | +----+----------+-----+--------+--------+----------+-----------+----+------+ | 1 | 愛因斯坦 | 18 | 180.00 | 男 | 1 | 0 | 1 | 科學 | | 2 | 居里夫人 | 18 | 180.00 | 女 | 2 | 1 | 2 | 藝術 | | 3 | 小王子 | 14 | 185.00 | 男 | 1 | 0 | 1 | 科學 | | 4 | 李銀河 | 59 | 175.00 | 男 | 2 | 1 | 2 | 藝術 | | 5 | 黃蓉 | 38 | 160.00 | 女 | 1 | 0 | 1 | 科學 | | 6 | 冰心 | 28 | 150.00 | 女 | 2 | 1 | 2 | 藝術 | | 7 | 王祖賢 | 18 | 172.00 | 女 | 1 | 1 | 1 | 科學 | | 8 | 周杰倫 | 36 | NULL | 男 | 1 | 0 | 1 | 科學 | | 9 | 王小波 | 57 | 181.00 | 男 | 2 | 0 | 2 | 藝術 | | 10 | 林徽因 | 25 | 166.00 | 女 | 2 | 0 | 2 | 藝術 | +----+----------+-----+--------+--------+----------+-----------+----+------+
給表, 字段取別名 as
-- 查詢前3個藝術班女生的姓名和班級 select s.name as "姓名", c.name as "班級" from students s inner join classes c on s.class_id = c.id where (s.gender = "女") and (c.name = "藝術") limit 3; -- out +----------+------+ | 姓名 | 班級 | +----------+------+ | 居里夫人 | 藝術 | | 冰心 | 藝術 | | 林徽因 | 藝術 | +----------+------+ 3 rows in set (0.15 sec)
不難發現, 其實sql仍是很簡單的, 只要你的邏輯是清晰的, 一點一點地查詢出來. 其實無非也就兩種形式, 多表鏈接+where+... 或者配合子查詢而後再進行union, 套路都是同樣的.
-- 查詢能對應上班級的學生和班級信息, 並按照班級名稱降序 select * from students s, classes c where s.class_id = c.id order by c.name desc limit 3; -- out +----+--------+-----+--------+--------+----------+-----------+----+------+ | id | name | age | height | gender | class_id | is_delete | id | name | +----+--------+-----+--------+--------+----------+-----------+----+------+ | 4 | 李銀河 | 59 | 175.00 | 男 | 2 | 1 | 2 | 藝術 | | 6 | 冰心 | 28 | 150.00 | 女 | 2 | 1 | 2 | 藝術 | | 10 | 林徽因 | 25 | 166.00 | 女 | 2 | 0 | 2 | 藝術 | +----+--------+-----+--------+--------+----------+-----------+----+------+ 3 rows in set (0.07 sec) -- 先按班級名降序, 若是班級名相同, 則按身高降序, 再則按學生id升序 select s.name, s.height, c.name from students s, classes c where s.class_id = c.id order by c.name desc, s.height desc, s.id asc limit 6; -- out +----------+--------+------+ | name | height | name | +----------+--------+------+ | 王小波 | 181.00 | 藝術 | | 居里夫人 | 180.00 | 藝術 | | 李銀河 | 175.00 | 藝術 | | 林徽因 | 166.00 | 藝術 | | 冰心 | 150.00 | 藝術 | | 小王子 | 185.00 | 科學 | +----------+--------+------+ 6 rows in set (0.09 sec)
left join 我在工做中天天都在用, 功能跟Excel的vlookup同樣的, 都以左表爲基礎進行匹配, 沒匹配上則顯示爲Null
-- 從classes表中, 匹配出student的姓名和班級 select s.name as "姓名", c.name as "班級" from students s left join classes c on s.class_id = c.id; -- out +----------+------+ | 姓名 | 班級 | +----------+------+ | 愛因斯坦 | 科學 | | 小王子 | 科學 | | 黃蓉 | 科學 | | 王祖賢 | 科學 | | 周杰倫 | 科學 | | 居里夫人 | 藝術 | | 李銀河 | 藝術 | | 冰心 | 藝術 | | 王小波 | 藝術 | | 林徽因 | 藝術 | | 小星 | NULL | | 張愛玲 | NULL | | 馮唐 | NULL | | 胡適 | NULL | +----------+------+ 14 rows in set (0.18 sec) -- 查詢出沒有對應班級的學生姓名 select s.name, c.name from students s left join classes c on s.class_id = c.id having c.name is null; +--------+------+ | name | name | +--------+------+ | 小星 | NULL | | 張愛玲 | NULL | | 馮唐 | NULL | | 胡適 | NULL | +--------+------+ 4 rows in set (0.05 sec) -- 過濾條件用where也是能夠的 select s.name, c.name from students s left join classes c on s.class_id = c.id where c.name is null;
where 與 having的區別
where 是在分組前對數據進行過濾, where 後邊不能用聚合函數
hvaing 是在分組後對數據進行過濾, having 後面能夠用聚合函數
查詢中的執行順序: from > where > group by 及 聚合函數 > having > order > select
having 即用來彌補where在group by 時的不足, 由於where > 聚合函數
所謂子查詢,沒法就是select 嵌套呀, 這個只要有學過一點編程的小夥伴都立馬能get, 就算不會編程, 我看我同事用Excel的公式嵌套也很厲害的, 外層一個sumifs, 裏面一個vlookup.... 反正原理都同樣的.
-- 標量: 查詢出高於平均身高的學生姓名, 身高, 所在班級 -- step 1: 先查出身高均值(標量) select avg(height) from students; +-------------+ | avg(height) | +-------------+ | 172.076923 | +-------------+ 1 row in set (0.07 sec) -- step2: 嵌套進來呀 select s.name, s.height, c.name from students s left join classes c on class_id = c.id where s.height > (select avg(height) from students); +----------+--------+------+ | name | height | name | +----------+--------+------+ | 愛因斯坦 | 180.00 | 科學 | | 小王子 | 185.00 | 科學 | | 居里夫人 | 180.00 | 藝術 | | 李銀河 | 175.00 | 藝術 | | 王小波 | 181.00 | 藝術 | | 張愛玲 | 180.00 | NULL | | 胡適 | 176.00 | NULL | +----------+--------+------+ 7 rows in set (0.11 sec)
列子查詢: 即一查多, 關鍵字: in
-- 查詢出, 根據班級id, 所對應的學生名字 -- 分析,一個班級ID -> 多個名字, 是一查多(列子查詢) select s.name from students s where s.class_id in (select id from classes) -- out | name | +----------+ | 愛因斯坦 | | 居里夫人 | | 小王子 | | 李銀河 | | 黃蓉 | | 冰心 | | 王祖賢 | | 周杰倫 | | 王小波 | | 林徽因 | +----------+
行級子查詢 (將多個字段合成一個行元素)
-- 查詢出 年齡最大, 且身高最高的的學生信息 select * from students s where (s.age, s.height) = (select max(age), max(height) from students); -- out: 可能不存在這樣牛逼的記錄 Empty set
數據庫最核心的兩個功能在於存儲和檢索數據
查詢高效的緣由在於,數據文件的組織,存儲方式等是有規則約定的.
執行順序是from > where > group by 及 聚合函數 > having > order > select
經常使用的錶鏈接有inner join, left join, right join ... 我平時用最多的left join 由於Excel的vlookup 緣由
子查詢其實就是sql的嵌套, 根據返回的結果有標量, 列, 行的形式
接下的講講自鏈接, 多表聯合查詢進階, 即子查詢配合錶鏈接, where, union這些....