假設有A、B兩張表。sql
若是查詢在A表中存在,可是在B表中不存在的記錄,應該如何操做?code
假設A表數據:索引
id |
---|
1 |
2 |
3 |
4 |
5 |
B表數據:table
id | a_id |
---|---|
1 | 3 |
其中,B表中的a_id是須要排除的A表的id。效率
這裏咱們要排除A表中id爲3的記錄,實際中可能有上萬條記錄。select
通常咱們首先想到的可能就是not in語句:搜索
select A.* from A where A.id not in(select B.a_id from B);
這樣能夠查詢出正確的結果。遍歷
可是若是B表很長,那麼執行上述的查詢語句,須要用A表中的字段去匹配B表中的每個字段。方法
至關因而A表的每個字段都要遍歷一次B表,效率很是低下。數據
只要A中的字段不在B表中那麼確定要遍歷完B表,若是A表中的字段在B表中,那麼只要遍歷到就退出,進行A表中下一個字段的匹配。
鏈接查詢使咱們平時進行sql查詢用到最多的操做之一了。
相對於not in,使用鏈接查詢的效率更高。
如下咱們分步驟解析用join方法的過程。
由於咱們須要搜索的是A表中的內容,因此第一步,咱們使用A表左鏈接B表,以下:
select * from A left join B on A.id = B.a_id;
這樣B表中會補null,查詢結果:
id | id1 | a_id |
---|---|---|
1 | NULL | NULL |
2 | NULL | NULL |
3 | 1 | 3 |
4 | NULL | NULL |
5 | NULL | NULL |
由於A、B兩表中字段id相同,因此B表中的id字段變成了id1。
仔細觀察能夠發現,咱們須要的結果集[1, 2, 4, 5]所對應的id1字段都是null。
這樣,在查詢語句中加入條件B.id is null,不就能夠完成對只在A表中,但不在B表中的結果集的查詢。
另外,咱們只須要A表中的數據,B表的數據忽略。
因而最終變成:
select A.* from A left join B on A.id=B.a_id where B.id is null;
結果就是:
id |
---|
1 |
2 |
4 |
5 |
就是咱們須要的結果,在A表中,可是不在B表中的記錄。
這樣作還有一個好處,若是A、B表的id、和B表的a_id都加了索引,那麼join方式就可以命中索引。
而若是是子查詢,在MySQL5.6以前的版本,就不會用到A表的索引,查詢效率大