查詢在A表不在B表的數據

假設有A、B兩張表。sql

若是查詢在A表中存在,可是在B表中不存在的記錄,應該如何操做?code

  • 示例數據

假設A表數據:索引

id
1
2
3
4
5

B表數據:table

id a_id
1 3

其中,B表中的a_id是須要排除的A表的id。效率

這裏咱們要排除A表中id爲3的記錄,實際中可能有上萬條記錄。select

  • 子查詢方法

通常咱們首先想到的可能就是not in語句:搜索

select A.* from A where A.id not in(select B.a_id from B);

這樣能夠查詢出正確的結果。遍歷

可是若是B表很長,那麼執行上述的查詢語句,須要用A表中的字段去匹配B表中的每個字段。方法

至關因而A表的每個字段都要遍歷一次B表,效率很是低下。數據

只要A中的字段不在B表中那麼確定要遍歷完B表,若是A表中的字段在B表中,那麼只要遍歷到就退出,進行A表中下一個字段的匹配。

  • 使用join方法

鏈接查詢使咱們平時進行sql查詢用到最多的操做之一了。

相對於not in,使用鏈接查詢的效率更高。

如下咱們分步驟解析用join方法的過程。

由於咱們須要搜索的是A表中的內容,因此第一步,咱們使用A表左鏈接B表,以下:

select * from A left join B on A.id = B.a_id;

這樣B表中會補null,查詢結果:

id id1 a_id
1 NULL NULL
2 NULL NULL
3 1 3
4 NULL NULL
5 NULL NULL

由於A、B兩表中字段id相同,因此B表中的id字段變成了id1。

仔細觀察能夠發現,咱們須要的結果集[1, 2, 4, 5]所對應的id1字段都是null。

這樣,在查詢語句中加入條件B.id is null,不就能夠完成對只在A表中,但不在B表中的結果集的查詢。

另外,咱們只須要A表中的數據,B表的數據忽略。

因而最終變成:

select A.* from A left join B on A.id=B.a_id where B.id is null;

結果就是:

id
1
2
4
5

就是咱們須要的結果,在A表中,可是不在B表中的記錄。

這樣作還有一個好處,若是A、B表的id、和B表的a_id都加了索引,那麼join方式就可以命中索引。

而若是是子查詢,在MySQL5.6以前的版本,就不會用到A表的索引,查詢效率大

相關文章
相關標籤/搜索