sql中條件放在on後面和where後面的區別

數據庫在經過鏈接兩張或多張表來返回記錄時,都會生成一張中間的臨時表,而後再將這張臨時表返回給用戶。數據庫

      在使用left jion時,on和where條件的區別以下:spa

一、 on條件是在生成臨時表時使用的條件,它無論on中的條件是否爲真,都會返回左邊表中的記錄。orm

二、where條件是在臨時表生成好後,再對臨時表進行過濾的條件。這時已經沒有left join的含義(必須返回左邊表的記錄)了,條件不爲真的就所有過濾掉。ci

       假設有兩張表:工作流

表1:tab2io

idtable

sizeform

1select

10技術

2

20

3

30

表2:tab2

size

name

 

10

AAA

20

BBB

20

CCC

兩條SQL: 一、select * form tab1 left join tab2 on (tab1.size = tab2.size) where tab2.name=’AAA’

二、select * form tab1 left join tab2 on (tab1.size = tab2.size and tab2.name=’AAA’)

第一條SQL的過程:

一、中間表 on條件: tab1.size = tab2.size
tab1.id tab1.size tab2.size tab2.name

1

10

10

AAA

2

20

20

BBB

2

20

20

CCC

3

30

(null)

(null)

|

|

二、再對中間表過濾 where 條件: tab2.name=’AAA’

tab1.id tab1.size tab2.size tab2.name

1

10

10

AAA

   

 

第二條SQL的過程:

一、中間表 on條件: tab1.size = tab2.size and tab2.name=’AAA’ (條件不爲真也會返回左表中的記錄)
tab1.id tab1.size tab2.size tab2.name

1

10

10

AAA

2

20

(null)

(null)

3

30

(null)

(null)

     其實以上結果的關鍵緣由就是left join,right join,full join的特殊性,無論on上的條件是否爲真都會返回left或right表中的記錄,full則具備left和right的特性的並集。 而inner jion沒這個特殊性,則條件放在on中和where中,返回的結果集是相同的。

 

能夠這樣理解:on是在生成鏈接表的起做用的,where是生成鏈接表以後對鏈接表再進行過濾。

當使用left join時,不管on的條件是否知足,都會返回左表的全部記錄,對於知足的條件的記錄,兩個表對應的記錄會鏈接起來,對於不知足條件的記錄,那右表字段所有是null

當使用right join時,相似,只不過是所有返回右表的全部記錄

當使用inner join時,功能與where徹底相同。

 

通過親測後,更加深了對on和where的理解,得出如下結論:

0. on後的條件若是有過濾主表的條件,則結果對於不符合該條件的主表數據也會原條數保留,只是不匹配右表數據而已。對於on後面對右表的過濾條件,鏈接時會用該條件直接過濾右表數據後再和左邊進行左鏈接。總之,對於不知足on後面的全部條件的數據,左表會在結果數據中原條數保留數據,只是不匹配右表數據而已。不知足條件的右表數據各字段會直接以NULL鏈接主表。

1.ON後對左表的篩選條件對於結果行數會被忽略,但會影響結果中的匹配右表數據,由於只有符合左表條件的數據纔會去和符合條件的右表數據進行匹配,不符合條件的左表數據會保留在最後結果中,但匹配的右表數據都是NULL.所以,對於須要過濾左表數據的話,須要把過濾條件放到where後面。

2.ON後的左表條件(單獨對左表進行的篩選條件)對於結果行數無影響,仍是會返回全部左表的數據,但和右表匹配數據時,系統只會拿左表符合條件(ON後的對左表過濾條件)的數據去和右表符合條件(ON後的對右表過濾條件)的數據進行匹配抓取數據,而不符合條件的左表數據仍是會出如今結果列表中,只是對應的右表數據都是NULL。

3.ON後的右表條件(單獨對右表進行的篩選條件)會先對右表進行數據篩選後再和左表作鏈接查詢,對結果行數有影響(當左表對右表是一對多時),但不會影響左表的顯示行數,而後拿符合條件的右表數據去和符合條件的左表數據進行匹配。

4.Where仍是對鏈接後的數據進行過濾篩選,這個無異議。

5.匹配數據時不管左右表,都是拿符合ON後的過濾條件去作數據匹配,不符合的會保留左表數據,用NULL填充右表數據。

綜上得出,ON後面對於左表的過濾條件,在最後結果行數中會被忽略,並不會先去過濾左表數據再鏈接查詢,可是ON後的右表條件會先過濾右表數據再鏈接左表進行查詢。

鏈接查詢時,都是用符合ON後的左右表的過濾條件的數據進行鏈接查詢,只有符合左右表過濾條件的數據才能正確匹配,剩下的左表數據會正常出如今結果集中,但匹配的右表數據是NULL。所以對於左表的過濾條件切記要放到Where後,對於右表的過濾條件要看狀況了。若是須要先過濾右表數據就把條件放到ON後面便可。

on、where、having的區別

 

on、where、having這三個均可以加條件的子句中,on是最早執行,where次之,having最後。有時候若是這前後順序不影響中間結果的話,那最終結果是相同的。但由於on是先把不符合條件的記錄過濾後才進行統計,它就能夠減小中間運算要處理的數據,按理說應該速度是最快的。          根據上面的分析,能夠知道where也應該比having快點的,由於它過濾數據後才進行sum,因此having是最慢的。但也不是說having沒用,由於有時在步驟3還沒出來都不知道那個記錄才符合要求時,就要用having了。          在兩個表聯接時才用on的,因此在一個表的時候,就剩下where跟having比較了。在這單表查詢統計的狀況下,若是要過濾的條件沒有涉及到要計算字段,那它們的結果是同樣的,只是where可使用rushmore技術,而having就不能,在速度上後者要慢。          若是要涉及到計算的字段,就表示在沒計算以前,這個字段的值是不肯定的,根據上篇寫的工做流程,where的做用時間是在計算以前就完成的,而having就是在計算後才起做用的,因此在這種狀況下,二者的結果會不一樣。          在多表聯接查詢時,on比where更早起做用。系統首先根據各個表之間的聯接條件,把多個表合成一個臨時表後,再由where進行過濾,而後再計算,計算完後再由having進行過濾。因而可知,要想過濾條件起到正確的做用,首先要明白這個條件應該在何時起做用,而後再決定放在那裏

笛卡爾乘積:

單純的select * from a,b是笛卡爾乘積。

可是若是對兩個表進行關聯:select * from a,b where a.id = b.id 意思就變了,此時就等價於:

select * from a inner join b on a.id = b.id。即就是內鏈接。  

相關文章
相關標籤/搜索