mysql group by排序問題

類如 有一個 帖子的回覆表,posts( id , tid , subject , message ,  dateline ) ,

id爲 自動增加字段, tid爲該回復的主題帖子的id(外鍵關聯),  subject 爲回覆標題, message 爲回覆內容, dateline 爲回覆時間,用UNIX 時間戳表示,

如今要求 選出 前十個來自不一樣主題的最新回覆


SELECT * FROM posts GROUP BY  tid  LIMIT 10



這樣一個sql語句選出來的並不是你想要的 最新的回覆,而是最先的回覆,其實是某篇主題的第一條回覆記錄!

也就是說 GROUP BY 語句沒有排序,那麼怎麼才能讓 GROUP 按照 dateline 倒序排列呢?加上 order by 子句?

看下面:

SELECT * FROM posts GROUP BY  tid  ORDER BY dateline DESC LIMIT 10


這 條語句選出來的結果和上面的徹底同樣,不過把結果倒序排列了,而選擇出來的每一條記錄仍然是上面的記錄,緣由是 group by 會比 order by 先執行,這樣也就沒有辦法將 group by 以前,也就是在分組以前進行排序了, 有網友會寫出下面的sql 語句:


SELECT * FROM posts GROUP BY  tid DESC ORDER BY dateline DESC LIMIT 10



也 就是說 在 GROUP BY 的字段 tid 後面加上遞減順序,這樣不就能夠取得分組時的最後回覆了嗎?這個語句執行結果會和上面的如出一轍,這裏加上 DESC 和ASC對執行結果沒有任何影響!其實這是一個錯誤的語句,緣由是GROUP BY 以前並無排序功能,mysql 手冊上面說,GROUP BY 時是按照某種順序排序的,某種順序究竟是什麼順序?其實根本沒有順序,由於按照tid分組,其實也就是說,把tid相等的概括到一個組,這樣想的 話,GROUP BY tid DESC 能夠認爲是在按照 tid 分組的時候,按照tid進行倒序排列,這不扯嗎,既然是按照tid分組,固然是tid相等的歸到一組,而這時候按照tid倒敘仍是升序有個P用!


因而有網友發明下面的語句:


SELECT * FROM posts GROUP BY  tid , dateline DESC ORDER BY dateline DESC LIMIT 10



心 想這樣我就能夠在分組前按照  dateline 倒序排列了,其實這個語句並無起到按照tid分組的做用,緣由仍是上面的,在group by 字段後加 desc 仍是 asc 是錯誤的寫法,而這種寫法 網友本意是想 按照 tid 分組,而且在分組的時候按照 dateline排倒序!而實際這句至關於下面的寫法:(去掉 GROUP BY 字段後面的 DESC)


SELECT * FROM posts GROUP BY  tid , dateline ORDER BY dateline DESC LIMIT 10


也就是說,按照 tid 和 dateline 聯合分組,只有在記錄tid和dateline 同時相等的時候才概括到一組,這顯然不可能, 由於 dateline 時間線基本上是惟一的!


有人寫出下面的語句:


SELECT *,max(dateline) as max_line FROM posts GROUP BY  tid ORDER BY dateline DESC LIMIT 10


這條語句的沒錯是選出了最大發布時間,可是你能夠對比一下 dateline 和 max_dateline 並不相等!(可能有至關的狀況,就是分組的目標記錄只有一條的時候!)


爲何呢?緣由很簡單,這條語句至關因而 在group by 之後選出 本組的最大的 發佈時間!對分組沒有起到任何影響!由於SELECT子句是最後執行的!

後來更有網友發明了下面的寫法!


SELECT *,max(dateline) as max_line FROM posts GROUP BY  tid HAVING dateline=max(dateline)


ORDER BY dateline DESC LIMIT 10



這 條語句的預期結果和想象中的並不相同!由於你會發現,分組的結果中大量的記錄沒有了!爲何?由於 HAVING 是在分組的時候執行的,也就說:在分組的時候加上一個這樣的條件:選擇出來的 dateline 要和 本組最大的dateline 相等,執行的結果和下面的語句相同:


SELECT *,max(dateline) as max_line FROM posts GROUP BY  tid HAVING count(*)=1


ORDER BY dateline DESC LIMIT 10


看了這條sql語句是否是明白了呢?

dateline=max(dateline) 只有在分組中的記錄只有一條的時候才成立,緣由很明白吧!只有一條他纔會和本組的最大發布時間相等阿,(默認dateline爲不重複的值)


原 因仍是由於 group by 並無排序功能,全部的這些排序功能只是錯覺,因此你最終選出的 dateline 和max(dateline) 永遠不可能相等,除非本組的記錄只有一條!GROUP BY 在分組的時候,多是一個一個來找的,發現有相等的tid,去掉,保留第一個發現的那一條記錄,因此找出來的 記錄永遠只是按照默認索引順序排列的!


那麼說了這麼多,到底有沒有辦法讓 group by 執行前分組阿?有的 ,子查詢阿!


最簡單的 :

SELECT * FROM (SELECT * FROM posts ORDER BY dateline DESC)  as   new  GROUP BY  tid ORDER BY dateline DESC LIMIT 10 也有網友利用自鏈接實現的 ,這樣的效率應該比上面的子查詢效率高,不過,爲了簡單明瞭,就只用這樣一種了,GROUP BY沒有排序功能,多是mysql弱智的地方,也許是我尚未發現
相關文章
相關標籤/搜索