MySQL GROUP BY 和GROUP_CONCAT的一些用法

1)  做用:GROUP BY 語句根據一個或多個列對結果集進行分組。mysql

所謂的分組就是根據GROUP BY中的分組標記,將一個「數據集」劃分紅若干個「小區域」,每一個分組標記相同的值,會劃分在同一個"小區域中",最終查詢出的結果只會顯示"小區域"中一條記錄。sql

2)GROUP BY 語句中的GROUP_CONCAT()函數函數

由於GROUP BY默認只顯示了組中一條記錄,若是想看組內的全部信息,就須要用到GROUP_CONCAT()函數測試

3)COUNT()函數:統計記錄總數 ui

COUNT(*)會統計咱們表中的NULL值,若是不想統計NULL值,請寫COUNT(字段名)spa

4)聚合函數[‘SUM()求和函數’,’MAX()函數:求最大值’,’MIN()函數:求最小值’,’AVG()函數:求平均值code

在GROUP BY的過程當中,若是碰到聚合函數,會進行聚合操做排序

 

MYSQL測試:內存

假設有數據表結構以下:table

CREATE TABLE `user_info` (
    `id` INT(11) NOT NULL AUTO_INCREMENT COMMENT '主鍵id',
    `user_id` VARCHAR(50) NOT NULL DEFAULT '' COMMENT '用戶編號',
    `grade` VARCHAR(50) NOT NULL DEFAULT '' COMMENT '年級',
    `class` VARCHAR(50) NOT NULL DEFAULT '' COMMENT '班級',
    PRIMARY KEY (`id`),
    UNIQUE INDEX `uniq_user_id` (`user_id`)
)
ENGINE=InnoDB

插入記錄:

INSERT INTO `user_info` (`id`, `user_id`, `grade`, `class`) VALUES (10, '10230', 'C', 'B');
INSERT INTO `user_info` (`id`, `user_id`, `grade`, `class`) VALUES (9, '10229', 'C', 'a');
INSERT INTO `user_info` (`id`, `user_id`, `grade`, `class`) VALUES (8, '10228', 'B', 'b');
INSERT INTO `user_info` (`id`, `user_id`, `grade`, `class`) VALUES (7, '10227', 'B', 'b');
INSERT INTO `user_info` (`id`, `user_id`, `grade`, `class`) VALUES (6, '10226', 'B', 'a');
INSERT INTO `user_info` (`id`, `user_id`, `grade`, `class`) VALUES (5, '10225', 'B', 'a');
INSERT INTO `user_info` (`id`, `user_id`, `grade`, `class`) VALUES (4, '10224', 'A', 'b');
INSERT INTO `user_info` (`id`, `user_id`, `grade`, `class`) VALUES (3, '10223', 'A', 'b');
INSERT INTO `user_info` (`id`, `user_id`, `grade`, `class`) VALUES (2, '10222', 'A', 'a');
INSERT INTO `user_info` (`id`, `user_id`, `grade`, `class`) VALUES (1, '10221', 'A', 'a');

全部記錄查詢結果:

查詢grade,和user_id的全部記錄

mysql> SELECT user_id,grade FROM user_info;
+---------+-------+
| user_id | grade |
+---------+-------+
| 10221   | A     |
| 10222   | A     |
| 10223   | A     |
| 10224   | A     |
| 10225   | B     |
| 10226   | B     |
| 10227   | B     |
| 10228   | B     |
| 10229   | C     |
| 10230   | C     |
+---------+-------+

group by的常規用法

1.以grade分組,而且查看user_id信息

mysql> SELECT user_id,grade FROM user_info GROUP BY grade ;
+---------+-------+
| user_id | grade |
+---------+-------+
| 10221   | A     |
| 10225   | B     |
| 10229   | C     |
+---------+-------+

由結果可知:使用GROUP BY分組以後,每一個分組標記相同的記錄只會出現第一條,其餘的相同的分組標記的記錄會捨棄

2.利用GROUP_CONCAT查看user_id的詳細信息

mysql> SELECT GROUP_CONCAT(user_id),grade FROM user_info GROUP BY grade ;
+-------------------------+-------+
| GROUP_CONCAT(user_id)   | grade |
+-------------------------+-------+
| 10221,10222,10223,10224 | A     |
| 10228,10227,10226,10225 | B     |
| 10229,10230             | C     |
+-------------------------+-------+

3.聚合函數max

mysql> select max(user_id),grade from user_info group by grade ;
+--------------+-------+
| max(user_id) | grade |
+--------------+-------+
| 10224        | A     |
| 10228        | B     |
| 10230        | C     |
+--------------+-------+

4.having條件進一步過濾

mysql> select max(user_id),grade from user_info group by grade  having grade>'A';
+--------------+-------+
| max(user_id) | grade |
+--------------+-------+
| 10228        | B     |
| 10230        | C     |
+--------------+-------+

group by的很是規用法

1.查詢的列中除了聚合列,分組列標識還有其餘常規列,常規列如何取值?

mysql> select max(user_id),id,grade from user_info group by grade;
+--------------+----+-------+
| max(user_id) | id | grade |
+--------------+----+-------+
| 10224        |  1 | A     |
| 10228        |  5 | B     |
| 10230        |  9 | C     |
+--------------+----+-------+

sql的結果就值得討論了,與上述例子不一樣的是,查詢條件多了id一列。數據按照grade分組後,grade一列是相同的,max(user_id)按照數據進行計算也是惟一的,id一列是如何取值的?看上述的數據結果, 
推論:id是物理內存的第一個匹配項

2.修改id按照上述數據結果,將id=1,改成id=99,執行相同SQL:

mysql> select max(user_id),id,grade from user_info group by grade;
+--------------+----+-------+
| max(user_id) | id | grade |
+--------------+----+-------+
| 10224        |  2 | A     |
| 10228        |  5 | B     |
| 10230        |  9 | C     |
+--------------+----+-------+

推論:第一條數據id變成了99,查出的結果第一條數據的id從1變成了2。代表,id這個非聚合條件字段的取值與數據寫入的時間無關,由於id=1的記錄是先於id=2存在的,修改的數據不過是修改了這條數據的內容。結合mysql的數據存儲理論,因爲id是主鍵,因此數據在檢索是是按照主鍵排序後進行過濾的,所以 
推論:id字段的選取是按照mysql存儲的檢索數據匹配的第一條。

3.聚合函數和常量在一塊兒作運算

mysql> SELECT GROUP_CONCAT(user_id),grade,SUM(user_id)+9,SUM(user_id) FROM user_info GROUP BY grade ;
+-------------------------+-------+----------------+--------------+
| GROUP_CONCAT(user_id)   | grade | SUM(user_id)+9 | SUM(user_id) |
+-------------------------+-------+----------------+--------------+
| 10222,10221,10224,10223  | A     |          40899 |        40890 |
| 10225,10226,10228,10227  | B     |          40915 |        40906 |
| 10229,10230                       | C     |          20468 |        20459 |
+-------------------------+-------+----------------+--------------+

當GROUP BY 碰到聚合函數和常量在一塊兒的時候,聚合函數會正常發揮做用,可是常量只會計算一次,即在聚合完成以後,再和常量運算,而不是user_id和常量一塊兒累加

注意:這種常量有多是變量,例如多表查詢的時候

SELECT COALESCE(SUM(t2.SUMS),0)+(SELECT COALESCE(SUM(t3.SUMS),0) FROM table3 t3 WHERE t3.UID=t2.uid) FROM table1 t1 LEFT JOIN table2 t2 ON ..... GROUP BY t2.uid

其中COALESCE(SUM(t2.SUMS),0)是聚合函數,在group by的時候每次都會累加求和

而(SELECT COALESCE(SUM(t3.SUMS),0) FROM table3 t3 WHERE t3.UID=t2.uid)做爲一個常量,總共只會加入一次,可是每一行記錄的這個值多是不一樣的,

若是想要查看每次累加具體的值,可使用GROUP_CONCAT((SELECT COALESCE(SUM(t3.SUMS),0) FROM table3 t3 WHERE t3.UID=t2.uid)),注意GROUP_CONCAT中也要去除聚合函數:

SELECT 
GROUP_CONCAT(t2.SUMS),
GROUP_CONCAT(SELECT COALESCE(SUM(t3.SUMS),0) FROM table3 t3 WHERE t3.UID=t2.uid),
(SELECT COALESCE(SUM(t3.SUMS),0) FROM table3 t3 WHERE t3.UID=t2.uid) FROM table1 t1 LEFT JOIN table2 t2 ON .....

也能夠先不使用分組,把分組條件去掉,同時也要去除聚合函數(聚合函數若是不分組整個表只會返回一條記錄;若是分組,則返回不一樣的分組標記中的一條記錄):

SELECT t2.SUMS,(SELECT COALESCE(SUM(t3.SUMS),0) FROM table3 t3 WHERE t3.UID=t2.uid) FROM table1 t1 LEFT JOIN table2 t2 ON .....

 

示例: 仍是在user_info表,根據grade分組,查詢每一個分組中user_id之和加上ID總和的數值(模擬兩個表來統計每一個部門的user_id之和和另一個表的字段的ID總和)

mysql> SELECT SUM(user_id),SUM(user_id)+id,GROUP_CONCAT(user_id),GROUP_CONCAT(id) grade FROM user_info GROUP BY grade;
+--------------+-----------------+-------------------------+----------+
| SUM(user_id) | SUM(user_id)+id | GROUP_CONCAT(user_id)   | grade    |
+--------------+-----------------+-------------------------+----------+
|        40890 |           40892 | 10222,10221,10224,10223 | 2,99,4,3 |
|        40906 |           40911 | 10225,10226,10228,10227 | 5,6,8,7  |
|        20459 |           20468 | 10229,10230                       | 9,10     |
+--------------+-----------------+-------------------------+----------+

上述結果能夠看出:SUM(user_id)+id中的id做爲常量,在分組的時候,只計算了一次(2,99,4,3中只把2累加進去了,其餘值捨棄,即若是不爲聚合函數,只會參與一次)

想所有計算能夠這樣:

SELECT SUM(user_id),SUM(user_id)+(SELECT SUM(ID) FROM user_info),GROUP_CONCAT(user_id),GROUP_CONCAT(id), grade FROM user_info GROUP BY grade;

上面是模仿多表,若是隻有一個表,能夠這樣:

SELECT SUM(user_id),SUM(user_id+id),GROUP_CONCAT(user_id),GROUP_CONCAT(id), grade FROM user_info GROUP BY grade;

結果:

mysql> SELECT SUM(user_id),SUM(user_id)+(SELECT SUM(ID) FROM user_info),GROUP_CONCAT(user_id),GROUP_CONCAT(id), grade FROM user_info GROUP BY grade;
+--------------+----------------------------------------------+-------------------------+------------------+-------+
| SUM(user_id) | SUM(user_id)+(SELECT SUM(ID) FROM user_info) | GROUP_CONCAT(user_id)   | GROUP_CONCAT(id) | grade |
+--------------+----------------------------------------------+-------------------------+------------------+-------+
|        40890 |                                        41043 | 10222,10221,10224,10223 | 2,99,4,3         | A     |
|        40906 |                                        41059 | 10225,10226,10228,10227 | 5,6,8,7          | B     |
|        20459 |                                        20612 | 10229,10230                       | 9,10             | C     |
+--------------+----------------------------------------------+-------------------------+------------------+-------+

結論

  • 當group by 與聚合函數配合使用時,功能爲分組後計算
  • 當group by 與having配合使用時,功能爲分組後過濾
  • 當group by 與聚合函數,同時非聚合字段同時使用時,非聚合字段的取值是第一個匹配到的字段內容,即id小的條目對應的字段內容。
相關文章
相關標籤/搜索