本事例實驗用表task,結構以下mysql
MySQL> desc task;sql
+-------------+------------+------+-----+-------------------+-------+函數
| Field | Type | Null | Key | Default | Extra |優化
+-------------+------------+------+-----+-------------------+-------+.net
| PLAYER_ID | bigint(20) | NO | PRI | NULL | |server
| TASK_ID | int(11) | NO | PRI | NULL | |get
| TASK_STATUS | tinyint(4) |NO | | NULL | |it
| CREATE_DATE | datetime | YES | | NULL | |io
| UPDATE_DATE |timestamp | NO | | CURRENT_TIMESTAMP | |class
+-------------+------------+------+-----+-------------------+-------+
1 Distinct 位置
單獨的distinct只能放在開頭,不然報錯,語法錯誤
mysql> Select player_id,distinct(task_id) from task;
ERROR 1064 (42000): You havean error in your SQL syntax; check the manual that
corresponds to your MySQLserver version for the right syntax to use near 'disti
nct(task_id) from task' atline 1
如今把distinct放在開頭
mysql> Select distinct(task_id),taskid from task;
查詢成功
與其餘函數使用時候,沒有位置限制以下
Select player_id,count(distinct(task_id))from task;
這種狀況下是正確的,可使用。
2 Distinct用法
a.在count計算不重複的記錄的時候能用到
好比SELECT COUNT( DISTINCT player_id ) FROM task;
就是計算talbebname表中id不一樣的記錄有多少條
b,在須要返回記錄不一樣的id的具體值的時候能夠用
好比SELECT DISTINCT player_id FROM task;
返回talbebname表中不一樣的id的具體的值
c.上面的狀況2對於須要返回mysql表中2列以上的結果時會有歧義
好比SELECT DISTINCT player_id, task_id FROM task;
實際上返回的是player_id與task_id同時不相同的結果,也就是DISTINCT同時做用了兩個字段,必須得player_id與task_id都相同的才被排除了,與咱們指望的結果不同,咱們指望的是player_id不一樣被過濾
在這種狀況下,distinct同時做用了兩個字段,player_id,task_id
d.這時候能夠考慮使用group_concat函數來進行排除,不過這個mysql函數是在mysql4.1以上才支持的
e. 其實還有另一種解決方式,就是使用
SELECT player_id, task_id, count(DISTINCT player_id) FROM task.
雖然這樣的返回結果多了一列無用的count數據(有時也許就須要這個數據)
f 同時咱們還能夠利用下面的方式解決b遇到的歧義問題經過group by 分組
select player_id,task_id from task group by player_id
distinct 優化
請參考:http://isky000.com/database/mysql_distinct_implement
對distinct的原理 及優化分析的很好,你們能夠查看。