oracle去重複記錄

時間 2019-11-08

標籤 oracle 重複記錄欄目 Oracle 简体版

原文原文鏈接

用distinct關鍵字只能過濾查詢字段中全部記錄相同的（記錄集相同），而若是要指定一個字段卻沒有效果，另外distinct關鍵字會排序，效率很低。面試

select distinct name from t1 能消除重複記錄，但只能取一個字段，如今要同時取id,name這2個字段的值。函數

select distinct id,name from t1 能夠取多個字段，但只能消除這2個字段值所有相同的記錄測試

因此用distinct達不到想要的效果，用group by 能夠解決這個問題。 spa

例如要顯示的字段爲A、B、C三個，而A字段的內容不能重複能夠用下面的語句： hibernate

select A, min(B),min(C),count(*) from [table] where [條件] group by A 排序

having [條件] order by A desc 索引

爲了顯示標題頭好看點能夠把select A, min(B),min(C),count(*) 換稱select A as A, min(B) as B,min(C) as C,count(*) as 重複次數 table

顯示出來的字段和排序字段都要包括在group by 中效率

但顯示出來的字段包有min,max,count,avg,sum等聚合函數時能夠不在group by 中 select

如上句的min(B),min(C),count(*)

通常條件寫在where 後面

有聚合函數的條件寫在having 後面

若是在上句中having加 count(*)>1 就能夠查出記錄A的重複次數大於1的記錄

若是在上句中having加 count(*)>2 就能夠查出記錄A的重複次數大於2的記錄

若是在上句中having加 count(*)>=1 就能夠查出全部的記錄，但重複的只顯示一條，而且後面有顯示重複的次數----這就是所須要的結果，並且語句能夠經過hibernate

下面語句能夠查詢出那些數據是重複的：

select 字段1,字段2,count(*) from 表名 group by 字段1,字段2 having count(*) > 1

將上面的>號改成=號就能夠查詢出沒有重複的數據了。

例如 select count(*) from (select gcmc,gkrq,count(*) from gczbxx_zhao t group by gcmc,gkrq having

count(*)>=1 order by GKRQ)

select * from gczbxx_zhao where viewid in ( select max(viewid) from gczbxx_zhao group by

gcmc ) order by gkrq desc ---仍是這個可行。

有一面試題說：distinct去重複的效率很底下，我在網上看到這遍文章的方法好像說是用 group by having 效率很高了？

我在了一個測試，有一商品表，26萬條記錄，只有商品編號建了索引，對品牌名稱字段作 distinct

select brand,count(*) from tab_commbaseinfo group by brand having count(*) =1

平均時間是：0.453

select distinct brand from tab_commbaseinfo

平均時間是：0.39

搞不懂是否還有其它方法。

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。