rank() over(partition)的使用(轉載)
有的時候會遇到這樣的問題,咱們須要查詢一張表,並且要按照業務排序,好比我須要以下的結果:html
地區 日期 費用 產品編號 用戶編號less
290 201202 258 1 s1
290 201202 200 1 s5
290 201202 100 1 s100
290 201202 90 2 s7
290 201202 88 2 s9
290 201202 10 2 s12。 post
領導讓我出一張報表,須要看到每個業務的收費前三名是那些客戶。這個時候用rank() over(partition)是一個很不錯的選擇。測試
個人測試表就像上面例子中的表同樣,不過數據稍微多一點點。給你們一個截圖:url
能夠看到我每個項目都有5條記錄,我只取前三,那麼SQL以下:spa
SELECT A.AREA_ID, A.ACCT_MONTH, A.FEE, A.ITEM_ID, A.USER_ID
FROM (SELECT T.AREA_ID,
T.ACCT_MONTH,
T.FEE,
T.ITEM_ID,
T.USER_ID,
RANK() OVER(PARTITION BY T.ITEM_ID ORDER BY T.FEE DESC) RK
FROM TEST T) A
WHERE RK < 4;
該語句執行的結果就是上述的狀況了。3d
一不作二不休,我順便查看一下該語句的執行計劃好了。code
首先寫一下個人建表語句:htm
CREATE TABLE TEST
(
area_id NUMBER,
acct_month NUMBER,
fee NUMBER,
item_id NUMBER
)
PARTITION BY LIST(area_id)
(
PARTITION part_290 VALUES('290'),
PARTITION part_910 VALUES('910'),
PARTITION part_911 VALUES('911'),
partition part_912 values('912'),
partition part_913 values('913'),
partition part_914 values('914'),
partition part_915 values('915'),
partition part_916 values('916'),
partition part_917 values('917'),
partition part_919 values('919'),
partition part_default values(default)
)
我按照地域進行了分區,其實也能夠按照時間進行分區。explain一下plan:blog
能夠看到,只有10條記錄的表,COST卻高達4,不得不說採起這個辦法會極大地下降查詢的效率。可是業務上須要的話,rank() over確實是一個很好使的玩意兒。
加兩條數據進去,順便測測分區表是否真的能夠在沒有索引的狀況下提升一點點效率。加了兩條數據,area_id是911,陝西省寶雞市的區號:0911。語句也稍微變更一下:
SELECT A.AREA_ID, A.ACCT_MONTH, A.FEE, A.ITEM_ID, A.USER_ID
FROM (SELECT T.AREA_ID,
T.ACCT_MONTH,
T.FEE,
T.ITEM_ID,
T.USER_ID,
RANK() OVER(PARTITION BY T.ITEM_ID ORDER BY T.FEE DESC) RK
FROM TEST T
WHERE t.area_id = 290) A
WHERE RK < 4;
explain一下plan:
發現雖然如今是12行數據,可是由於我只查詢西安市(290),因此在rows裏仍舊只是10行,沒有新添加的寶雞市的2行。因而可知,在面對很是海量的數據存儲時,按照必定的條件創建分區,是十分有必要的。不過按照時間創建分區可能會稍微麻煩點,由於時間在不停的推動,多少年以後,你如今創建的分區就已經不可能再用了,就要添加新的分區進去,這也是一個挺討厭的事情。