Oracle分析函數Over()

1、Over()分析函數

說明:聚合函數(如sum()、max()等)能夠計算基於組的某種聚合值,可是聚合函數對於某個組只能返回一行記錄。若想對於某組返回多行記錄,則須要使用分析函數。函數

一、rank()/dense_rank over(partition by ... order by ...)

說明:over()在什麼條件之上; fetch

  partition by 按哪一個字段劃分組;spa

  order by 按哪一個字段排序;.net

注意:code

  (1)使用rank()/dense_rank() 時,必需要帶order by不然非法blog

  (2)rank()/dense_rank()分級的區別:排序

    rank(): 跳躍排序,若是有兩個第一級時,接下來就是第三級。
    dense_rank(): 連續排序,若是有兩個第一級時,接下來仍然是第二級。get

示例:查詢每一個部門工資最高的員工信息博客

通常的寫法:it

SELECT E.ENAME, E.JOB, E.SAL, E.DEPTNO
  FROM SCOTT.EMP E,
       (SELECT E.DEPTNO, MAX(E.SAL) SAL FROM SCOTT.EMP E GROUP BY E.DEPTNO) ME
 WHERE E.DEPTNO = ME.DEPTNO
   AND E.SAL = ME.SAL;

使用Over()函數:

方法一:

SELECT E.ENAME, E.JOB, E.SAL, E.DEPTNO
  FROM (SELECT E.ENAME,
               E.JOB,
               E.SAL,
               E.DEPTNO,
               RANK() OVER(PARTITION BY E.DEPTNO ORDER BY E.SAL DESC) RANK  --在按部門劃分的基礎上,工資從高到低分級,級別RANK從1開始依次遞增
          FROM EMP E) E
 WHERE E.RANK = 1 ;

方法二:

 SELECT E.ENAME, E.JOB, E.SAL, E.DEPTNO
  FROM (SELECT E.ENAME,
               E.JOB,
               E.SAL,
               E.DEPTNO,
               DENSE_RANK() OVER(PARTITION BY E.DEPTNO ORDER BY E.SAL DESC) RANK
          FROM EMP E) E
 WHERE E.RANK = 1;

對比查詢結果:左邊的是用通常的方法查詢結果,右邊的是分析函數查詢結果(兩種方法結果相同)

 

二、min()/max() over(partition by ...)

 

查詢員工信息的同時,查詢員工工資與所在部門最低、最高工資的差額

通常的寫法:

SELECT E.ENAME,
       E.JOB,
       E.SAL,
       E.DEPTNO,
       E.SAL - ME.MIN_SAL DIFF_MIN_SAL,
       ME.MAX_SAL - E.SAL DIFF_MAX_SAL
  FROM SCOTT.EMP E,
       (SELECT E.DEPTNO, MIN(E.SAL) MIN_SAL, MAX(E.SAL) MAX_SAL
          FROM SCOTT.EMP E
         GROUP BY E.DEPTNO) ME
 WHERE E.DEPTNO = ME.DEPTNO
 ORDER BY E.DEPTNO, E.SAL;

使用分析函數:

SELECT E.ENAME,
       E.JOB,
       E.SAL,
       E.DEPTNO,
       MIN(E.SAL) OVER(PARTITION BY E.DEPTNO) MIN_SAL,
       MAX(E.SAL) OVER(PARTITION BY E.DEPTNO) MAX_SAL,
       NVL(E.SAL - MIN(E.SAL) OVER(PARTITION BY E.DEPTNO), 0) DIFF_MIN_SAL,
       NVL(MAX(E.SAL) OVER(PARTITION BY E.DEPTNO) - E.SAL, 0) DIFF_MAX_SAL
  FROM EMP E;

注:這裏沒有排序條件,若加上order by 排序條件,

MAX() OVER(PARTITION BY .. ORDER BY .. DESC) 排序規則只能爲desc,不然不起做用,將查詢到目前爲止排序值最高字段的對應值
MIN() OVER(PARTITION BY .. ORDER BY .. ASC ) 排序規則只能爲asc,不然不起做用,將查詢到目前爲止排序值最低的字段的對應值,

以下:

SELECT E.ENAME,
       E.JOB,
       E.SAL,
       E.DEPTNO,
       MIN(E.SAL) OVER(PARTITION BY E.DEPTNO) MIN_SAL01,
       MAX(E.SAL) OVER(PARTITION BY E.DEPTNO) MAX_SAL01,
       MIN(E.SAL) OVER(PARTITION BY E.DEPTNO ORDER BY E.SAL) MIN_SAL02,
       MAX(E.SAL) OVER(PARTITION BY E.DEPTNO ORDER BY E.SAL) MAX_SAL02, --不起做用
       MIN(E.SAL) OVER(PARTITION BY E.DEPTNO ORDER BY E.SAL DESC) MIN_SAL03, --不起做用
       MAX(E.SAL) OVER(PARTITION BY E.DEPTNO ORDER BY E.SAL DESC) MAX_SAL03,
       MIN(E.SAL) OVER(PARTITION BY E.DEPTNO ORDER BY E.SAL ASC) MIN_SAL04,
       MAX(E.SAL) OVER(PARTITION BY E.DEPTNO ORDER BY E.SAL ASC) MAX_SAL04, --不起做用
       NVL(E.SAL - MIN(E.SAL) OVER(PARTITION BY E.DEPTNO), 0) DIFF_MIN_SAL,
       NVL(MAX(E.SAL) OVER(PARTITION BY E.DEPTNO) - E.SAL, 0) DIFF_MAX_SAL
  FROM EMP E;

結果以下:

三、lead()/lag() over(partition by ... order by ...) 取前面/後面第n行記錄

說明:

lead(列名,n,m): 當前記錄後面第n行記錄的<列名>的值,沒有則默認值爲m;若是不帶參數n,m,則查找當前記錄後面第一行的記錄<列名>的值,沒有則默認值爲null。
lag(列名,n,m): 當前記錄前面第n行記錄的<列名>的值,沒有則默認值爲m;若是不帶參數n,m,則查找當前記錄前面第一行的記錄<列名>的值,沒有則默認值爲null。

示例:查詢我的工資與比本身高一位、第一位的工資的差額

使用分析函數:

 SELECT E.ENAME,
        E.JOB,
        E.SAL,
        E.DEPTNO,
        LEAD(E.SAL, 1, 0) OVER(PARTITION BY E.DEPTNO ORDER BY E.SAL) LEAD_SAL, --記錄後面第n行記錄
        LAG(E.SAL, 1, 0) OVER(PARTITION BY E.DEPTNO ORDER BY E.SAL) LAG_SAL, --記錄前面第N行記錄
        NVL(LEAD(E.SAL) OVER(PARTITION BY E.DEPTNO ORDER BY E.SAL) - E.SAL,  
            0) DIFF_LEAD_SAL,
        NVL(E.SAL - LEAD(E.SAL) OVER(PARTITION BY E.DEPTNO ORDER BY E.SAL),
            0) DIFF_LAG_SAL
   FROM EMP E;

查詢結果:

四、FIRST_VALUE/LAST_VALUE() OVER(PARTITION BY ...) 取首尾記錄

示例:

 SELECT E.EMPNO,
        E.ENAME,
        E.JOB,
        E.MGR,
        E.SAL,
        E.DEPTNO,
        FIRST_VALUE(E.SAL) OVER(PARTITION BY E.DEPTNO) FIRST_SAL,
        LAST_VALUE(E.SAL) OVER(PARTITION BY E.DEPTNO) LAST_SAL
   FROM EMP E;

查詢結果:

五、ROW_NUMBER() OVER(PARTITION BY.. ORDER BY ..) 排序(應用:分頁)

示例:

 SELECT E.ENAME, E.JOB, E.SAL, E.DEPTNO,E.ROW_NUM
   FROM (SELECT E.ENAME,
                E.JOB,
                E.SAL,
                E.DEPTNO,
                ROW_NUMBER() OVER(PARTITION BY E.DEPTNO ORDER BY E.SAL) ROW_NUM
           FROM EMP E) E
  WHERE E.ROW_NUM > 3;

查詢結果:

 補充:

相似分頁的操做還能夠用rownum、fetch(Oracle12C後的新特性)實現

六、sum/avg/count() over(partition by ..)

示例1:

SELECT E.ENAME,
       E.JOB,
       E.SAL,
       E.DEPTNO,
       SUM(E.SAL) OVER(PARTITION BY E.DEPTNO) SUM_SAL,     --統計某組中的總計值
       AVG(E.SAL) OVER(PARTITION BY E.DEPTNO) AVG_SAL,     --統計某組中的平均值
       COUNT(E.SAL) OVER(PARTITION BY E.DEPTNO) COUNT_SAL  --按某列分組,並統計該組中記錄數量
  FROM EMP E;

查詢結果:

示例2(全統計):爲數據集統計部門銷售總和,全公司銷售總和,部門銷售均值,全公司銷售均值

SELECT A.DEPT_ID,
       A.SALE_DATE,
       A.GOODS_TYPE,
       A.SALE_CNT,
       SUM(A.SALE_CNT) OVER(PARTITION BY A.DEPT_ID) DEPT_TOTAL, --部門銷售總和
       SUM(A.SALE_CNT) OVER() CMP_TOTAL,  --公司銷售總額
       AVG(A.SALE_CNT) OVER(PARTITION BY A.DEPT_ID) DEPT_AVG, --部門銷售均值
       AVG(A.SALE_CNT) OVER() CMP_AVG  --公司銷售均值
  FROM LEARN_FUN_KEEP A;

 

 七、 rows/range between … preceding and … following 上下範圍內求值

說明:unbounded:不受控制的,無限的
   preceding:在...以前
   following:在...以後

 rows between … preceding and … following

示例1:顯示各部門員工的工資,並附帶顯示該部門的最高工資

SELECT E.DEPTNO,
       E.EMPNO,
       E.ENAME,
       E.SAL,
       LAST_VALUE(E.SAL) OVER(PARTITION BY E.DEPTNO ORDER BY E.SAL ROWS
/*MAX(E.SAL) OVER(PARTITION BY E.DEPTNO ORDER BY E.SAL ROWS*/
--unbounded preceding and unbouned following針對當前全部記錄的前一條、後一條記錄,也就是表中的全部記錄 --unbounded:不受控制的,無限的 --preceding:在...以前 --following:在...以後 BETWEEN UNBOUNDED PRECEDING AND UNBOUNDED FOLLOWING) MAX_SAL FROM EMP E;

結果以下:

寫法二;

SELECT E.DEPTNO,
       E.EMPNO,
       E.ENAME,
       E.SAL,
       MAX(E.SAL) OVER(PARTITION BY E.DEPTNO
       /*ORDER BY E.SAL*/) MAX_SAL
  FROM EMP E;

示例2:對各部門進行分組,並附帶顯示第一行至當前行的彙總

SELECT EMPNO,
       ENAME,
       DEPTNO,
       SAL,
       --注意ROWS BETWEEN unbounded preceding AND current row  是指第一行至當前行的彙總
       SUM(SAL) OVER(PARTITION BY DEPTNO 
                     ORDER BY ENAME 
                     ROWS BETWEEN UNBOUNDED PRECEDING AND CURRENT ROW) max_sal
  FROM SCOTT.EMP;

結果以下:

示例3:當前行至最後一行的彙總

SELECT EMPNO,
       ENAME,
       DEPTNO,
       SAL,
       --注意ROWS BETWEEN current row AND unbounded following 指當前行到最後一行的彙總
       SUM(SAL) OVER(PARTITION BY DEPTNO 
                     ORDER BY ENAME 
                     ROWS BETWEEN CURRENT ROW AND UNBOUNDED FOLLOWING) max_sal
  FROM SCOTT.EMP;

結果以下:

示例4:當前行的上一行(rownum-1)到當前行的彙總

SELECT EMPNO,
       ENAME,
       DEPTNO,
       SAL,
       --注意ROWS BETWEEN 1 preceding AND current row 是指當前行的上一行(rownum-1)到當前行的彙總 
       SUM(SAL) OVER(PARTITION BY DEPTNO 
                     ORDER BY ENAME ROWS 
                     BETWEEN 1 PRECEDING AND CURRENT ROW) max_sal
  FROM SCOTT.EMP;

結果以下:

示例5:當前行的上一行(rownum-1)到當前行的下兩行(rownum+2)的彙總 

SELECT EMPNO,
       ENAME,
       DEPTNO,
       SAL,
       --注意ROWS BETWEEN 1 preceding AND 1 following 是指當前行的上一行(rownum-1)到當前行的下輛行(rownum+2)的彙總
       SUM(SAL) OVER(PARTITION BY DEPTNO 
                     ORDER BY ENAME 
                     ROWS BETWEEN 1 PRECEDING AND 2 FOLLOWING) max_sal
  FROM SCOTT.EMP;

結果以下:

 2、其餘

一、NULLS FIRST/LAST 將空值字段記錄放到最前或最後顯示

說明:

經過RANK()、DENSE_RANK()、ROW_NUMBER()對記錄進行全排列、分組排列取值,但有時候,會遇到空值的狀況,空值會影響獲得的結果的正確性
NULLS FIRST/LAST 能夠幫助咱們在處理含有空值的排序排列中,將空值字段記錄放到最前或最後顯示,幫助咱們獲得指望的結果。

SELECT E.ENAME,
       E.JOB,
       E.SAL,
       E.DEPTNO,
       RANK() OVER(PARTITION BY E.DEPTNO ORDER BY E.SAL NULLS LAST)
  FROM EMP E;

結果以下:

 

二、NTILE(n)

 

示例:

SELECT E.ENAME,
       E.JOB,
       E.SAL,
       E.DEPTNO,
       NTILE(3) OVER(ORDER BY E.SAL DESC NULLS LAST) ALL_CMP, --若只取前三分之一,all_cmp=1便可,若只取中間三分之一,all_cmp=2便可
       NTILE(3) OVER(PARTITION BY E.DEPTNO ORDER BY E.SAL DESC NULLS LAST) ALL_DEPT  --每一個部門的分紅三部分
  FROM EMP E

結果以下:

 

三、keep(dense_rank first/last)

說明:

1.keep(dense_rank first/last) 這句話的含義是什麼?
keep 字面意思就是'保持',也就是說保存知足keep()括號內條件的記錄
這裏咱們應該能夠想象到,會有多條記錄的狀況,即存在多個last或first的狀況)
dense_rank 是排序策略
first/last 是篩選策略

關於問題2:
使用min的緣由是讓最後獲得的結果惟一,由於有時會存在多個last或first的狀況。
3.爲何使用dense_rank ? rank不能夠嗎?
ORA-02000: 缺失 DENSE_RANK 關鍵字
換成rank之後直接報錯了,至於緣由,個人理解是rank不能表示記錄排序的相對順序
例如: 記錄 rank dense_rank
100 1 1
100 1 1
95 3 2
第三條記錄與第一條和第二條記錄的相對位置應該差1,可是用rank沒法表示這一點。

示例:

查看部門 D02 內,銷售記錄時間最先,銷售量最小的記錄。

SELECT A.DEPT_ID,
       MIN(A.SALE_CNT) KEEP(DENSE_RANK FIRST ORDER BY A.SALE_DATE) MIN_EARLY_DATE
  FROM LEARN_FUN_KEEP A
 WHERE A.DEPT_ID = 'D02'
 GROUP BY A.DEPT_ID;

 

 

參考:

Oracle分析函數總結(1) - 基本概念和語法 - NowOrNever - 博客頻道 - CSDN.NET  http://blog.csdn.net/fw0124/article/details/7842039

Oracle分析函數總結(2) - 排序 - rank,dense_rank,row_number,first,first_value,last,last_value,lag,lead  http://blog.csdn.net/fw0124/article/details/7843225

相關文章
相關標籤/搜索