分析函數是什麼?
分析函數是Oracle專門用於解決複雜報表統計需求的功能強大的函數,它能夠在數據中進行分組而後計算基於組的某種統計值,而且每一組的每一行均可以返回一個統計值。html
分析函數和聚合函數的不一樣之處是什麼?
普通的聚合函數用group by分組,每一個分組返回一個統計值,而分析函數採用partition by分組,而且每組每行均可以返回一個統計值。sql
分析函數的形式
分析函數帶有一個開窗函數over(),包含三個分析子句:分組(partition by), 排序(order by), 窗口(rows) ,他們的使用形式以下:over(partition by xxx order by yyy rows between zzz)。
注:窗口子句在這裏我只說rows方式的窗口,range方式和滑動窗口也不提oracle
分析函數例子(在scott用戶下模擬)函數
示例目的:顯示各部門員工的工資,並附帶顯示該部分的最高工資。post
--顯示各部門員工的工資,並附帶顯示該部分的最高工資。 SELECT E.DEPTNO, E.EMPNO, E.ENAME, E.SAL, LAST_VALUE(E.SAL) OVER(PARTITION BY E.DEPTNO ORDER BY E.SAL ROWS --unbounded preceding and unbouned following針對當前全部記錄的前一條、後一條記錄,也就是表中的全部記錄 --unbounded:不受控制的,無限的 --preceding:在...以前 --following:在...以後 BETWEEN UNBOUNDED PRECEDING AND UNBOUNDED FOLLOWING) MAX_SAL FROM EMP E;
運行結果:url
示例目的:按照deptno分組,而後計算每組值的總和spa
SELECT EMPNO, ENAME, DEPTNO, SAL, SUM(SAL) OVER(PARTITION BY DEPTNO ORDER BY ENAME) max_sal FROM SCOTT.EMP;
運行結果:.net
示例目的:對各部門進行分組,並附帶顯示第一行至當前行的彙總code
SELECT EMPNO, ENAME, DEPTNO, SAL, --注意ROWS BETWEEN unbounded preceding AND current row 是指第一行至當前行的彙總 SUM(SAL) OVER(PARTITION BY DEPTNO ORDER BY ENAME ROWS BETWEEN UNBOUNDED PRECEDING AND CURRENT ROW) max_sal FROM SCOTT.EMP;
運行結果:htm
示例目標:當前行至最後一行的彙總
SELECT EMPNO, ENAME, DEPTNO, SAL, --注意ROWS BETWEEN current row AND unbounded following 指當前行到最後一行的彙總 SUM(SAL) OVER(PARTITION BY DEPTNO ORDER BY ENAME ROWS BETWEEN CURRENT ROW AND UNBOUNDED FOLLOWING) max_sal FROM SCOTT.EMP;
運行結果:
示例目標:當前行的上一行(rownum-1)到當前行的彙總
SELECT EMPNO, ENAME, DEPTNO, SAL, --注意ROWS BETWEEN 1 preceding AND current row 是指當前行的上一行(rownum-1)到當前行的彙總 SUM(SAL) OVER(PARTITION BY DEPTNO ORDER BY ENAME ROWS BETWEEN 1 PRECEDING AND CURRENT ROW) max_sal FROM SCOTT.EMP;
運行結果:
示例目標: 當前行的上一行(rownum-1)到當前行的下輛行(rownum+2)的彙總
SELECT EMPNO, ENAME, DEPTNO, SAL, --注意ROWS BETWEEN 1 preceding AND 1 following 是指當前行的上一行(rownum-1)到當前行的下輛行(rownum+2)的彙總 SUM(SAL) OVER(PARTITION BY DEPTNO ORDER BY ENAME ROWS BETWEEN 1 PRECEDING AND 2 FOLLOWING) max_sal FROM SCOTT.EMP;
運行結果:
1.一、兩個order by的執行時機
分析函數(以及與其配合的開窗函數over())是在整個sql查詢結束後(sql語句中的order by的執行比較特殊)再進行的操做, 也就是說sql語句中的order by也會影響分析函數的執行結果:
a) 二者一致:若是sql語句中的order by知足與分析函數配合的開窗函數over()分析時要求的排序,即sql語句中的order by子句裏的內容和開窗函數over()中的order by子句裏的內容同樣,
那麼sql語句中的排序將先執行,分析函數在分析時就沒必要再排序;
b) 二者不一致:若是sql語句中的order by不知足與分析函數配合的開窗函數over()分析時要求的排序,即sql語句中的order by子句裏的內容和開窗函數over()中的order by子句裏的內容不同,
那麼sql語句中的排序將最後在分析函數分析結束後執行排序。
1.二、開窗函數over()分析函數中的分組/排序/窗口
開窗函數over()分析函數包含三個分析子句:分組子句(partition by), 排序子句(order by), 窗口子句(rows)
窗口就是分析函數分析時要處理的數據範圍,就拿sum來講,它是sum窗口中的記錄而不是整個分組中的記錄,所以咱們在想獲得某個欄位的累計值時,咱們須要把窗口指定到該分組中的第一行數據到當前行, 若是你指定該窗口從該分組中的第一行到最後一行,那麼該組中的每個sum值都會同樣,即整個組的總和。
窗口子句在這裏我只說rows方式的窗口,range方式和滑動窗口也不提。
窗口子句中咱們常常用到指定第一行,當前行,最後一行這樣的三個屬性:
第一行是 unbounded preceding,
當前行是 current row,
最後一行是 unbounded following,
註釋:
當開窗函數over()出現分組(partition by)子句時,
unbounded preceding即第一行是指表中一個分組裏的第一行, unbounded following即最後一行是指表中一個分組裏的最後一行;
當開窗函數over()省略了分組(partition by)子句時,
unbounded preceding即第一行是指表中的第一行, unbounded following即最後一行是指表中的最後一行。
窗口子句不能單獨出現,必須有order by子句時才能出現,
例如:
last_value(sal) over(partition by deptno order by sal rows between unbounded preceding and unbounded following)
以上示例指定窗口爲整個分組。而出現order by子句的時候,不必定要有窗口子句,但效果會很不同,此時的窗口默認是當前組的第一行到當前行!
若是省略分組,則把所有記錄當成一個組。a) 若是存在order by則默認窗口是unbounded preceding and current row --當前組的第一行到當前行
b) 若是這時省略order by則窗口默認爲unbounded preceding and unbounded following --整個組
而不管是否省略分組子句,以下結論都是成立的:
一、窗口子句不能單獨出現,必須有order by子句時才能出現。
二、當省略窗口子句時:
a) 若是存在order by則默認的窗口是unbounded preceding and current row --當前組的第一行到當前行,即在當前組中,第一行到當前行
b) 若是同時省略order by則默認的窗口是unbounded preceding and unbounded following --整個組
因此,
lag(sal) over(order by sal) 解釋
over(order by salary)表示意義以下:
首先,咱們要知道因爲省略分組子句,因此當前組的範圍爲整個表的數據行,
而後,在當前組(此時爲整個表的數據行)這個範圍裏執行排序(即order by salary),
最後,咱們知道分析函數lag(sal)在當前組(此時爲整個表的數據行)這個範圍裏的窗口範圍爲當前組的第一行到當前行,即分析函數lag(sal)在這個窗口範圍執行。
參見:
1.三、幫助理解over()的實例
例1:關注點:sql無排序,over()排序子句省略
SELECT DEPTNO, EMPNO, ENAME, SAL, LAST_VALUE(SAL) OVER(PARTITION BY DEPTNO) FROM EMP;
運行結果:
例2:關注點:sql無排序,over()排序子句有,窗口省略
SELECT DEPTNO, EMPNO, ENAME, SAL, LAST_VALUE(SAL) OVER(PARTITION BY DEPTNO ORDER BY SAL DESC) FROM EMP;
運行結果:
例3:關注點:sql無排序,over()排序子句有,窗口也有,窗口特地強調全組數據
SELECT DEPTNO, EMPNO, ENAME, SAL, LAST_VALUE(SAL) OVER(PARTITION BY DEPTNO ORDER BY SAL ROWS BETWEEN UNBOUNDED PRECEDING AND UNBOUNDED FOLLOWING) MAX_SAL FROM EMP;
運行結果:
例4:關注點:sql有排序(正序),over()排序子句無,先作sql排序再進行分析函數運算
SELECT DEPTNO, MGR, ENAME, SAL, HIREDATE, LAST_VALUE(SAL) OVER(PARTITION BY DEPTNO) LAST_VALUE FROM EMP WHERE DEPTNO = 30 ORDER BY DEPTNO, MGR;
運行結果:
例5:關注點:sql有排序(倒序),over()排序子句無,先作sql排序再進行分析函數運算
SELECT DEPTNO, MGR, ENAME, SAL, HIREDATE, LAST_VALUE(SAL) OVER(PARTITION BY DEPTNO) LAST_VALUE FROM EMP WHERE DEPTNO = 30 ORDER BY DEPTNO, MGR DESC;
運行結果:
例6:關注點:sql有排序(倒序),over()排序子句有,窗口子句無,此時的運算是:sql先選數據可是不排序,然後排序子句先排序並進行分析函數處理(窗口默認爲第一行到當前行),最後再進行sql排序
SELECT DEPTNO, MGR, ENAME, SAL, HIREDATE, MIN(SAL) OVER(PARTITION BY DEPTNO ORDER BY SAL ASC) LAST_VALUE FROM EMP WHERE DEPTNO = 30 ORDER BY DEPTNO, MGR DESC;
運行結果:
SELECT DEPTNO, MGR, ENAME, SAL, HIREDATE, MIN(SAL) OVER(PARTITION BY DEPTNO ORDER BY SAL DESC) LAST_VALUE FROM EMP WHERE DEPTNO = 30 ORDER BY DEPTNO, MGR DESC;
運行結果:
爲了方便進行實踐,特將演示表和數據羅列以下:
1、建立表
create table t( bill_month varchar2(12) , area_code number, net_type varchar(2), local_fare number );
2、插入數據
insert into t values('200405',5761,'G', 7393344.04); insert into t values('200405',5761,'J', 5667089.85); insert into t values('200405',5762,'G', 6315075.96); insert into t values('200405',5762,'J', 6328716.15); insert into t values('200405',5763,'G', 8861742.59); insert into t values('200405',5763,'J', 7788036.32); insert into t values('200405',5764,'G', 6028670.45); insert into t values('200405',5764,'J', 6459121.49); insert into t values('200405',5765,'G', 13156065.77); insert into t values('200405',5765,'J', 11901671.70); insert into t values('200406',5761,'G', 7614587.96); insert into t values('200406',5761,'J', 5704343.05); insert into t values('200406',5762,'G', 6556992.60); insert into t values('200406',5762,'J', 6238068.05); insert into t values('200406',5763,'G', 9130055.46); insert into t values('200406',5763,'J', 7990460.25); insert into t values('200406',5764,'G', 6387706.01); insert into t values('200406',5764,'J', 6907481.66); insert into t values('200406',5765,'G', 13562968.81); insert into t values('200406',5765,'J', 12495492.50); insert into t values('200407',5761,'G', 7987050.65); insert into t values('200407',5761,'J', 5723215.28); insert into t values('200407',5762,'G', 6833096.68); insert into t values('200407',5762,'J', 6391201.44); insert into t values('200407',5763,'G', 9410815.91); insert into t values('200407',5763,'J', 8076677.41); insert into t values('200407',5764,'G', 6456433.23); insert into t values('200407',5764,'J', 6987660.53); insert into t values('200407',5765,'G', 14000101.20); insert into t values('200407',5765,'J', 12301780.20); insert into t values('200408',5761,'G', 8085170.84); insert into t values('200408',5761,'J', 6050611.37); insert into t values('200408',5762,'G', 6854584.22); insert into t values('200408',5762,'J', 6521884.50); insert into t values('200408',5763,'G', 9468707.65); insert into t values('200408',5763,'J', 8460049.43); insert into t values('200408',5764,'G', 6587559.23); insert into t values('200408',5764,'J', 7342135.86); insert into t values('200408',5765,'G', 14450586.63); insert into t values('200408',5765,'J', 12680052.38); commit;
3、first_value()與last_value():求最值對應的其餘屬性
問題、取出每個月通話費最高和最低的兩個地區。
SELECT BILL_MONTH, AREA_CODE, SUM(LOCAL_FARE) LOCAL_FARE, FIRST_VALUE(AREA_CODE) OVER(PARTITION BY BILL_MONTH ORDER BY SUM(LOCAL_FARE) DESC ROWS BETWEEN UNBOUNDED PRECEDING AND UNBOUNDED FOLLOWING) FIRSTVAL, LAST_VALUE(AREA_CODE) OVER(PARTITION BY BILL_MONTH ORDER BY SUM(LOCAL_FARE) DESC ROWS BETWEEN UNBOUNDED PRECEDING AND UNBOUNDED FOLLOWING) LASTVAL FROM T GROUP BY BILL_MONTH, AREA_CODE ORDER BY BILL_MONTH
運行結果:
4、rank(),dense_rank()與row_number():求排序
rank,dense_rank,row_number函數爲每條記錄產生一個從1開始至n的天然數,n的值可能小於等於記錄的總數。這3個函數的惟一區別在於當碰到相同數據時的排名策略。
①row_number:
row_number函數返回一個惟一的值,當碰到相同數據時,排名按照記錄集中記錄的順序依次遞增。
②dense_rank:
dense_rank函數返回一個惟一的值,當碰到相同數據時,此時全部相同數據的排名都是同樣的。
③rank:
rank函數返回一個惟一的值,當碰到相同的數據時,此時全部相同數據的排名是同樣的,同時會在最後一條相同記錄和下一條不一樣記錄的排名之間空出排名。
演示數據在Oracle自帶的scott用戶下:
一、rank()值相同時排名相同,其後排名跳躍不連續
SELECT * FROM (SELECT DEPTNO, RANK() OVER(PARTITION BY DEPTNO ORDER BY SAL DESC) RW, ENAME, SAL FROM SCOTT.EMP) WHERE RW <= 4;
運行結果:
二、dense_rank()值相同時排名相同,其後排名連續不跳躍
SELECT * FROM (SELECT DEPTNO, DENSE_RANK() OVER(PARTITION BY DEPTNO ORDER BY SAL DESC) RW, ENAME, SAL FROM SCOTT.EMP) WHERE RW <= 4;
運行結果:
三、row_number()值相同時排名不相等,其後排名連續不跳躍
SELECT * FROM (SELECT DEPTNO, ROW_NUMBER() OVER(PARTITION BY DEPTNO ORDER BY SAL DESC) RW, ENAME, SAL FROM SCOTT.EMP) WHERE RW <= 4;
運行結果:
5、lag()與lead():求以前或以後的第N行
lag和lead函數能夠在一次查詢中取出同一字段的前n行的數據和後n行的值。這種操做可使用對相同表的錶鏈接來實現,不過使用lag和lead有更高的效率。
lag(arg1,arg2,arg3)
第一個參數是列名,
第二個參數是偏移的offset,
第三個參數是超出記錄窗口時的默認值。
舉例以下:
SQL> select * from kkk;
ID NAME
---------- --------------------
1 1name
2 2name
3 3name
4 4name
5 5name
SQL> select id,name,lag(name,1,0) over(order by id) from kkk;
ID NAME LAG(NAME,1,0)OVER(ORDERBYID)
---------- -------------------- ----------------------------
1 1name 0
2 2name 1name
3 3name 2name
4 4name 3name
5 5name 4name
SQL> select id,name,lead(name,1,0) over(order by id) from kkk;
ID NAME LEAD(NAME,1,0)OVER(ORDERBYID)
---------- -------------------- -----------------------------
1 1name 2name
2 2name 3name
3 3name 4name
4 4name 5name
5 5name 0
SQL> select id,name,lead(name,2,0) over(order by id) from kkk;
ID NAME LEAD(NAME,2,0)OVER(ORDERBYID)
---------- -------------------- -----------------------------
1 1name 3name
2 2name 4name
3 3name 5name
4 4name 0
5 5name 0
SQL> select id,name,lead(name,1,'linjiqin') over(order by id) from kkk;
ID NAME LEAD(NAME,1,'ALSDFJLASDJFSAF')
---------- -------------------- ------------------------------
1 1name 2name
2 2name 3name
3 3name 4name
4 4name 5name
5 5name linjiqin
---------------------------------------------------------------------------------------
6、rollup()與cube():排列組合分組
1)、group by rollup(a, b, c):
首先會對(a、b、c)進行group by,
而後再對(a、b)進行group by,
其後再對(a)進行group by,
最後對全表進行彙總操做。
2)、group by cube(a, b, c):
則首先會對(a、b、c)進行group by,
而後依次是(a、b),(a、c),(a),(b、c),(b),(c),
最後對全表進行彙總操做。
一、生成演示數據:
Connected to Oracle Database 10g Enterprise Edition Release 10.2.0.1.0
Connected as ds_trade
SQL> conn system/oracle as sysdba
Connected to Oracle Database 10g Enterprise Edition Release 10.2.0.3.0
Connected as SYS
SQL> create table scott.t as select * from dba_indexes;
Table created
SQL> connect scott/oracle
Connected to Oracle Database 10g Enterprise Edition Release 10.2.0.3.0
Connected as scott
SQL>
二、普通group by體驗
sql> select owner, index_type, status, count(*) from t where owner like 'SY%' group by owner, index_type, status;
三、group by rollup(A,B,C)
GROUP BY ROLLUP(A, B, C):
首先會對(A、B、C)進行GROUP BY,
而後再對(A、B)進行GROUP BY,
其後再對(A)進行GROUP BY,
最後對全表進行彙總操做。
sql> select owner, index_type, status, count(*) from t where owner like 'SY%' group by ROLLUP(owner, index_type, status);
四、group by cube(A,B,C)
GROUP BY CUBE(A, B, C):
則首先會對(A、B、C)進行GROUP BY,
而後依次是(A、B),(A、C),(A),(B、C),(B),(C),
最後對全表進行彙總操做。
sql> select owner, index_type, status, count(*) from t where owner like 'SY%' group by cube(owner, index_type, status);
7、max(),min(),sun()與avg():求移動的最值總和與平均值
問題:計算出各個地區連續3個月的通話費用的平均數(移動平均值)
SELECT AREA_CODE, BILL_MONTH, LOCAL_FARE, SUM(LOCAL_FARE) OVER(PARTITION BY AREA_CODE ORDER BY TO_NUMBER(BILL_MONTH) RANGE BETWEEN 1 PRECEDING AND 1 FOLLOWING) "3month_sum", AVG(LOCAL_FARE) OVER(PARTITION BY AREA_CODE ORDER BY TO_NUMBER(BILL_MONTH) RANGE BETWEEN 1 PRECEDING AND 1 FOLLOWING) "3month_avg", MAX(LOCAL_FARE) OVER(PARTITION BY AREA_CODE ORDER BY TO_NUMBER(BILL_MONTH) RANGE BETWEEN 1 PRECEDING AND 1 FOLLOWING) "3month_max", MIN(LOCAL_FARE) OVER(PARTITION BY AREA_CODE ORDER BY TO_NUMBER(BILL_MONTH) RANGE BETWEEN 1 PRECEDING AND 1 FOLLOWING) "3month_min" FROM (SELECT T.AREA_CODE, T.BILL_MONTH, SUM(T.LOCAL_FARE) LOCAL_FARE FROM T GROUP BY T.AREA_CODE, T.BILL_MONTH)
運行結果:
問題:求各地區按月份累加的通話費
SELECT AREA_CODE, BILL_MONTH, LOCAL_FARE, SUM(LOCAL_FARE) OVER(PARTITION BY AREA_CODE ORDER BY BILL_MONTH ASC) "last_sum_value" FROM (SELECT T.AREA_CODE, T.BILL_MONTH, SUM(T.LOCAL_FARE) LOCAL_FARE FROM T GROUP BY T.AREA_CODE, T.BILL_MONTH) ORDER BY AREA_CODE, BILL_MONTH
運行結果:
--------------------------------------------------------------------------
Blog:http://www.cnblogs.com/linjiqin/
J2EE、Android、Linux、Oracle QQ交流羣:142463980、158560018(滿)