前面兩篇咱們從 SQL 的最基礎語法講起,到表聯結多表查詢。 你們能夠點擊連接查看sql
今天咱們講一些在作報表和複雜計算時很是實用的分析函數。因爲各個數據庫函數的實現不太同樣,本文基於 Oracle 12c 。post
這個函數在平時用的仍是比較多的。這個函數的做用是爲分組內的每一行返回一個行號。咱們仍是舉例來講明。 假設咱們有如下數據表:ui
共 8 個訂單,分爲 A,B,C,D四種類型,後面兩列是訂單描述和訂單數量。spa
假如咱們如今想找到每一個訂單類型中數量最少的一行記錄,好比想找到 A 類型訂單數量最少的,B 類型訂單數量最少的。。。 咱們要怎麼寫呢 ? 用 GROUP BY 可能會很麻煩。這裏用 ROW_NUMBER() 就很合適3d
SELECT order_no,
order_type,
order_text,
order_qty,
row_number() OVER(PARTITION BY order_type order by order_qty) AS rowno
FROM wip_order_test
複製代碼
結果: code
能夠看到,每一行最後都有一個從低到高的編號,有了這個編號咱們就能夠經過取編號爲 1 的行來獲得每一個分組中訂單數量最少的一行記錄。cdn
解釋一下,ROW_NUMBER() 爲每一行返回一個行號, partition by 表示分組,這裏表示根據 order_type 分組,而後咱們按照訂單數量排序。就會獲得每一個分組內的按照訂單數量排序的行號。blog
假如咱們如今要 查詢每一個類型的訂單總數分別是多少,要怎麼作? 你們可能會想到 GROUP BY,不過你們能夠本身試試,是否能獲得和我一樣的結果
SELECT order_no,
order_type,
order_text,
order_qty,
sum(order_qty) OVER(PARTITION BY order_type) AS sum_qty
FROM wip_order_test
複製代碼
結果:
看到後面多了一個數量列,就是每一個分組的訂單總數量。是否是很方便?
除了 SUM 函數,其餘幾個計算函數如 AVG(),MAX(),MIN(),COUNT()的使用方法和 SUM 同樣。
窗口函數能夠對一個結果集內的必定範圍內值進行累積,或者經過移動窗口進行累積。仍是看例子吧。
SELECT order_no,
order_type,
order_text,
order_qty,
sum(order_qty) OVER
(ORDER BY order_no ROWS BETWEEN UNBOUNDED PRECEDING AND CURRENT ROW)
AS cumulative_qty
FROM wip_order_test;
複製代碼
解釋一下:仍是用 SUM 來計算總和,這裏咱們使用了新的語法, ROWS BETWEEN UNBOUNDED PRECEDING AND CURRENT ROW 定義了窗口的起點和終點,UNBOUNDED PRECEDING表示起點在第一行,CURRENT ROW 表示終點在當前行。咱們看一下上圖的結果,能看到最後一列的值是逐行累加的。
上面咱們的窗口的起點是固定的,終點逐漸往下移,咱們能夠建立一個固定大小的窗口,起點和終點同時往下移動。只須要修改 UNBOUNDED 爲一個固定的數字就能夠了。咱們修改爲 2, 和 3 分別看一下
SELECT order_no,
order_type,
order_text,
order_qty,
SUM(order_qty) OVER (ORDER BY order_no ROWS BETWEEN 2 PRECEDING AND CURRENT ROW) AS cumulative_qty2,
SUM(order_qty) OVER (ORDER BY order_no ROWS BETWEEN 3 PRECEDING AND CURRENT ROW) AS cumulative_qty3
FROM wip_order_test;
複製代碼
解釋下:倒數第二列咱們修改窗口起點2,表示當前行與前兩行之間的範圍。能夠看到每一行的值都是當前行與它前面兩行的值的累加。而最後一列,是當前行與它以前3行的值的累加。每處理一行,窗口的起點和終點都向下移動。
同理,SUM 也能夠改成 AVG 求窗口的平均值
FIRST_VALUE() 和 LAST_VALUE()能夠獲取窗口的第一行和最後一行,NTH_VALUE()能夠獲取第 N 行。看一下例子:
SELECT order_no,
order_type,
order_text,
order_qty,
first_value(order_qty) OVER (ORDER BY order_no ROWS BETWEEN 2 PRECEDING AND CURRENT ROW) AS first_value,
last_value(order_qty) OVER (ORDER BY order_no ROWS BETWEEN 3 PRECEDING AND CURRENT ROW) AS last_value,
nth_value(order_qty,2) OVER (ORDER BY order_no ROWS BETWEEN 3 PRECEDING AND CURRENT ROW) AS second_value
FROM wip_order_test;
複製代碼
這個函數頗有用,有時候在 GROUP BY 之後,咱們想讓分組內的某一列的幾個值顯示在一行上,好比:
SELECT
order_type,
listagg(to_char(order_text),'-') WITHIN GROUP (ORDER BY order_type) AS text
FROM wip_order_test
GROUP BY order_type
複製代碼
結果:
看到,經過 LISTAGG ,把每一個分組中的訂單描述字段鏈接起來。第一個參數表示要合併的字段名字,第二個參數表示分隔符。
Oracle 12c中新增了對 TOP-N的支持。
SELECT order_no,
order_type,
order_text,
order_qty
FROM wip_order_test
FETCH FIRST 3 ROWS ONLY;
複製代碼
咱們用 FETCH FIRST 3 取出了前 3 行數據,這裏也可使用 FETCH FIRST 20 PERCENT ROWS ONLY 用百分比來取出前 20% 的數據。
還可使用 OFFSET 關鍵字,來表示從第幾行開始取,好比 OFFSET 5 ROWS FETCH NEXT 3 ROWS ONLY 就表示從第 5 行開始往下取 3 行。
能夠算一組值的中位數,傳入一個參數,好比傳入0.5 表示 1/2 中位數,0.75 表示 3/4 中位數
SELECT order_type,
percentile_cont(0.5) WITHIN GROUP (
ORDER BY order_qty) AS A,
percentile_cont(0.75) WITHIN GROUP (
ORDER BY order_qty) AS b
FROM wip_order_test
GROUP BY order_type
複製代碼
咱們根據訂單類型分組後,分別算出每種訂單類型數量的 1/2 中位數和 3/4中位數。