sql分組統計語句
1.報表合計專用的Rollup函數
銷售報表
廣州 1月 2000元
廣州 2月 2500元
廣州 4500元
深圳 1月 1000元
深圳 2月 2000元
深圳 3000元
全部地區 7500元
以往的查詢SQL:
Select area,month,sum(money) from SaleOrder group by area,month
而後廣州,深圳的合計和全部地區合計都須要在程序裏自行累計
1.其實可使用以下SQL: Select area,month,sum(total_sale) from SaleOrder group by
rollup(area,month)就能產生和報表如出一轍的紀錄
2.若是year不想累加,能夠寫成 Select year,month,area,sum(total_sale) from SaleOrder group by
year,
rollup(month,area) 另外Oracle 9i還支持以下語法: Select year,month,area,sum(total_sale) from SaleOrder group by rollup(
(year,month),area)
3.若是使用Cube(area,month)而不是RollUp(area,month),除了得到每一個地區的合計以外,還將得到每月份的合計,在報表最後顯示。
4.Grouping讓合計列更好讀
RollUp在顯示廣州合計時,月份列爲NULL,但更好的作法應該是顯示爲"全部月份"
Grouping就是用來判斷當前Column是不是一個合計列,1爲yes,而後用Decode把它轉爲"全部月份" Select
Decode(Grouping(area),1,'全部地區',area) area,
Decode(Grouping(month),1,'全部月份',month),
sum(money)
From SaleOrder
Group by RollUp(area,month);
2.對多級層次查詢的start with.....connect by
好比人員組織,產品類別,Oracle提供了很經典的方法
SELECT
LEVEL, name, emp_id,manager_emp_id
FROM employee
START WITH manager_emp_id is null
CONNECT BY PRIOR emp_id = manager_emp_id;
上面的語句demo了所有的應用,start with指明從哪裏開始遍歷樹,若是從根開始,那麼它的manager應該是Null,若是從某個職員開始,能夠寫成emp_id='11'
CONNECT BY 就是指明父子關係,注意PRIOR位置
另外還有一個LEVEL列,顯示節點的層次
3.更多報表/分析決策功能
3.1 分析功能的基本結構
分析功能() over( partion子句,order by子句,窗口子句)
概念上很難講清楚,仍是用例子說話比較好.
3.2 Row_Number 和 Rank, DENSE_Rank
用於選出Top 3 sales這樣的報表
當兩個業務員可能有相同業績時,就要使用Rank和Dense_Rank
好比
金額 RowNum Rank Dense_Rank
張三 4000元 1 1 1
李四 3000元 2 2 2
錢五 2000元 3 3 3
孫六 2000元 4 3 3
丁七 1000元 5 5 4
這時,應該把並列第三的錢五和孫六都選進去,因此用Ranking功能比RowNumber保險.至於Desnse仍是Ranking就看具體狀況了。
SELECT salesperson_id, SUM(tot_sales) sp_sales,
RANK( ) OVER (ORDER BY SUM(tot_sales) DESC) sales_rank
FROM orders
GROUP BY salesperson_id
3.3 NTILE 把紀錄平分紅甲乙丙丁四等
好比我想取得前25%的紀錄,或者把25%的紀錄看成同一個level平等對待,把另25%看成另外一個Level平等對待
SELECT cust_nbr, SUM(tot_sales) cust_sales,
NTILE(4) OVER (ORDER BY SUM(tot_sales) DESC) sales_quartile
FROM orders
GROUP BY cust_nbr
ORDER BY 3,2 DESC;NTITLE(4)把紀錄以 SUM(tot_sales)排序分紅4份.
3.4 輔助分析列和Windows Function
報表除了基本事實數據外,總但願旁邊多些整年總銷量,到目前爲止的累計銷量,先後三個月的平均銷量這樣的列來參考.
這種先後三個月的平均和到目前爲止的累計銷量就叫windows function, 見下例 SELECT month, SUM(tot_sales) monthly_sales,
SUM(SUM(tot_sales)) OVER (ORDER BY month
ROWS BETWEEN UNBOUNDED PRECEDING AND CURRENT ROW) max_preceeding
FROM orders
GROUP BY month
ORDER BY month;
SELECT month, SUM(tot_sales) monthly_sales,
AVG(SUM(tot_sales)) OVER (ORDER BY month
ROWS BETWEEN 1 PRECEDING AND 1 FOLLOWING) rolling_avg
FROM orders
GROUP BY month
ORDER BY month;
Windows Function的關鍵就是Windows子句的幾個取值
1 PRECEDING 以前的一條記錄
1 FOLLOWING 以後的一條記錄
UNBOUNDED PRECEDING 以前的全部記錄
CURRENT ROW 當前紀錄
4.SubQuery總結
SubQuery每天用了,理論上總結一下.SubQuery 分三種
1.Noncorrelated 子查詢 最普通的樣式.
2.Correlated Subqueries 把父查詢的列拉到子查詢裏面去,頭一回cyt教個人時候理解了半天.
3.Inline View 也被當成最普通的樣式用了.
而後Noncorrelated 子查詢又有三種狀況
1.返回一行一列 where price < (select max(price) from goods )
2.返回多行一列 where price>= ALL (select price from goods where type=2)
or where NOT price< ANY(select price from goods where type=2)
最經常使用的IN其實就是=ANY()
3.返回多行多列 一次返回多列固然就節省了查詢時間 UPDATE monthly_orders
SET (tot_orders, max_order_amt) =
(SELECT COUNT(*), MAX(sale_price)
FROM cust_order)
DELETE FROM line_item
WHERE (order_nbr, part_nbr) IN
(SELECT order_nbr, part_nbr FROM cust_order c)