SPL 簡化 SQL 案例詳解：組內運算

時間 2019-11-10

標籤 spl 簡化 sql 案例詳解運算欄目 SQL 简体版

原文原文鏈接

在開發數據庫應用時，常常在分組後須要對組內數據進行計算，例如：列出近3年每一年都發表過論文的學生名單（按論文發表年分組後列出每一年都出現的學生清單），統計所有參加了歷次培訓的員工（按培訓分組後統計每次都有的員工人數），選出每位客戶的高爾夫成績最高的三天（按客戶分組後按天計算成績的Top3）等等。java

對於SQL來講，完成這類運算通常較爲複雜，須要嵌套多層，每每致使代碼難以理解和維護困難。而SPL很是擅長這類組內計算，而且很容易和JAVA、報表工具集成。下面用一個例子來進行說明。數據庫

表sales存儲着多年的訂單數據，部分數據以下：ide

OrderID	Client	SellerId	OrderDate	Amount
10808	OLDWO	2	2015/1/1	1660
10809	WELLI	7	2015/1/1	140
10810	LAUGB	2	2015/1/1	187
10811	LINOD	8	2015/1/2	852
10812	REGGC	5	2015/1/2	1852
10813	RICAR	1	2015/1/5	648
10814	VICTE	3	2015/1/5	2070
10815	SAVEA	2	2015/1/5	40
10816	GREAL	4	2015/1/6	8891

要求是請根據該表統計出指定年份（例如2015）中，每月銷售金額均排在前20名的客戶名稱。函數

解決這個問題的思路是，首先選出2015年銷售數據，按月分組統計，而後循環選出每個月銷售前20名的客戶，最後求各組的交集。工具

這樣的計算在SQL很難直接表達，而SPL則能夠很天然地逐步計算，將複雜問題拆分後得出最終結果。blog

SPL代碼：排序

	A
1	=db.query("select * from sales")
2	=A1.select(year(ORDERDATE)==YEAR)
3	=A2.group(month(ORDERDATE))
4	=A3.(~.group(CLIENT))
5	=A4.(~.top(-20;sum(AMOUNT)))
6	=A5.(~.new(CLIENT,sum(AMOUNT):MONTH_AMOUNT))
7	=A6.(~.(CLIENT))
8	=A7.isect()

A1：從數據庫中讀出銷售表；接口

A2：=A1.select(year(ORDERDATE)==YEAR)，從銷售數據中取出指定年份的數據。經過網格參數YEAR靈活適應不一樣的查詢需求，此例中YEAR=2015。固然，這裏的過濾也能夠直接經過A1中的SQL來完成。開發

A3：=A2.group(month(ORDERDATE))，使用group函數，將2015年的數據按照月份分組。這裏須要特別說明的是，SPL的數據分組，是真實的分組，會根據須要將數據實際分爲多個組。這和SQL中的狀況不一樣，SQL中的group by命令是直接計算分組的彙總值，並不能保留中間的分組結果。所以也就沒法對分組的數據進一步計算了。分組後，A3中的數據以下：文檔