match_recognize

相似分析函數的功能,能夠在行間進行匹配判斷並進行計算。在 SQL 中新的模式匹配語句是「match_recognize」。

match_recognize
CREATE TABLE Ticker (SYMBOL VARCHAR2(10), tstamp DATE, price NUMBER);ide

INSERT INTO Ticker VALUES('ACME', DATE '2011-04-01', 12);
INSERT INTO Ticker VALUES('ACME', DATE '2011-04-02', 17);
INSERT INTO Ticker VALUES('ACME', DATE '2011-04-03', 19);
INSERT INTO Ticker VALUES('ACME', DATE '2011-04-04', 21);
INSERT INTO Ticker VALUES('ACME', DATE '2011-04-05', 25);
INSERT INTO Ticker VALUES('ACME', DATE '2011-04-06', 12);
INSERT INTO Ticker VALUES('ACME', DATE '2011-04-07', 15);
INSERT INTO Ticker VALUES('ACME', DATE '2011-04-08', 20);
INSERT INTO Ticker VALUES('ACME', DATE '2011-04-09', 24);
INSERT INTO Ticker VALUES('ACME', DATE '2011-04-10', 25);
INSERT INTO Ticker VALUES('ACME', DATE '2011-04-11', 19);
INSERT INTO Ticker VALUES('ACME', DATE '2011-04-12', 15);
INSERT INTO Ticker VALUES('ACME', DATE '2011-04-13', 25);
INSERT INTO Ticker VALUES('ACME', DATE '2011-04-14', 25);
INSERT INTO Ticker VALUES('ACME', DATE '2011-04-15', 14);
INSERT INTO Ticker VALUES('ACME', DATE '2011-04-16', 12);
INSERT INTO Ticker VALUES('ACME', DATE '2011-04-17', 14);
INSERT INTO Ticker VALUES('ACME', DATE '2011-04-18', 24);
INSERT INTO Ticker VALUES('ACME', DATE '2011-04-19', 23);
INSERT INTO Ticker VALUES('ACME', DATE '2011-04-20', 22);函數

SELECT *
FROM Ticker MATCH_RECOGNIZE (
PARTITION BY symbol
ORDER BY tstamp
MEASURES STRT.tstamp AS start_tstamp,
LAST(DOWN.tstamp) AS bottom_tstamp,
LAST(UP.tstamp) AS end_tstamp
ONE ROW PER MATCH
AFTER MATCH SKIP TO LAST UP
PATTERN (STRT DOWN+ UP+)
DEFINE
DOWN AS DOWN.price < PREV(DOWN.price),
UP AS UP.price > PREV(UP.price)
) MR
ORDER BY MR.symbol, MR.start_tstamp;測試

SYMBOL START_TST BOTTOM_TS END_TSTAMcode


ACME 05-APR-11 06-APR-11 10-APR-11
ACME 10-APR-11 12-APR-11 13-APR-11
ACME 14-APR-11 16-APR-11 18-APR-11blog

這個查詢作了什麼?下面解釋了 MATCH_RECOGNIZE子句中的每一行:排序

.PARTITION BY 將Ticker表數據劃分紅邏輯分組,每組包含一種股票代號。it

.ORDER BY 將每一個邏輯分組內的數據按照tstamp排序。class

.MEASURES 定義了三個度量:V形開始的時間戳(start_tstamp),V形底部的時間戳(bottom_tstamp),以及V形結束的時間戳(end_tstamp)。bottom_tstamp 和 end_tstamp 度量使用了LAST()函數來確保讀取到的值是每一個匹配模式中的最後一個時間戳的值。變量

.ONE ROW PER MATCH 的意思是對於每一個找到的模式匹配,只會有一行輸出。搜索

.AFTER MATCH SKIP TO LAST UP 的意思是每當你找到一個匹配,你就在UP模式變量的最後一行從新開始你的搜索。一個模式變量是一個在MATCH_RECOGNIZE中使用的變量,在DEFINE子句定義。

.PATTERN (STRT DOWN+ UP+) 說的是你在搜索的模式有三個模式變量:STRT, DOWN, 以及 UP。DOWN 和 UP以後的加號(+)意思是它們中的每個都至少有一行被映射。這個模式定義一個規則表達式,這是一種表現力很強的搜索方式。

.DEFINE 給了咱們當一個行被映射到你的行模式變量STRT, DOWN, 和 UP時應該知足的條件。由於沒有爲STRT指定條件,任何一行均可以被映射爲STRT。爲何一個模式變量會沒有條件?你能夠用它來做爲測試匹配的起點。DOWN和UP都利用了PREV()函數,這使得它們可以把當前行的價格和前一行的價格進行比較。當價格比前一行更低時DOWN被匹配,因此它定義了V形的下行側(左腿)。若是價格比前一行更高則被映射到UP。

下面兩個圖能夠幫助你更好地理解例子20-1返回的結果。圖20-2顯示了映射到特定模式變量(在PATTERN子句中指定)的日期。在模式變量到日期的映射可見以後,MEASURES子句就用該信息來計算度量值。度量值的結果被顯示在圖20-3中。

本站公眾號
   歡迎關注本站公眾號,獲取更多信息