coordinator是workflow的定時提交器,基於時間條件與數據生成觸發(based on time and data triggers)。簡單點說,coordinator按所定義的時間週期進行輪詢,若數據生成條件知足,則觸發workflow任務;不然,則等待數據生成或跳過(調度策略由設置的超時時間決定)。併發
<coordinator-app name="coord-demo" frequency="${coord:days(1)}" start="${start_time}" end="${end_time}" timezone="Asia/Shanghai" xmlns="uri:oozie:coordinator:0.1">
文件頭定義了coordinator任務的名稱,執行頻率(frequency),開始與起止時間(start、end)。${coord:days(1)}
爲coordinator內置的EL function (Expression Language),表示爲執行週期爲一天。frequency的時間單位爲分鐘,則${coord:days(1)}=1440
,${coord:hours(3)}=180
. 通常地,在job.properties定義如:start_time=2016-06-07T00:00Z,應以UTC時區爲準。app
<controls> <!--超時時間,若爲0,一旦數據生成超時則coordinator action被丟棄; 若爲-1,則一直等待數據生成; 若 > 0,即爲超時時間(單位:分鐘)--> <timeout>-1</timeout> <!--併發action數--> <concurrency>1</concurrency> <!--同時被觸發的多個coordinator job的執行次序--> <execution>${execution_order}</execution> </controls>
<datasets> <!--數據生成目錄--> <dataset name="data" frequency="${coord:hours(1)}" initial-instance="${start_time}" timezone="${timezone}"> <uri-template>${nameNode}/path/to/${YEAR}-${MONTH}-${DAY}/${HOUR}/</uri-template> <done-flag></done-flag> </dataset> </datasets>
相關參數:函數
${YEAR}
、${MONTH}
等爲EL Time Constants,具體數值由<input-events> <data-in ..>
傳入,也可經過job.properties傳入自定義的參數。<input-events> <data-in name="dataReady" dataset="data"> <instance>${coord:current(-1)}</instance> </data-in> </input-events>
定義了數據觸發條件,${coord:current(-1)}
表示對於當前時間的偏移,其中偏移量=數值* dataset frequency。有些時候,咱們要判斷多個目錄是否生成,好比,判斷一天的24個小時目錄,這時應這樣寫:code
<data-in name="dataReady2" dataset="data"> <start-instance>${coord:current(-24)}</start-instance> <end-instance>${coord:current(-1)}</end-instance> </data-in>
<action> <workflow> <app-path>${wf_app_path}</app-path> <configuration> <property> <name>dayTime</name> <value>${coord:formatTime(coord:dateOffset(coord:nominalTime(), -1, 'DAY'), 'yyyy-MM-dd')}</value> </property> </configuration> </workflow> </action>
定義coordinator要觸發的workflow,orm
coordinator提供了一些用於時間計算的函數,好比:xml
返回多個時間:input
<value>${coord:formatTime(coord:dateOffset(coord:dateOffset(coord:nominalTime(), -12, 'HOUR'), -6, 'DAY'), 'yyyy-MM-dd')},${coord:formatTime(coord:dateOffset(coord:dateOffset(coord:nominalTime(), -12, 'HOUR'), -5, 'DAY')</value>