本文翻譯自官網,官網地址:(https://docs.influxdata.com/influxdb/v1.7/query_language/data_exploration/)sql
GROUP BY子句經過用戶本身制定的tags set或time區間,來將查詢結果進行分組。數據庫
GROUP BY <tag> 經過用戶指定的tag set,來對查詢結果進行分組。
語法:express
SELECT_clause FROM_clause [WHERE_clause] GROUP BY [* | <tag_key>[,<tag_key]]
GROUP BY子句 | 意義 |
---|---|
GROUP BY * | 使用全部tag對查詢結果進行分組 |
GROUP BY <tag_key> | 使用指定tag對查詢結果進行分組 |
GROUP BY <tag_key>,<tag_key> | 使用指定的多個tag對查詢結果進行分組,其中tag之間的順序是無關的。 |
注 :若是在sql中同時存在WHERE子句和GROUP BY子句,則GROUP BY子句必定要在WHERE子句以後!函數
Other supported features: Regular Expressionsspa
Group query results by a single tag
上面的sql使用了MEAN函數,來對h2o_feet這個measurement中的location這個tag進行分組求平均值。
注:在InfluxDB中,<font color=Red size=2>0紀元1970-01-01T00:00:00Z</font>這個時間常常被用來表示timestamp的NULL值。若是你的查詢中沒有顯示指定返回一個timestamp,好比上面在調用聚合函數時,就沒有指定時間區間,所以InfluxDB最後返回0紀元來做爲timestamp。翻譯
Group query results by more than one tag
3d
Group query results by all tags
code
GROUP BY time() 查詢會將查詢結果按照用戶指定的時間區間來進行分組。
語法:blog
SELECT <function>(<field_key>) FROM_clause WHERE <time_range> GROUP BY time(<time_interval>),[tag_key] [fill(<fill_option>)]
基本的 GROUP BY time() 查詢用法須要在SELECT子句中調用相關函數,而且在WHERE子句中調用time時間區間。flux
time(time_interval)
在GROUP BY time()子句中的time_interval是個連續的時間區間,該時間區間決定了InfluxDB如何經過時間來對查詢結果進行分組。好比,若是time_interval爲5m,那麼它會將查詢結果分爲5分鐘一組(若是在WHERE子句中指定了time區間,那麼就是將WHERE中指定的time區間劃分爲沒5分鐘一組)。
fill(<fill_option>)
fill(<fill_option>) 是可選的。它能夠填充那些沒有數據的時間區間的值。 從 [GROUP BY time intervals and fill() ] (https://docs.influxdata.com/influxdb/v1.7/query_language/data_exploration/#group-by-time-intervals-and-fill) 部分可查看到關於這部分的更多信息。
注:基本的GROUP BY time()查詢經過當前InfluxDB數據庫的預設時間邊界來肯定每一個時間間隔中包含的原始數據和查詢返回的時間戳。
先看一個WHERE查詢
下面的GROUP BY time(time_interval)示例是在上面的sql基礎上進行改進的,sql爲:
SELECT COUNT("water_level") FROM "h2o_feet" WHERE "location"='coyote_creek' AND time >= '2015-08-18T00:00:00Z' AND time <= '2015-08-18T00:30:00Z' GROUP BY time(12m)
查詢結果:
該sql將h2o_feet表中tag=「coyote_creek」,且在'2015-08-18T00:00:00Z'和'2015-08-18T00:30:00Z'時間區間內的數據查詢出來,並對其劃分爲每12分鐘一組,對water_level值進行count計算。
注意:在查詢結果中,時間區間是左閉右開的。拿第一行查詢結果數據來講,2015-08-18T00:00:00Z表示的時間區間是[2015-08-18T00:00:00, 2015-08-18T00:12:00Z )
問題:查詢結果中有預期以外的時間區間和值。
在基本用法中,GROUP BY time()查詢經過當前InfluxDB數據庫的預設時間邊界來肯定每一個時間間隔中包含的原始數據和查詢返回的時間戳,這有可能會致使預期以外的結果值。
好比,經過以下sql:
SELECT "water_level" FROM "h2o_feet" WHERE "location"='coyote_creek' AND time >= '2015-08-18T00:00:00Z' AND time <= '2015-08-18T00:18:00Z'
咱們查詢到原始數據以下所示:
在接下來的查詢中,咱們經過WHERE子句,指定查詢12分鐘內的數據,並經過GROUP BY子句,將查詢結果按12分鐘的時間區間進行分組。
SELECT COUNT("water_level") FROM "h2o_feet" WHERE "location"='coyote_creek' AND time >= '2015-08-18T00:06:00Z' AND time < '2015-08-18T00:18:00Z' GROUP BY time(12m)
按照預想,由於查詢的是12分鐘內的數據,而且group by時是按照12分鐘來進行分組的,因此最後的查詢結果應該只有一行而已。而後實際的查詢結果卻有兩行:
解釋 : influxdb使用預設的整數時間邊界來做爲GROUP BY的時間間隔,這些間隔獨立於WHERE子句中的任什麼時候間條件。在計算結果時,全部返回的數據都必須出如今WHERE查詢的顯式時間範圍內,但當按間隔做爲GROUP BY分組時是基於預設的時間邊界。
(這裏翻譯的很差,下面是原版英文:
InfluxDB uses preset round-number time boundaries for GROUP BY intervals that are independent of any time conditions in the WHERE clause. When it calculates the results, all returned data must occur within the query’s explicit time range but the GROUP BY intervals will be based on the preset time boundaries. )
高級的GROUP BY time()語法容許用戶自定義預設時間邊界的開始時間。在高級語法小節的示例sql3中,將展現這種用法,它查詢的結果以下:
語法以下:
SELECT <function>(<field_key>) FROM_clause WHERE <time_range> GROUP BY time(<time_interval>,<offset_interval>),[tag_key] [fill(<fill_option>)]
在GROUP BY time()高級語法中,須要在SELECT子句中調用InfluxDB的函數,並在WHERE子句中指定時間區間。而且須要注意到的是,GROUP BY子句必須在WHERE子句以後!
time(time_interval,offset_interval)
在GROUP BY time()子句中的經過time_interval和offset_interval來表示一個連續的時間區間,該時間區間決定了InfluxDB如何經過時間來對查詢結果進行分組。好比,若是時間區間爲5m,那麼它會將查詢結果分爲5分鐘一組(若是在WHERE子句中指定了time區間,那麼就是將WHERE中指定的time區間劃分爲沒5分鐘一組)。
offset_interval是持續時間文本。它向前或向後移動InfluxDB數據庫的預設時間邊界。offset_interval能夠爲正或負。
fill(<fill_option>)
fill(<fill_option>)是可選的。 它能夠填充那些沒有數據的時間區間的值。 從 GROUP BY time intervals and fill() 部分可查看到關於這部分的更多信息。
注:高級 GROUP BY time() 語法依賴於time_interval、offset_interval、以及 InfluxDB 數據庫的預設時間邊界來肯定每組內的數據條數、以及查詢結果的時間戳。
先看以下查詢sql
SELECT "water_level" FROM "h2o_feet" WHERE "location"='coyote_creek' AND time >= '2015-08-18T00:00:00Z' AND time <= '2015-08-18T00:54:00Z'
查詢結果:
接下來將使用上面的樣例數據的子集來進行演示。如下sql將按照每18m對數據進行進組,並將預設的時間界限前移。
ELECT MEAN("water_level") FROM "h2o_feet" WHERE "location"='coyote_creek' AND time >= '2015-08-18T00:06:00Z' AND time <= '2015-08-18T00:54:00Z' GROUP BY time(18m,6m)
查詢結果:
可見上面sql將查詢結果按照每18m爲一組進行了分組,而且將預設的時間界限偏移了6分鐘。
注意,對於沒有offset_interval的group by time(),它的查詢結果的時間邊界和返回的時間戳遵循influxdb數據庫的預設時間邊界。下面咱們看offset_interval的group by time()的查詢結果:
SELECT MEAN("water_level") FROM "h2o_feet" WHERE "location"='coyote_creek' AND time >= '2015-08-18T00:06:00Z' AND time <= '2015-08-18T00:54:00Z' GROUP BY time(18m)
再看以下sql:
SELECT MEAN("water_level") FROM "h2o_feet" WHERE "location"='coyote_creek' AND time >= '2015-08-18T00:06:00Z' AND time <= '2015-08-18T00:54:00Z' GROUP BY time(18m,-12m);
查詢結果
注 :該sql使用的是time(18m,-12m),offset_interval是負數,它的查詢結果跟使用time(18m,6m)是同樣的。<font color=Red size=2>所以在決定正負偏移間隔時,請隨意選擇最直觀的選項。</font>
Fill() 能夠填充那些沒有數據的時間區間的值。
語法:
SELECT <function>(<field_key>) FROM_clause WHERE <time_range> GROUP BY time(time_interval,[<offset_interval])[,tag_key] [fill(<fill_option>)]
默認狀況下,在GROUP BY time()查詢結果中,若某個時間區間沒有數據,則該時間區間對應的值爲null。經過fill(),就能夠填充那些沒有數據的時間區間的值。
須要注意的是,fill()必須出如今GROUP BY子句的最後。
Fill選項
fill(100)
fill(linear)
fill(none)
fill(null)
fill(previous)