6.InfluxDB-InfluxQL基礎語法教程--GROUP BY子句

本文翻譯自官網,官網地址:(https://docs.influxdata.com/influxdb/v1.7/query_language/data_exploration/)sql

GROUP BY子句經過用戶本身制定的tags set或time區間,來將查詢結果進行分組。數據庫

1、GROUP BY tags

GROUP BY <tag> 經過用戶指定的tag set,來對查詢結果進行分組。
語法:express

SELECT_clause FROM_clause [WHERE_clause]
GROUP BY [* | <tag_key>[,<tag_key]]
GROUP BY子句 意義
GROUP BY * 使用全部tag對查詢結果進行分組
GROUP BY <tag_key> 使用指定tag對查詢結果進行分組
GROUP BY <tag_key>,<tag_key> 使用指定的多個tag對查詢結果進行分組,其中tag之間的順序是無關的。

:若是在sql中同時存在WHERE子句和GROUP BY子句,則GROUP BY子句必定要在WHERE子句以後!函數

Other supported features: Regular Expressionsspa


GROUP BY tags 示例sql

  1. Group query results by a single tag
    上面的sql使用了MEAN函數,來對h2o_feet這個measurement中的location這個tag進行分組求平均值。
    注:在InfluxDB中,<font color=Red size=2>0紀元1970-01-01T00:00:00Z</font>這個時間常常被用來表示timestamp的NULL值。若是你的查詢中沒有顯示指定返回一個timestamp,好比上面在調用聚合函數時,就沒有指定時間區間,所以InfluxDB最後返回0紀元來做爲timestamp。翻譯

  2. Group query results by more than one tag
    3d

  3. Group query results by all tags
    code


2、基礎GROUP BY time intervals

GROUP BY time() 查詢會將查詢結果按照用戶指定的時間區間來進行分組。
語法:blog

SELECT <function>(<field_key>) FROM_clause
WHERE <time_range>
GROUP BY time(<time_interval>),[tag_key] [fill(<fill_option>)]

基本的 GROUP BY time() 查詢用法須要在SELECT子句中調用相關函數,而且在WHERE子句中調用time時間區間。flux

  • time(time_interval)
    在GROUP BY time()子句中的time_interval是個連續的時間區間,該時間區間決定了InfluxDB如何經過時間來對查詢結果進行分組。好比,若是time_interval爲5m,那麼它會將查詢結果分爲5分鐘一組(若是在WHERE子句中指定了time區間,那麼就是將WHERE中指定的time區間劃分爲沒5分鐘一組)。

  • fill(<fill_option>)
    fill(<fill_option>) 是可選的。它能夠填充那些沒有數據的時間區間的值。 從 [GROUP BY time intervals and fill() ] (https://docs.influxdata.com/influxdb/v1.7/query_language/data_exploration/#group-by-time-intervals-and-fill) 部分可查看到關於這部分的更多信息。

    注:基本的GROUP BY time()查詢經過當前InfluxDB數據庫的預設時間邊界來肯定每一個時間間隔中包含的原始數據和查詢返回的時間戳。


基本用法示例sql

先看一個WHERE查詢

下面的GROUP BY time(time_interval)示例是在上面的sql基礎上進行改進的,sql爲:

SELECT COUNT("water_level") FROM "h2o_feet"
WHERE "location"='coyote_creek'
    AND time >= '2015-08-18T00:00:00Z'
    AND time <= '2015-08-18T00:30:00Z'
GROUP BY time(12m)

查詢結果:
該sql將h2o_feet表中tag=「coyote_creek」,且在'2015-08-18T00:00:00Z'和'2015-08-18T00:30:00Z'時間區間內的數據查詢出來,並對其劃分爲每12分鐘一組,對water_level值進行count計算。
注意:在查詢結果中,時間區間是左閉右開的。拿第一行查詢結果數據來講,2015-08-18T00:00:00Z表示的時間區間是[2015-08-18T00:00:00, 2015-08-18T00:12:00Z )


常見問題

問題:查詢結果中有預期以外的時間區間和值。
在基本用法中,GROUP BY time()查詢經過當前InfluxDB數據庫的預設時間邊界來肯定每一個時間間隔中包含的原始數據和查詢返回的時間戳,這有可能會致使預期以外的結果值。
好比,經過以下sql:

SELECT "water_level" FROM "h2o_feet"
WHERE "location"='coyote_creek'
    AND time >= '2015-08-18T00:00:00Z'
    AND time <= '2015-08-18T00:18:00Z'

咱們查詢到原始數據以下所示:

在接下來的查詢中,咱們經過WHERE子句,指定查詢12分鐘內的數據,並經過GROUP BY子句,將查詢結果按12分鐘的時間區間進行分組。

SELECT COUNT("water_level") FROM "h2o_feet"
WHERE "location"='coyote_creek'
    AND time >= '2015-08-18T00:06:00Z'
    AND time < '2015-08-18T00:18:00Z'
GROUP BY time(12m)

按照預想,由於查詢的是12分鐘內的數據,而且group by時是按照12分鐘來進行分組的,因此最後的查詢結果應該只有一行而已。而後實際的查詢結果卻有兩行:

解釋 : influxdb使用預設的整數時間邊界來做爲GROUP BY的時間間隔,這些間隔獨立於WHERE子句中的任什麼時候間條件。在計算結果時,全部返回的數據都必須出如今WHERE查詢的顯式時間範圍內,但當按間隔做爲GROUP BY分組時是基於預設的時間邊界。
(這裏翻譯的很差,下面是原版英文:
InfluxDB uses preset round-number time boundaries for GROUP BY intervals that are independent of any time conditions in the WHERE clause. When it calculates the results, all returned data must occur within the query’s explicit time range but the GROUP BY intervals will be based on the preset time boundaries. )

高級的GROUP BY time()語法容許用戶自定義預設時間邊界的開始時間。在高級語法小節的示例sql3中,將展現這種用法,它查詢的結果以下:


3、高級GROUP BY time() 語法

語法以下:

SELECT <function>(<field_key>)
FROM_clause
WHERE <time_range>
GROUP BY time(<time_interval>,<offset_interval>),[tag_key] [fill(<fill_option>)]

在GROUP BY time()高級語法中,須要在SELECT子句中調用InfluxDB的函數,並在WHERE子句中指定時間區間。而且須要注意到的是,GROUP BY子句必須在WHERE子句以後!

  • time(time_interval,offset_interval)
    在GROUP BY time()子句中的經過time_interval和offset_interval來表示一個連續的時間區間,該時間區間決定了InfluxDB如何經過時間來對查詢結果進行分組。好比,若是時間區間爲5m,那麼它會將查詢結果分爲5分鐘一組(若是在WHERE子句中指定了time區間,那麼就是將WHERE中指定的time區間劃分爲沒5分鐘一組)。
    offset_interval是持續時間文本。它向前或向後移動InfluxDB數據庫的預設時間邊界。offset_interval能夠爲正或負。

  • fill(<fill_option>)
    fill(<fill_option>)是可選的。 它能夠填充那些沒有數據的時間區間的值。 從 GROUP BY time intervals and fill() 部分可查看到關於這部分的更多信息。

    :高級 GROUP BY time() 語法依賴於time_interval、offset_interval、以及 InfluxDB 數據庫的預設時間邊界來肯定每組內的數據條數、以及查詢結果的時間戳。


高級用法示例sql

先看以下查詢sql

SELECT "water_level" FROM "h2o_feet"
WHERE "location"='coyote_creek'
    AND time >= '2015-08-18T00:00:00Z'
    AND time <= '2015-08-18T00:54:00Z'

查詢結果:
接下來將使用上面的樣例數據的子集來進行演示。如下sql將按照每18m對數據進行進組,並將預設的時間界限前移。

ELECT MEAN("water_level") FROM "h2o_feet"
WHERE "location"='coyote_creek'
    AND time >= '2015-08-18T00:06:00Z'
    AND time <= '2015-08-18T00:54:00Z'
GROUP BY time(18m,6m)

查詢結果:

可見上面sql將查詢結果按照每18m爲一組進行了分組,而且將預設的時間界限偏移了6分鐘。
注意,對於沒有offset_interval的group by time(),它的查詢結果的時間邊界和返回的時間戳遵循influxdb數據庫的預設時間邊界。下面咱們看offset_interval的group by time()的查詢結果:

SELECT MEAN("water_level") FROM "h2o_feet"
WHERE "location"='coyote_creek'
    AND time >= '2015-08-18T00:06:00Z'
    AND time <= '2015-08-18T00:54:00Z'
GROUP BY time(18m)

再看以下sql:

SELECT MEAN("water_level") FROM "h2o_feet"
WHERE "location"='coyote_creek'
    AND time >= '2015-08-18T00:06:00Z'
    AND time <= '2015-08-18T00:54:00Z'
GROUP BY time(18m,-12m);

查詢結果

:該sql使用的是time(18m,-12m),offset_interval是負數,它的查詢結果跟使用time(18m,6m)是同樣的。<font color=Red size=2>所以在決定正負偏移間隔時,請隨意選擇最直觀的選項。</font>


GROUP BY time intervals and fill()

Fill() 能夠填充那些沒有數據的時間區間的值。
語法:

SELECT <function>(<field_key>) FROM_clause
WHERE <time_range>
GROUP BY time(time_interval,[<offset_interval])[,tag_key] [fill(<fill_option>)]

默認狀況下,在GROUP BY time()查詢結果中,若某個時間區間沒有數據,則該時間區間對應的值爲null。經過fill(),就能夠填充那些沒有數據的時間區間的值。
須要注意的是,fill()必須出如今GROUP BY子句的最後。

Fill選項

  1. 任何數學數值
    使用給定的數學數值進行填充
  2. linear
    爲沒有數據值的時間區間線性插入數值,使得插入以後的數值,跟其餘原本就有數據的區間的值成線性。(這裏翻譯的不是很好,看示例就能明白了)
  3. none
    若某個時間區間內沒有數據,則在查詢結果中該區間對應的時間戳將不顯示出來
  4. null
    沒有值的區間,顯示爲null。這也是默認的選項。
  5. previous
    用前一個區間的數值來填充當前沒有數據的區間的值。

示例:

  1. fill(100)

  2. fill(linear)

  3. fill(none)

  4. fill(null)

  5. fill(previous)

相關文章
相關標籤/搜索