elasticsearch聚合操做——本質就是針對搜索後的結果使用桶bucket（容許嵌套）進行group by，統計下分組結果，包括min/max/avg

時間 2019-11-16

標籤 elasticsearch 聚合本質就是針對搜索結果使用 bucket 容許嵌套進行 group 統計分組包括 min max avg 欄目日誌分析简体版

原文原文鏈接

分析

最後，咱們還有一個需求須要完成：容許管理者在職員目錄中進行一些分析。 Elasticsearch有一個功能叫作聚合(aggregations)，它容許你在數據上生成複雜的分析統計。它很像SQL中的GROUP BY可是功能更強大。spa

舉個例子，讓咱們找到全部職員中最大的共同點（興趣愛好）是什麼：rest

GET /megacorp/employee/_search
{
  "aggs": { "all_interests": { "terms": { "field": "interests" } } } }

暫時先忽略語法只看查詢結果：code

{
   ...
   "hits": { ... }, "aggregations": { "all_interests": { "buckets": [ { "key": "music", "doc_count": 2 }, { "key": "forestry", "doc_count": 1 }, { "key": "sports", "doc_count": 1 } ] } } }

咱們能夠看到兩個職員對音樂有興趣，一個喜歡林學，一個喜歡運動。這些數據並無被預先計算好，它們是實時的從匹配查詢語句的文檔中動態計算生成的。若是咱們想知道全部姓"Smith"的人最大的共同點（興趣愛好），咱們只須要增長合適的語句既可：ip

GET /megacorp/employee/_search
{
  "query": { "match": { "last_name": "smith" } }, "aggs": { "all_interests": { "terms": { "field": "interests" } } } }

all_interests聚合已經變成只包含和查詢語句相匹配的文檔了：文檔

...
  "all_interests": { "buckets": [ { "key": "music", "doc_count": 2 }, { "key": "sports", "doc_count": 1 } ] }

聚合也容許分級彙總。例如，讓咱們統計每種興趣下職員的平均年齡：string

GET /megacorp/employee/_search
{
    "aggs" : { "all_interests" : { "terms" : { "field" : "interests" }, "aggs" : { "avg_age" : { "avg" : { "field" : "age" } } } } } }

雖然此次返回的聚合結果有些複雜，但任然很容易理解：it

...
  "all_interests": { "buckets": [ { "key": "music", "doc_count": 2, "avg_age": { "value": 28.5 } }, { "key": "forestry", "doc_count": 1, "avg_age": { "value": 35 } }, { "key": "sports", "doc_count": 1, "avg_age": { "value": 25 } } ] }