Elasticsearch——Rest API中的經常使用用法

本篇翻譯的是Elasticsearch官方文檔中的一些技巧,是使用Elasticsearch必不可少的必備知識,而且適用於全部的Rest Api。html

返回數據格式化

當在Rest請求後面添加?pretty時,結果會以Json格式化的方式顯示。另外,若是添加?format=yaml結果會以樹的形式顯示,默認都是Flase.node

返回數據的易讀性

結尾添加?human=true,返回的數據會有很好的可讀性,好比:curl

  • time:3600 會顯示爲 time:1h
  • size:1024 會顯示爲 1kb

經常使用的Date Math

在Elasticsearch中日期數學表達式是很經常使用的,在查詢中常常會經過它來做爲檢索條件,好比range或者daterange。表達式一般會有下面幾種操做:elasticsearch

  • +1h ,表示加上一個一個小時
  • -1d,表示減去一天
  • /d,表示向一天取整

支持的單位也不少,好比ide

  • y,表明一年
  • M,表明一個月
  • w,表明一週
  • d,表明一天
  • h,表明一個小時
  • m,表明一分鐘
  • s,表明一秒鐘
  • ms,表明毫秒

舉個例子:ui

  • now+1h,表示當前時間加上一個小時,即一個小時後
  • now+1h+1m,表示當前時間加上一個小時零一分鐘,即一個小時一分鐘後
  • now+1h/d,表示當前時間加上一個小時,並向一天取整。
  • 2015-01-01||+1M/d,2015-01-01加上一個月,並向一天取整

返回的內容過濾

有時候咱們可能並不想返回全部的數據,由於這樣會浪費必定的空間和時間,所以須要對查詢返回的結果進行過濾。全部的API都接受一個參數——filter_path,這個參數支持逗號分隔,能夠同時填寫多個值。url

例如,若是隻想要返回查詢的時間、事件的id和分值,能夠像下面這樣:翻譯

curl -XGET 'localhost:9200/_search?pretty&filter_path=took,hits.hits._id,hits.hits._score'
{
  "took" : 3,
  "hits" : {
    "hits" : [
      {
        "_id" : "3640",
        "_score" : 1.0
      },
      {
        "_id" : "3642",
        "_score" : 1.0
      }
    ]
  }
}

也支持*來忽略對某個字段的過濾:code

curl -XGET 'localhost:9200/_nodes/stats?filter_path=nodes.*.ho*'
{
  "nodes" : {
    "lvJHed8uQQu4brS-SXKsNA" : {
      "host" : "portable"
    }
  }
}

使用**則會忽略最大長度的路徑,與Spring MVC的Url匹配差很少。orm

curl 'localhost:9200/_segments?pretty&filter_path=indices.**.version'
{
  "indices" : {
    "movies" : {
      "shards" : {
        "0" : [ {
          "segments" : {
            "_0" : {
              "version" : "5.2.0"
            }
          }
        } ],
        "2" : [ {
          "segments" : {
            "_0" : {
              "version" : "5.2.0"
            }
          }
        } ]
      }
    },
    "books" : {
      "shards" : {
        "0" : [ {
          "segments" : {
            "_0" : {
              "version" : "5.2.0"
            }
          }
        } ]
      }
    }
  }
}

注意,elasticsearch通常會直接返回一條數據的原始信息,即_source字段。若是要對_source進行過濾,能夠參考下面的用法:

curl -XGET 'localhost:9200/_search?pretty&filter_path=hits.hits._source&_source=title'
{
  "hits" : {
    "hits" : [ {
      "_source":{"title":"Book #2"}
    }, {
      "_source":{"title":"Book #1"}
    }, {
      "_source":{"title":"Book #3"}
    } ]
  }
}

扁平化

設置flat_settings 爲true,會以扁平化的方式返回數據:

{
  "persistent" : { },
  "transient" : {
    "discovery.zen.minimum_master_nodes" : "1"
  }
}

關於參數

在Elastcisearch的使用中,每每要接觸到各類數據類型。若是某個字段設置了固定的類型,那麼當執行查詢或者索引時,一些數據會發生自動的類型轉換。

Boolean

在Es中,false、no、0、off這些值都表明false,其餘的值都是true.

Number

全部的API都支持以字符串的方式表明JSON中的數字類型。

Date

支持的類型上面都說過了...

Geo

Geo類型主要用於地圖一類的數據,這裏就先不介紹了。使用方法能夠參考

模糊查詢

有的時候一些須要容許必定的模糊度,好比檢索hallo能夠查詢到hello,這就要支持模糊查詢。模糊查詢能夠使用fuzziness參數,它有點像range:

-fuzziness <= fieldValue <= +fuzziness

而且能夠設置必定的模糊度,好比:

好比,長度爲:

  • 0..2,必須徹底匹配
  • 3..5,能夠有一個編輯距離的模糊度
  • >5,能夠有兩個編輯距離的模糊度

返回結果——駝峯式

全部的API都接受一個case參數,若是設置爲camelCase,那麼全部的名稱都會以駝峯式的形式返回。

查詢的請求體

除了POST請求外,其餘的請求時沒有請求體的。這個時候若是要執行查詢,能夠把參數放在Url後面。

參考

1 官方文檔
2 編輯距離,wiki百科

相關文章
相關標籤/搜索