logstash筆記（二）——grok之match

時間 2019-11-20

標籤 logstash 筆記 grok match 欄目日誌分析简体版

原文原文鏈接

官方文檔：html

https://www.elastic.co/guide/en/logstash/current/plugins-filters-grok.html正則表達式

基本語法：數組

%{SYNTAX:SEMANTIC}ruby

SYNTAX：定義的正則表達式名字（系統插件自帶的默認位置：$HOME/vendor/bundle/jruby/1.9/gems/logstash-patterns-core-2.0.2/patterns）ide

SEMANTIC：匹配結果的標識oop

grok{
　　match=>{
　　　　"message"=>"%{IP:clientip}"
　　}
}ui

輸入結果spa

{
　　"message" => "192.168.1.1 abc",
　　"@version" => "1",
　　"@timestamp" => "2016-03-30T02:15:31.242Z",
　　"host" => "master",
　　"clientip" => "192.168.1.1"
}插件

clientip就是semantichtm

每一個%{IP:clientip}表達式只能匹配到message中第一次出現的結果，可用以下方式匹配多個相同類型結果

%{IP:clientip}\s+%{IP:clientip1}...，若是SEMANTIC定義的相同名字，結果爲數組形式，如：

{
　　"message" => "12.12.12.12 32.32.32.32",
　　"@version" => "1",
　　"@timestamp" => "2016-03-30T02:26:31.077Z",
　　"host" => "master",
　　"clientip" => [
　　　　[0] "12.12.12.12",
　　　　[1] "32.32.32.32"
　　]
}

自定義grok表達式

語法：(?<field_name>the pattern here)

eg：

grok{
　　match=>{
　　　　"message"=>"%{IP:clientip}\s+(?<mypattern>[A-Z]+)"
　　}
}

rs:

{
　　"message" => "12.12.12.12 ABC",
　　"@version" => "1",
　　"@timestamp" => "2016-03-30T03:22:04.466Z",
　　"host" => "master",
　　"clientip" => "12.12.12.12",
　　"mypattern" => "ABC"
}

建立自定義grok文件

在/home/hadoop/mylogstash/mypatterns_dir建立文件mypatterns_file，內容以下：

MY_PATTERN [A-Z]+

保存！

修改filter

grok{
　　patterns_dir=>["/home/hadoop/mylogstash/mypatterns_dir"]
　　match=>{
　　　　"message"=>"%{IP:clientip}\s+%{MY_PATTERN:mypattern}"
　　}
}

結果同上