日誌實時收集之FileBeat+Kafka

時間 2019-11-30

標籤日誌實時收集 filebeat+kafka filebeat kafka 欄目 Kafka 简体版

原文原文鏈接

以前，咱們的某一個業務用於實時日誌收集處理的架構大概是這樣的：html

在日誌的產生端（LogServer服務器），都部署了FlumeAgent，實時監控產生的日誌，而後發送至Kafka。通過觀察，每個FlumeAgent都佔用了較大的系統資源（至少會佔用一顆CPU 50%以上的資源）。而另一個業務，LogServer壓力大，CPU資源尤爲緊張，若是要實時收集分析日誌，那麼就須要一個更輕量級、佔用資源更少的日誌收集框架，因而我試用了一下Filebeat。linux

Filebeat是一個開源的文本日誌收集器，採用go語言開發，它重構了logstash採集器源碼，安裝在日誌產生服務器上來監視日誌目錄或者特定的日誌文件，並把他們發送到logstash、elasticsearch以及kafka上。Filebeat是代替logstash-forwarder的數據採集方案，緣由是logstash運行在jvm上，對服務器的資源消耗比較大（Flume也是如此）。正由於Filebeat如此輕量級，所以不要奢望它能在日誌收集過程當中作更多清洗和轉換的工做，它只負責一件事，就是高效可靠的傳輸日誌數據，至於清洗和轉換，能夠在後續的過程當中進行。bootstrap

Filebeat官網地址爲：https://www.elastic.co/guide/en/beats/filebeat/current/index.html 你能夠在該地址中下載Filebeat和查看文檔。服務器

Filebeat安裝配置架構

Filebeat的安裝和配置很是簡單。框架

下載filebeat-5.6.3-linux-x86_64.tar.gz，並解壓。jvm

進入filebeat-5.6.3-linux-x86_64目錄，編輯配置文件filebeat.ymlelasticsearch

配置input，監控日誌文件：ide

filebeat.prospectors:學習

- input_type: log

paths:

- /data/dmp/openresty/logs/dmp_intf_*.log

配置output到Kafka

#—————————– Kafka output ——————————–