ELK + filebeat 搭建日志处理服务

关键字：elasticsearch, logstash, kibana, filebeat

整体框架介绍

Elasticsearch
一个近乎实时查询的全文搜索引擎。Elasticsearch 的设计目标就是要能够处理和搜索巨量的日志数据。
Logstash
读取原始日志，并对其进行分析和过滤，然后将其转发给其他组件（比如 Elasticsearch）进行索引或存储。Logstash 支持丰富的 Input 和 Output 类型，能够处理各种应用的日志。
Kibana
一个基于 JavaScript 的 Web 图形界面程序，专门用于可视化 Elasticsearch 的数据。Kibana 能够查询 Elasticsearch 并通过丰富的图表展示结果。用户可以创建 Dashboard 来监控系统的日志。
Filebeat
引入Filebeat作为日志搜集器，主要是为了解决Logstash开销大的问题。相比Logstash，Filebeat所占系统的 CPU 和内存几乎可以忽略不计。

Filebeat 日志数据采集，Logstash 过滤，Elasticsearch 存储，Kibana 展示

主要的架构图如下：

其中日志的收集过程，也就filebeat部分是安装在需要收集日志的机器上的（比如，你有一个console服务，需要收集这个服务的日志，就需要将filebeat安装到console机器上。

整个后面的这一部分，对于处理量不大的服务，可以直接使用现成的docker镜像sebp/elk，一是部署简单，而是集成度高，不需要过分关心后三者之间的通信，镜像内都给处理好了，镜像内提供的服务都是最基础的服务，也就是一些进阶需求可能没有包含进去，所以，我们也可以在现有的这个sebp/elk镜像的基础上，自己二次开发，运行新的容器来达到我们更高的需求的目的。

docker上镜像的地址：dockerhub elk

elk-docker doc地址：elk-docker

github上的开源项目：github/elk-docker

满足的需求

现在手头的项目有多个test环境和debug环境，同时部署了若干个服务，如果服务出现问题，可能需要去不同机器去排查，费时费力，需要一个集中管理平台，一旦需要查看日志，又可以开箱即用的web界面满足需求。

环境说明

linux: Ubuntu 16.04
docker: Docker version 18.09.5
elk: sebp/elk latest
filebeat: filebeat-7.0.0

elk跟filebeat在不同一台机器上

安装与配置（主线）：

`filebeat`的安装与配置

上面说过，filebeat是安装部署到需要收集服务的机器上的，然后配置好对应的输入与输出，就可以工作了，一般输入就是对应的需要收集的log文件的地址，而输出可以是logstash或者Elasticache（可以部署在本机的，也可以是部署在其他机器上的）。

安装

filebeat安装地址，点击对应页面

推荐使用deb或者rpm在Linux机器上安装

deb安装方式，直接在Ubuntu机器上运行如下命令即可

1 2	curl -L -O https://artifacts.elastic.co/downloads/beats/filebeat/filebeat-7.0.0-amd64.deb sudo dpkg -i filebeat-7.0.0-amd64.deb

rpm安装方式。

1 2	curl -L -O https://artifacts.elastic.co/downloads/beats/filebeat/filebeat-7.0.0-x86_64.rpm sudo rpm -vi filebeat-7.0.0-x86_64.rpm

Mac上的安装方式

1 2	curl -L -O https://artifacts.elastic.co/downloads/beats/filebeat/filebeat-7.0.0-darwin-x86_64.tar.gz tar xzvf filebeat-7.0.0-darwin-x86_64.tar.gz

服务的启动等操作

安装后，默认是由systemctl来管理的

1	sudo systemctl restart filebeat.service # 重启服务

查看服务的状态

sudo systemctl restart filebeat.service
# 返回的部分信息如下， 通过下面的信息，我们可以看到状态是active正在运行
● filebeat.service - Filebeat sends log files to Logstash or directly to Elasticsearch.
   Loaded: loaded (/lib/systemd/system/filebeat.service; disabled; vendor preset: enabled)
   Active: active (running) since Tue 2019-04-16 05:08:29 UTC; 1min 41s ago
     Docs: https://www.elastic.co/products/beats/filebeat
 Main PID: 19811 (filebeat)
    Tasks: 8
   Memory: 5.5M
      CPU: 33ms
   CGroup: /system.slice/filebeat.service
           └─19811 /usr/share/filebeat/bin/filebeat -e -c /etc/filebeat/filebeat.yml -path.home /usr/share/filebeat -path.config /etc/filebeat -path.data /var/lib/filebeat -path.logs /var/log/filebeat

配置

安装完filebeat并能够启动和查看状态之后，我们就需要对其进行基础的配置，来和我们的elk配合。

下面是一个最基础的配置信息，如果再有更高的需求，可以查阅对应的文档来修改:

配置文件的地址/etc/filebeat/filebeat.yml, 可能需要sudo权限，详细的配置信息请参考这里。

# 输入区配置
filebeat.inputs:
# Each - is an input. Most options can be set at the input level, so
# you can use different inputs for various configurations.
# Below are the input specific configurations.
- type: log
  # Change to true to enable this input configuration.
  enabled: false   # 需要把这个false改成true，不然无法开启日志的输入
  # Paths that should be crawled and fetched. Glob based paths.
  paths:
  	# 这里是你需要日常监控的日志的地址，例子：- /opt/console/project_name/*.log
    - /var/log/*.log
    #- c:\programdata\elasticsearch\logs\*
# 输出区配置   可以输出到Elasticache或者Logstash
# 只能使用一行输出，其它的注掉即可
# 如果要输出到Elasticache，需要配置他的信息，主要就是host信息
output.elasticsearch:
  # Array of hosts to connect to.
  # 这里可以填多个host信息，可以是本地的服务，也可以是其他机器的服务
  # 例子 ["2.88.20.211:9200"] 这个是部署了Elasticache服务的机器的地址，并开放9200端口
  hosts: ["localhost:9200"]
# 输出到Logstash，如果需要配置SSL信息情况会复杂一些，我们这里为了简单，不用SSL，按照如下配置即可
output.logstash:
  # The Logstash hosts
  # 一般logstash的端口是5044，确保提供服务的机器(本机或者其他机器)开放了5044端口
  hosts: ["localhost:5044"]

基本上配置好了这个信息后，就可以重新启动服务了，重启后，如果elk那边运行时正常的，那么这边的日志会源源不断的扔到Elasticache或者logstash中去，kibana上就可以看到对应的日志信息了。

`ELK`的安装与配置

ELK是Logstash，Elasticsearch，Kibana的组合体，他们三个单独安装适用于大的集群，稍微中等或者小一点的服务，可以直接使用集成好的docker的elk镜像来安装。

总的介绍文档可以看这一篇

安装与配置

首先保证已经安装好了docker环境

由于elk比较消耗资源，因此需要令这个docker进程的虚拟内存大一些，我们需要首先修改max_map_count这个参数，这个参数的具体指的是：

max_map_count : 文件包含限制一个进程可以拥有的VMA(虚拟内存区域)的数量。虚拟内存区域是一个连续的虚拟地址空间区域。在进程的生命周期中，每当程序尝试在内存中映射文件，链接到共享内存段，或者分配堆空间的时候，这些区域将被创建。调优这个值将限制进程可拥有VMA的数量。限制一个进程拥有VMA的总数可能导致应用程序出错，因为当进程达到了VMA上线但又只能释放少量的内存给其他的内核进程使用时，操作系统会抛出内存不足的错误。如果你的操作系统在NORMAL区域仅占用少量的内存，那么调低这个值可以帮助释放内存给内核用。

需要运行如下的命令，调高vma的大小，不然会出现安装好elk之后，容器自动停止运行的现象，即运行这个镜像至少需要262144的内存：

1	sudo sysctl -w vm.max_map_count=262144

然后就是docker的一系列操作了

1 2	# 从docker hub拉下 sebp/elk的最新镜像 sudo docker pull sebp/elk

1 2	# 运行以这个镜像为基础的容器，命名为elk, 并且设定好对应的端口映射 sudo docker run -p 5601:5601 -p 9200:9200 -p 5044:5044 -it --name elk sebp/elk

这一步会花点时间，耐心等待。

启动之后我们去配置对应的logstash信息。

sudo docker ps -a   # 查看这个容器的信息
sudo docker exec -it elk(这里也可以用容器的ID) bash  # 进入容器内容，并使用交互shell
cd /etc/logstash/conf.d/   # 进入并修改02-beats-input.conf
vim 02-beats-input.conf

将这个配置文件修改文如下, 即删除了SSL的配置信息，因为我们在filebeat中也没有使用SSL，因此这里必须将配置信息的东西关掉:

# 需要留下的配置
input {
  beats {
    port => 5044
  }
}

然后重启docker服务

1	docker restart elk(或者容器ID）

此时已经基本完成了部署，为了提供可查看的kibana界面，我们需要配置一下NGINX地址

cd /etc/nginx/sites-enabled # 进入NGINX配置文件地址
# 修改为如下
server {
    listen    80;
    server_name jiangxuetang206.top(这里是你自己的域名，或者可以不用域名);
    proxy_buffers 8 16k;
    proxy_buffer_size 32k;
    fastcgi_buffers 8 16k;
    fastcgi_buffer_size 32k;
    client_max_body_size 30M;
    location / {
        include proxy_params;
        #proxy_pass http://127.0.0.1:9200(这个是Elasticache的服务，提供可请求的API);
        proxy_pass http://127.0.0.1:5601(这个是kibana的web界面服务);
    }
}

我们打开kibana的NGINX配置之后，就可以访问 http://nideyuming来访问kibana服务了。

`kibana`界面的一些设置

登陆对应的地址后，会看到一个kibana的界面。

然后一步步的设置（具体的设置这里不想详细谈了，找其他的教程来看即可）

基本已经完成了主线的介绍，后面会在介绍一些非常主线的内容。

安装与配置（非主线）

关于SSL的一些东西

以下信息供选择性查看，关于logstash配置删除的内容的

将以下三行删除掉。这三行的意思是是否使用证书，本例是不使用证书的，如果你需要使用证书，将logstash.crt拷贝到客户端，然后在filebeat.yml里面添加路径即可

1
2
3

ssl => true
ssl_certificate => "/pki/tls/certs/logstash.crt"
ssl_key => "/pki/tls/private/logstash.key"

注意：sebp/elk docker是自建立了一个证书logstash.crt，默认使用*通配配符，如果你使用证书，filebeat.yml使用的服务器地址必须使用域名，不能使用IP地址，否则会报错

这里如果不去掉这三行配置的话，在后面启动filebeat时，会提示如下错误：

1
2
3

2018-09-12T10:01:29.770+0800	ERROR	logstash/async.go:252	Failed to publish events caused by: lumberjack protocol error
2018-09-12T10:01:29.775+0800	ERROR	logstash/async.go:252	Failed to publish events caused by: client is not connected
2018-09-12T10:01:30.775+0800	ERROR	pipeline/output.go:109	Failed to publish events: client is not connected

如何测试`docker`内的`logstash`是否正常工作

进入容器, 然后运行一下命令，然后可以查看对应的交互信息，或者直接看kibana的日志收集index-pattern有没有匹配的项目即可。

1 2	/opt/logstash/bin/logstash --path.data /tmp/logstash/data \ -e 'input { stdin { } } output { elasticsearch { hosts => ["localhost"] } }'

具体的`logstash`过滤`filter`机制如何进行

进入容器，修改如下的文件即可

如果想增加更多的配置文件，可以新建dockerfile自己制作镜像来使用，比如如下的内容

# Dockerfile
FROM sebp/elk
# overwrite existing file
ADD /path/to/your-30-output.conf /etc/logstash/conf.d/30-output.conf
# add new file
ADD /path/to/new-12-some-filter.conf /etc/logstash/conf.d/12-some-filter.conf

然后执行build等一系列操作生成我们新的镜像，然后就可以使用这个镜像，开启新的容器进行服务了。

整体框架介绍

满足的需求

环境说明

环境说明

安装与配置（主线）：

filebeat的安装与配置

安装

服务的启动等操作

配置

ELK的安装与配置

安装与配置

kibana界面的一些设置

安装与配置（非主线）

关于SSL的一些东西

如何测试docker内的logstash是否正常工作

具体的logstash过滤filter机制如何进行

参考文档

`filebeat`的安装与配置

`ELK`的安装与配置

`kibana`界面的一些设置

如何测试`docker`内的`logstash`是否正常工作

具体的`logstash`过滤`filter`机制如何进行