作者简介
涂家英,SUSE 资深架构师,专注 Cloud-Native 相关产品和解决方案设计,在企业级云原生平台建设领域拥有丰富的经验。
NeuVector 是 SUSE 开源的端到端的全生命周期容器安全管理平台
,目前 NeuVector 默认只在平台内对安全事件进行提示,并没有直观的对外输出口。站在告警角度来说缺少主动性,本文将介绍如何通过 Rancher 的监控功能实现 NeuVector 安全事件的监控和告警。
监控及展示
整体流程是通过 exporter 采集指标数据,然后通过 ServiceMonitor 实现数据的关联,最后通过 Grafana 和 AlertManager 实现数据的展示和告警:
Rancher 平台中开启监控并安装 NeuVector 服务,Rancher 从 2.6.5 版本开始将 NeuVector 集成在平台中,用户可以在集群工具中直接部署使用:
NeuVector 原生提供了相应的 exporter 服务来采集相应的指标,镜像为:neuvector/prometheus-exporter
,端口为:8068
,我们可以直接通过 Rancher 的 UI 部署到集群system
项目下的cattle-neuvector-system
命名空间中:
部署完成后,我们需要在自动生成的 service 中添加一个 Label,便于 ServiceMonitor 进行关联:
在监控中配置相关的 ServiceMonitor:
具体 Yaml 内容如下:
配置完成后,可以通过 Rancher 进入 prometheus 的页面中查看 target 是否生成:
确定 exporter 数据采集和传输正常后,可以在 prometheus 的页面查看到 NeuVector 的相关数据:
下载 Grafana Dashboard 文件,地址为:https://gitee.com/leotuss/neuvector/blob/master/monitor/NV-dashboard.json
将 Dooashboard json 文件内容添加到 Grafana 中:
Rancher 提供的监控中 Grafana 默认账号密码为:
admin/prom-operator
添加完成后即可查看相关的集群安全信息:
告警
通常来说,我们需要的告警信息为集群中的安全事件,所以可以基于nv_log_events
这个指标实现,在 Rancher 的监控中创建一个Prometheus Rule
:
主要关注的配置:
- PromQL:配置为
nv_log_event
即可,这样当产生安全事件后,就会触发告警 - 键/值:需要定义,方便 AlertmanagerConfig 进行关联
- 消息:定义告警消息,可以按照需求定义,如图中
toname
代表触发安全事件的 pod 名称、name
代表安全事件的名称
配置完 PrometheusRule 后,我们可以配置 AlertmanagerConfig,实现对外告警,在 Rancher 中 AlertmanagerConfig 由两部分组成:
- 接收器(Receivers):接受告警信息的平台
- 路由(Route):连接 Receivers 和告警规则的配置
接收器按照实际情况配置即可,路由配置需要选择Receiver
、配置匹配告警规则的 Label 以及相应的告警时间配置:
配置完成后,当集群出现安全事件后,会在 Rancher 的监控服务页面中展示触发的告警信息,并发送信息到后端配置的接收服务中
本示例中没有配置相应的 Receivers,大家可以按照自己的实际环境进行配置,Rancher 提供的告警支持多种接收器,如 Slack、Email、PagerDuty、Opsgenie、Webhook、Teams、SMS、自定义。
总结
NeuVector 作为一款企业级端到端的云原生容器防护平台,提供了基于零信任的、全面的安全防护能力,如:CICD 嵌入式扫描、准入控制、运行时网络安全防护、运行时进程防护、运行时敏感文件防护等。在开放性上 NeuVector 也实现了良好的兼容性,如本文中提到的使用 Prometheus 实现安全事件的监控和告警,还有对接 Syslog、Webhook 或 Splunk 实现平台日志接收,对接 LDAP、AD、SAML 或 OpenID 实现单点登录等。