为什么对基础设施的监控变得如此重要?

时间:2022-09-13 20:06:59

稍微懂点云计算的人都知道三个概念:IaaS「Infrastructure as a Service」、PaaS「Platform-as-a-Service」和SaaS「Software-as-a-service」,其中 IaaS 就是我们常说的基础设施服务。

为什么对基础设施的监控变得如此重要?

简单而言,IaaS 提供了云计算基础架构,包括服务器、存储、网络和操作系统。它作为一种按需服务,使得客户无需购买服务器、软件、数据库空间或网络设备,而只要按需购买这些资源的外包服务就可以了。但是购买了这些资源,并不意味着一劳永逸,这些资源能不能稳定、高效的工作?这其实是一个新的挑战!

为什么需要监控基础设施?

众所周知,几乎所有的应用程序通常都是运行在一个大型动态的环境上,它们依赖于成百上千台主机。当然,这样的方式非常有利于扩展,能够保证良好的用户体验。但是,对运维和业务人员来说,这简直就是「噩梦」,那些传统的监控方式已经跟不上云时代的要求了。

首先,人类已经很难从大规模海量的数据中识别出那些有问题的节点;其次,服务器本身也在不断的变化——根据企业的需求进行动态的拓展或者缩减,单个主机经常会出现响应问题;所以,区分出哪些服务器是否处于一个正常的状态并不是一件很简单的事情。那么,我们就需要一个现代化的监控平台:

第一,必须能够毫不费力地跟踪我们所有的服务器,并且能够在数据量激情的情况下保持稳定;

第二,必须能够分辨出那些可执行程序,尽可能少出现误报问题,还要避免「兴师动众」,反而忽略更重要的问题;

第三,必须能够收集足够多的信息,使我们能够快速诊断出问题发生的根本原因,当然,这也意味着我们的监控平台应该与关键技术相互配合;

第四,应该还能收集详尽的数据以供我们进行分析,并能保留长期的数据用于对未来趋势的预测;

第五,必须能够让我们监控到所有的主机状态,同时也能监测到特定属性的主机。

最后一点,这个作为我们「操作神经中枢」的监控平台,必须能够帮助我们的团队高效地发现潜在问题的信息,如果有一个可视化的仪表板那就更好了,这样就可以有助于我们进行快速、明确的团队沟通。

现有的免费解决方案都有哪些?

当然,现在有很多服务器端的监控软件,而且针对服务器的性能监控也是一个比较新的网络管理方向。现在市面上有不少免费的工具,包括不少开源的产品如 Nagios ,Zabbix 等等,当然,还有一些比较有技术底蕴的公司,像国内 APM 行业的领军企业 OneAPM 也推出了免费的服务器监控产品 OneAPM Servers。

Zabbix

Zabbix 是一个基于 WEB 界面的提供分布式系统监视以及网络监视功能的企业级的开源解决方案。能监视各种网络参数,保证服务器系统的安全运营;并提供灵活的通知机制以让系统管理员快速定位,解决存在的各种问题。

Zabbix 由两部分构成,Zabbix server 与可选组件 Zabbix agent,Zabbix server 可以通过 SNMP,Zabbix agent,ping,端口监视等方法提供对远程服务器/网络状态的监视,数据收集等功能,它可以运行在 Linux、Solaris、HP-UX、AIX,Free BSD、Open BSD以及OS X 等平台上。

Zabbix 主要功能包括: CPU 负荷,内存使用,磁盘使用,网络状况,端口监视,日志监视等等。

Nagios

Nagios 是一款开源的免费网络监视工具,能有效监控 Windows、Linux 和 Unix 的主机状态,交换机路由器等网络设置,打印机等。在系统或服务状态异常时发出邮件或短信报警第一时间通知网站运维人员,在状态恢复后发出正常的邮件或短信通知。

Nagios 可以监控的功能包括:监控网络服务;监控主机资源;简单地插件设计使得用户可以方便地扩展自己服务的检测方法;并行服务检查机制;具备定义网络分层结构的能力;报警「通过 EMail、短信、用户定义方式」;定义一些处理程序,使之能够在服务或者主机发生故障时起到预防作用;自动的日志滚动功能;支持并实现对主机的冗余监控;可选的 WEB 界面用于查看当前的网络状态、通知和故障历史、日志文件等。

OneAPM Servers:完全免费的专业级服务器监控产品

OneAPM Servers 是一款商业级的服务器监控产品。对比开源产品来讲,在部署安装和学习成本上都占据压倒性的优势。更重要的是,该产品是面向所有用户的性能监控,承诺永久免费,所以刚推出不久就受到很多的关注。

简易部署

如果,你想要使用服务器监控,只需要完成以下四个步骤:

  • 注册登录 OneAPM 账户;
  • 点击菜单栏的「服务器监控」;
  • 点击页面左上角的「添加」按钮;
  • 进入安装页面后,按照安装步骤执行即可。
    为什么对基础设施的监控变得如此重要?

特色功能

OneAPM Servers 通过观察、分析关键的系统参数,包括 CPU 利用率、物理内存、网络活动、进程、磁盘利用率及容量,展现当前服务器的健康状况。OneAPM Servers 目前包含四大功能:

  • 总览:显示服务器的大体健康情况;
  • 磁盘:展示每一个磁盘的负载及空闲空间;
  • 网络:查看一段时间内宽带「 Kb/s 」,每秒钟传输的包的数量,每秒钟错误率相关细节信息;
  • 进程:展示被监测的服务器上各个系统和用户进程的运行情况。

现在,OneAPM 刚刚推出不久的 OneAPM Servers 产品能够对企业 IDC 和云计算中心内的基础组件进行实时的可视化管理。该套件为用户提供基础组件的集中监控、展现、预警、分析、管控的整体解决方案。通过单一探针,实现对网络设备、主机、操作系统、中间件、数据库、存储等126 种产品的 5 万多项性能指标的集中监控和管理。