背景:
A公司里有很多服务器(>3000台),每台服务器都有不同的用途,如DB Server、WEB Server、ESXI等,每个组使用其中的一批,每个组可能有多个服务器管理员。现在问题出来了,如何集中的去管理这些服务器,如何对服务器进行资源的合理分配,如何第一时间获取每个服务器的运行状态,如何了解每台服务器运行的服务情况,如何根据资源的使用情况去扩展异或重新采购服务器……。很多问题随着服务器的增多,使用用途的多样性应运而生。因此,现在我所描述的这个平台就是为了解决上面的问题而来的。
目前现状:
也许很多ops会说,现在不是有众多成熟的监控工具吗?随便用一个好了。那么请问,现在监控工具满足你们的业务现状吗?可以针对你们公司的内部结构制定有效的权限控制吗?所以说我们不能完全依赖于现有的工具,我们必须要创造自己的东西。
平台介绍:
功能,上面所说的统统都能解决。实现原理,之前已经发表过文章了,当然是基于nagios。瓶颈,那就也是nagios的瓶颈问题了,性能上暂时还没突出,易用性,还可以,不太麻烦,技术,无法突破cgi及nagios的底层。虽然只是包了一层皮而已,但是如果你觉得把c/php/java搞在一起很容易吗?那么我也服你。每个工具或平台都有被人吐槽的地方,这也正常。
功能:
1.监控服务器软硬件信息,cpu、内存、磁盘、网络运行状态,WEB服务的运行情况,服务端口的畅通也是可以监控的,并且不需要安装客户端;
2.对监控的异常结果可以邮件报警,做到 第一时间告知你哪台服务器或服务(端口异常,硬件异常)有问题;
3.可以对服务器部署的应用进行自动或手动的启停,自动的意思是定时监控服务的状态,发现停止立马启动起来,保证服务准确高效运行;
4.可以清理日志,自动或手动都可,及时释放服务器的磁盘空间很有用的;
5.管理服务器及服务的归属关系,方便查询和负责人的管理;
6.分组控制,每个组都可以管理自己的服务器及服务信息;
7.分权限管理,分了游客、管理员、系统管理员三个角色、
8.其它你能想到或想不到的。
展示图:
请尊重作者的成果,转载时注明出处。
意见及建议:rubydrew@qq.com