【案例】湘潭大学一体化运维管理平台

时间:2024-03-27 07:52:26
湘潭大学信息化体系中涉及的人员复杂,除了高校本单位维护的老师外,还有外包团队人员。湘潭大学已经意识到需要对IT资产(硬件、应用、人员)实施有效管理,保证网络安全、可靠和畅通。


高校行业特性
(一)网络情况复杂,数量种类繁多,维护量大
网络涉及范围广、设备种类多、用户数量大是高校网络的三个基本特点。学校的网络设备数量繁多成百上千台,但基本采用人工分散的管理方式,发现一个问题解决一个问题,远不能适应当前状态下实际网络应用与IT运维的需要。




(二)跨地域或大范围时,维护人员责权不清
目前,很多高校在不同的地方都建立多个分校区,不同校区的校园网又有不同运维人员。伴随网络环境复杂、规模庞大、设备分散、维护困难等而来的问题,是出现网络故障后无法明确故障发生在哪一个管理域内。




(三)IP地址使用较为混乱,管理难度大
众多学校的IP地址使用与管理相对比较混乱,网管人员无法明晰IP地址的使用、IP同MAC地址的绑定情况以及网络中IP地址的分配情况。学校内部人员随意更改IP地址,常造成IP地址使用冲突、关键设备发生异常。




(四)日益增长的IT信息化资产与IT管理老师人力不足的矛盾突出
高校各种软硬件日益剧增,技术上越来越复杂,而运维人数和技术水平却不能随之成倍增加。面对各种类型的故障,很难快速定位故障根源并及时处理故障。


“十一五”和“十二五”期间,湘潭大学的基础设施得到了根本的改变。校园网通过部署四台高性能的核心设备,形成由交换层、区域汇聚交换层、终端用户接入层组成的“大”二层网络拓扑结构,设备之间通过40G光纤链路互联,组成一个“环形”主干网络,保障数据交换时的链路带宽。


截止2016年12月,湘潭大学全校教学、科研和管理用户以及师生个人校园网用户6万,网络节点有4万多个。


实施方案及部署成果
经过多次选型和测试,湘潭大学最终引入OneCenter一体化智能运维管理系统。


(一)直观的网络拓扑,实时动态展现网络整体运行情况
OneCenter一体化智能运维管理系统,可自动发现局域网的真实设备和连接,生成局域网物理拓扑图,同时识别二级和三级拓扑,可直观清晰地显示全网所有骨干网络设备、子网和互联关系。


不仅真实准确的反映实际物理连接、逻辑链接,而且还以图形化形式来展现系统中各种网络设备及资源(包括路由器、交换机、 3层交换机、防火墙、服务器、 链路、服务器资源)的实际运行、使用与分布情况,帮助湘潭大学掌握网络的实时动态。

【案例】湘潭大学一体化运维管理平台

一级拓扑图



【案例】湘潭大学一体化运维管理平台
子拓扑图


(二)高效的自动化运维,确保第一时间恢复故障
OneCenter一体化智能管理系统对湘潭大学网络情况全盘监控,发现异常时以手机短信息等各种告警方式第一时间通知运维人员,满足网络管理 24 H 正常工作的要求。当被监控设备发出告警信息需要处理时,OneCente根据故障清单自动生成事件工单派发给相应的工程师,还可以根据工单统计功能对比设备的工作效率,以便运维工程师更好的对监控设备进行管理,全面提高湘潭大学运维工作效率。


【案例】湘潭大学一体化运维管理平台

集成短信平台进行告警



【案例】湘潭大学一体化运维管理平台
自动生成工单


(三)智能化专家系统助力,轻松面对复杂的网络环境与故障
OneCenter智能化故障管理功能建立了及时响应的资源预警、告警机制。系统通过告警Flapping等多种高端技术手段,能够避免大量的无谓重复告警信息,防止告警泛滥。


另外,系统还提供了强大的知识库功能,方便将资深运维人员的经验添加到系统中。比如处理一些复杂问题的思路、心得和方法等,以便其他运维人员参考查阅。


系统不仅可以录入知识,而且对于录入的知识,与相关联的设备异常做了关联。当运维人员收到一个设备异常信息,不但能知道出现问题的具体细节,并且可以即时关联到该问题的处理方案,使运维管理人员在处理故障时有据可依, 更加得心应手。


【案例】湘潭大学一体化运维管理平台

关联知识库




【案例】湘潭大学一体化运维管理平台

根源分析和影响分析

【案例】湘潭大学一体化运维管理平台
知识库


(四)角色权限管理,明确运维人员责权
OneCenter一体化智能运维管理系统提供了运维工程师、运维经理、服务台人员、系统管理员及运维组长等共计20多种运维的默认角色。通过不同的角色,湘潭大学可以覆盖整个湘潭大学技术团队及外包团队,从而完成基本服务支持的请求(问题)处理。湘潭大学也可以自行配置所需要的角色,并分配给每个角色相应模块的操作权限,让每个角色的人员能各司其职,提升服务支持效率,也避免了跨权限操作导致运维事件处理时产生的问题。


【案例】湘潭大学一体化运维管理平台

角色管理




(五)方便快捷的工单配置,记录查询两不误
OneCenter基于B/S架构的可视化表单管理界面,可根据不同的服务产品及服务内容,自定义每个服务内容所需表单。可根据业务的需求,利用可视化的表单编辑界面,对事件、问题、服务请求、变更、发布、备件等表单进行属性字段的自定义添加和表单版本样式的调整,支持多种类型的属性字段添加,包括:数值型、字符性、下拉框、弹出选择框、单选框、多选框、日期时间、文件等,满足实际IT运维管理过程中的需求。



【案例】湘潭大学一体化运维管理平台
表单自定义


(六)完善外包团队的管理,让服务标准化
OneCenter一体化智能运维管理系统作为湘潭大学运维的管理平台,遵循ISO20000/ITSS等国内外先进的运维服务管理标准,以流程驱动的方式,实现服务台,事件、问题、变更、配置、日常巡检、任务、知识库、公告管理,运维月报数据支撑以及移动运维APP(和后勤系统对接)等功能,规范了整个网络运维的运维过程。


同时,OneCenter一体化智能运维管理系统对湘潭大学运维团队的日常工作执行、调度和绩效进行综合管理、支撑和分析,通过整体运维体系建立,满足湘潭大学信息化运维团队IT服务的规划、部署、运营和提升改进的服务全生命周期管理,实现湘潭大学IT环境中运维的规范化、运维作业的标准化、业务过程的流程化、资源管理的集成化、决策管理的科学化。


【案例】湘潭大学一体化运维管理平台

流程自定义


在梳理运维服务的过程中,OneCenter一体化智能运维管理系统的服务流程工单与湘潭大学的内部后勤系统和信息门户进行了集成对接。OneCenter一体化智能管理系统除了能自动在网管系统中接受告警,配发工单外,学生和老师在后勤系统和信息门户上可以新建工单;工单完成后,还可以进入登录的回访进行工单评价。为监督服务质量,湘潭大学新增了投诉管理员岗位进行整理和回访。


【案例】湘潭大学一体化运维管理平台

信息门户对接


【案例】湘潭大学一体化运维管理平台

后勤系统对接


客户收益
通过部署OneCenter一体化智能运维管理系统,湘潭大学实现对网络、业务应用系统、虚拟化等800个网元无缝监管,通过7*24小时短信实时告警,解决被动救火的局面。


通过分级拓扑、报表等多种图形化方式直观、全面展现被管资源的实时运行信息,帮助管理老师和外包运维团队全面了解所辖范围内IT资源的运行情况。


通过ITSM系统,改变了手工运维的局面,实现从以任务为中心到以流程为中心的改变,一方面可以跟踪外包团队对用户问题处理的过程和结果,规范流程;另一方面可以明确分工,实现信息、知识的共享,提高工作效率。


运维数据的统计和分析,也便于对外包维护团队人员工作量进行统计和绩效考核。集成后勤管理系统和信息门户,不仅丰富了报障入口,还在不改变师生使用习惯的情况下,方便师生申报IT故障。


提供移动APP功能,维护人员在校内能实现真正的移动运维,减轻工作的难度和强度,提高了故障的解决率和师生的满意度。


用户评价
“湘潭大学之前IT 运维分工一直不是很明确,经常是一个人要负责管理和维护各种 IT 设备,但是湘潭大学的 IT 环境种类多、业务杂,光凭技术人员的经验和自觉,很难即刻解决一些繁琐的网络故障,也很难找到问题根源。不仅如此,服务外包之后也很难对具体技术人员的工作进行考评和指导。而OneCenter一体化智能运维管理系统,能从复杂多样的各种 IT 软、硬件中,根据知识库专家系统的模型,对故障信息进行分析,给管理老师一些参考,大大的减少了处理故障的时间,同时摒弃了传统以职能为中心的IT管理方式,改以流程为中心,从复杂的IT运维中梳理出核心的流程,明确定义各个流程的目标和范围、运维步骤、运维人员角色定义与责权分配,从而实现以用户为中心,提供高质量、低成本的IT服务的最终目标。 ”


案例亮点
(一)支持复杂环境的大规模部署
学校网络环境较为复杂,数量大,对产品架构稳定性和取值告警的实时性要求很高,系统采用先进且成熟的MVC模式,具备三层架构体系,采集层、处理层和展现层完全分离。学校可以根据采集规模的大小,平行扩展多套DHS数据处理器,以便提高产品处理速度,同时还内置一套可扩展的资源能力库模型,可快速将学校新增设备厂家及其型号纳入监管。为了提高学校Portal门户界面访问速度,产品在DHS与Portal之间设计了一套Cache缓存服务器,用于高访问数据的快速提取,从而减轻数据库访问压力。


(二)面对庞大的终端环境,轻轻松松定位IP
湘潭大学基本是人手一台信息终端,终端用户庞大,在终端IP地址排障过程中,IP定位的工作量很大。OneCenter一体化智能运维管理平台提供基于拓扑发现链路算法,能实时展示网络中现有IP的分布情况和上联交换机接口情况,轻轻松松定位IP地址,同时还可以实现IP、MAC、Port 三者之间的绑定关系查看、告警功能。此外,可以使用IP-MAC-Port 实时表与基本表对比,查看网络中终端设备与上联端口的变更情况、新终端设备加入网络的记录。


(三)集成多个报障入口,保持师生的操作和使用习惯
为了能更好的落地,提高师生的满意度,保持师生的操作和使用习惯,OneCenter一体化智能管理系统的服务流程工单与湘潭大学的内部后勤系统和信息门户进行了集成对接。师生在现用的系统中可以直接申报故障。OneCenter一体化智能运维管理系统除了能自动在网管系统中接受告警、配发工单外,学生和老师在后勤系统和信息门户上可以新建工单,工单完成后还可以进行工单评价。


(四)对外包团队进行绩效考核和工作量考核
通过ITSM系统,学校现有外包团队工作从线下转移到线上。通过制定SLA,规范流程,跟踪并统计外包团队对用户问题处理的过程和结果;明确分工,实现信息、知识的共享,提高工作效率。同时,学校信息化领导可以通过报表查看所有的工作量、好评率和投诉,进一步提升运维管理能力。