【案例】国家核电统一运维管理平台案例

时间:2024-04-04 14:49:25
【摘要】
国家核电技术公司(以下简称国家核电)是*管理的53家国有重要骨干企业之一,采用*集权式统一管理进行信息化管理,总部具有全网统一规划、统一建设、统一管理的决策权。通过OneCenter IT统一运维平台的全面部署,所有成员单位均可访问总部的统一运维平台,借助分权分域确保数据的有效隔离,实现运维团队内部管理的统一监控、统一流程、统一资产和统一登录,并且完成与国家核电总部统一认证、统一门户和短信平台的接口,实现统一展现的管理目标。


项目背景
随着信息化发展,国家核电已完成所属公司25家单位网络接入工作,集团广域网设备达到60套,局域网络节点约1500个。随着IT系统运行环境日趋复杂,业务对IT系统的依赖度提高,IT运维管理已经成为企业重要组成部分。国家核电运维管理部肩负着主干网建设、维护、运营的使命,致力于提供安全、高效、快捷的IT服务。


随着IT系统规模不断扩大,构成IT基础的设施呈现出规模庞大、结构复杂、品牌众多的特点,林林总总的网络设备、服务器、存储、虚拟化、中间件、数据库、应用系统等让运维管理人员难以从容应对,依靠手工方式已无法保障系统稳定性,为此需要一套IT集中监控系统,以便快速发现故障及定位,提高运维团队工作效率。


在流程规范方面,运维管理中心还处于初级的IT服务管理状态,在组织结构、管理规范、管理流程和技术支撑方面,还未构建综合的IT服务管理体系。网络、设备、系统、用户等的管理和服务处于分散、无关联状态,没有实现数据、信息和知识库的共享,也无法实现规范化和流程化。


综上所述,无论人员组织、流程规范还是技术工具方面,国家核电运维管理中心都提出了迫切的改进和建设需求,以建立一套适应业务和管理成熟度客观规律的科学化IT服务管理体系,有效支持业务的稳定运行与发展。 

建设目标

国家核电是*管理的53家国有重要骨干企业之一,需要从各个方面对全国各级单位进行统一管理。国家核电决定开展统一运维监控项目,实现总部及所有成员单位的统一运维流程管理、统一运维监控管理、统一IT资产管理;总部与各成员单位统一使用一套运维平台, 通过分权分域确保数据权限的有效隔离。


国家核电希望通过全国范围内统一部署网络运维平台,建立起一套综合性、整体性的大运维管理体系;同时要求运维平台能够较强的扩展性,具备方便、快捷整合第三方软件与平台的接口和能力,从而建立规范有序、运作顺畅、确实有效可行的运维机制,全面提升集团及二级单位信息化服务的支持与保障能力,实现从粗放运维到精细运维、从职能管理到流程管理、从被动服务至主动服务的转变。


平台设计思路
勤智运维为国家核电设计的IT运维管理平台包括:“IT运行集中监控、IT运维流程服务、统一运维门户”三个部分。底层基础平台主要实现对底层数据的采集、存储、分析等工作,为上层监控及流程系统提供基础数据;IT运行监控主要完成对基础设施故障、性能、配置等方面的全面监控管理,实现主动式的IT管理;IT运维流程服务主要根据IT服务管理的国际标准ISO20000,并结合ITIL最佳实践,梳理出事件管理、问题管理、变更管理等运维流程,实现对日常运维工作的流程化、规范化管理,提升IT服务的质量。统一门户主要实现对监控信息、运维流程信息的集中展示。


平台三个子系统关系如下:


(1) 以IT运行监控为“基础”


IT运行监控是对被管对象运行的状态以及其配置资产信息进行统一监控、管理、分析,对系统运行性能进行实时监控,并对各种状态信息进行汇总、分析以及预测。另外,还包括对IT系统的全部配置资产统一管理,对配置信息的异动进行检查及告警。


(2) 以IT服务管理为“导向”


IT服务管理主要依据ITIL架构进行建设,为IT系统的维护服务提供电子化的控制手段。系统通过事件管理、问题管理、变更管理、配置管理等功能,为IT维护人员提供以流程为基础的服务管理方式,以便快速消除IT系统故障、解决潜在问题,减少不规范的系统变更引发的系统故障率和故障隐患,实现对IT系统的主动式服务,提高服务水平。


(3) 以统一运维门户为“展现”


统一运维门户是整个系统的对外界面,通过统一的权限管理和统一风格的B/S展现,为系统的操作使用人员提供统一的系统接口,做到一点接入,通观全局,能够以灵活的展现方式,定义用户、角色、组织机构,并为每个不同角色提供不同的功能模块,为每个用户分配不同的展现内容,方便用户进行集团整体的运行维护管理。

解决方案

勤智运维以统一运维平台为依托,结合国家核电实际情况推出一体化智能运维管理平台解决方案。


统一资源监控:资源管理范围不仅包括传统的主机、网络、软件、应用资源等 IT 基础设施,还支持存储、虚拟化、链路设备等。通过资源可视化管理、运维自动化管理、知识管理等,实现智能的IT运维,使运维工作越来越轻松。


平台使资源运行可视、拓扑可视、网络状况可视;实现了分权分域,不同二级单位和不同权限的人只能查看和管理自己权限范围内的数据。


值得一提的是,系统发现重大问题时可以通过集团统一短信,通知相关运维人员,并可通过短信回复实现流程工单处理,提升了运维事件发现问题、处理问题、解决问题的效率。

【案例】国家核电统一运维管理平台案例
  
统一流程:国家核电集团总部初期一共梳理出七支流程,包括事件、问题、变更、发布以及停电申请、广域网线路申请、广域网停运申请、三支垂直化申请流程,现已经全面运行,产生了一万多个流程工单。国家核电总部增加了垂直化管理流程,二级单位可直接提交工单到集团,加强了集团化运维管控能力。


同时,机房巡检实现了人工巡检与智能巡检的结合;在人工巡检时,自动调取业务监控状态,并可以通过人工确认提交巡检单。


通过统一流程,规范了IT运维团队工作标准,对运维事件、问题、变更、发布、知识等流程实现统一管理,统一运维理念得到进一步落地。运维流程中,实现短信通知以及短信回复驱动流程工单,大大提高了运维效率。


通过与服务支撑系统的配合联动,最终实现PPTR(ITSS标准四要素:人员、流程、技术、资源)的统一管理,从而更好的支撑IT运营目标。


【案例】国家核电统一运维管理平台案例



统一资产配置管理:根据国家核电集团的资产统一编码规范,运维团队梳理出计算机设备、网络设备、安全设备、终端设备、存储设备、输入输出设备、机房辅助设备、计算机软件八大类别,共计58个子分类,目前已经有效地管理近万个资产。


通过固化IT资产编码规范,核电集团实现IT资产的统一录入、统计及全生命周期管理;可以按照成员单位展现和查看资产视图;在资产维保到期时收到提醒,包括短信提醒和系统提醒。


业务服务可视化管理:统一运维平台从业务角度出发,提供可视化的业务视图,可直观查看业务架构及业务系统所依赖的组件;业务系统性能、故障信息在业务视图上统一展示;从业务角度提供性能、容量趋势分析,可提前预知业务性能和容量瓶颈,进行容量调整,从而避免业务故障发生;当业务发生故障时,可通过业务视图快速定位故障根源;统一的业务视图,让业务部门和IT部门能够拥有统一的管理视角,从而保障业务稳定。


综合报表管理:系统自动获取支撑业务系统的所有IT资源的运行数据,为用户提供性能报表、告警统计、TOPN报表、可用性报表、趋势报表、分析报表和综合报表7种报表,作为IT设备性能分析、IT投资分析、资源调配等决策动作的数据依据。

【案例】国家核电统一运维管理平台案例


【案例】国家核电统一运维管理平台案例




领导视图:提供面向国核总部和各下属单位的整体管理视图。领导视图集中展现总部和各二级单位统一的广域网流量分析、设备故障分类、业务可用率、工单解决率统计等信息,便于各级领导及时了解全网的整体状态。


统一展现:通过部署统一展现子系统,为总部及二级单位领导实时提供全网范围内的网络可用性、业务可用性、运维支持能力和运维分析报告。同时,统一展现将监控子系统、流程和资产子系统在一个页面中集中展示,提高系统易用性和操作便捷性;无需访问各个子系统,国家核电就能通过统一展现了解监控告警、流程和资产的所有信息。

【案例】国家核电统一运维管理平台案例




统一运维门户:通过与集团总部统一门户有效整合,OneCenter帮助用户实现快速认证登陆、用户信息实时同步,省去了多系统之间单独登录的繁杂操作。通过将用户的代办工单等信息实时同步到统一门户,实现国家核电内部办公信息在门户网站的统一呈现;用户在门户网站即可实现相关工单的处理和查看,极大的方便了用户的操作。


建设意义: 经国家核电及各成员单位的共同努力, IT统一运维平台目前运行效果良好,完成了既定的工作目标。


目标达成:
1、完成与国家核电总部统一门户的集成,并实现单点登录和统一待办。
2、完成与统一认证平台用户同步的接口,实现与统一认证平台的集成。
3、完成与统一短信平台的对接,实现告警短信发送、工单短信通知、短信回执推动工单流程等流转,实现移动办公。
4、完成统一监控部署,确保所有成员单位指定监控设备的添加和监控、告警阈值调整、分权分域的管理模式。统一监控实现了对各单位网络、主机、服务器、数据库、业务系统的实时监控/报表统计/预警告警等功能。
5、完成统一流程部署,确保所有成员单位均通过统一的事件、问题、变更流程,实现运维工作的可追溯和绩效考核等,并实现成员单位向总部发起的垂直化管理流程,强化了集团信息化统一管理。
6、完成统一资产部署,让所有单位的资产都具有符合国家核电统一资产编码,并实现资产信息化的统一管理。实现集团IT资产的统一录入、统计及IT资产全生命周期管理。
7、总部及各单位信息化领导可通过领导展现视图,直观了解整个集团及本单位的网络可用率、业务可用率、运维支持能力。 


通过OneCenter IT统一运维平台的全面部署,IT运行集中监控、IT运维流程服务、统一运维门户三者实现有效整合,不仅实现了国家核电统一管理的管理目标,充分保证了国家核电IT系统的可用性及可靠性,还可随国家核电业务系统的发展而扩展,为国家核电业务发展提供有力的IT支撑和保障。