1 第十四章 精准运维服务
近年来国内IT产业的发展格局始终与我国的经济转型与创新创业的社会大潮息息相关,纵观国内国际形势,IT产业仍是创新的领头者,是解决人类各种经济危机的主要扮演者,是新经济的重要支柱。IT服务行业作为IT产业的一个关键领域经历了为设备服务、为系统服务和为人服务三个重要的发展阶段。精准运维是在以人为本的基础上,为满足服务对象的业务变化而产生的IT服务新模式,其深刻体现IT服务价值始终以业务需求为导向的理念,是精益管理在IT行业的有效应用。
14.1 精准运维的由来
人类从农耕火种到探索太空,科技文明随着斗转星移得到了长足的进展,从十八世纪工业革命到二十一世纪的信息技术蓬勃兴起,我们发明了很多有效的管理手段来提升生产和服务的效率。
精准运维是依托于精益管理的科学理念,将IT服务的效能在既定的资源配置下做到最大化的一种科学方法。精益管理源于精益生产。精益生产(Lean Production)是美国麻省理工学院教授詹姆斯.P.沃麦克等专家提出的,他们认为日本丰田汽车公司的生产方式体现了精益管理的精神,精益管理是最适用于现代制造企业的一种生产组织管理方式。精益管理目前已经逐步延伸到企业的各项管理业务中。它能够通过提高顾客满意度、降低成本、提高质量、加快流程速度和改善资本投入,使股东价值实现最大化。精准运维强调提供的IT运维服务不仅是满足客户的信息系统的服务更是满足客户自身业务需要的服务,强调IT服务价值的体现应符合IT服务生命周期。精准运维应从业务的视角考虑资源、安全和效率对企业的价值贡献。
14.2 精准运维的定义
精准运维是一种IT运维服务方法,它是通过一系列方法掌握服务对象的信息系统的特性以及该信息系统所服务的企业业务特性,找准目标,把握企业运行的脉搏,从而精准的规划服务,同步应变,实现服务与业务的匹配。它可以是一种咨询,也可以是集咨询与实施的集成的服务。
精准运维有别于传统IT运维,它的重点不但着眼于所服务的IT系统本身,更着眼于该系统所服务的企业自身的主营业务。企业自身的各种业务是企业的生命线,企业事业单位的信息系统从根本上说是为企业自身业务活动而服务的。精准运维不仅是为信息系统服务的,更是通过理解企业业务本身来更好地实施IT运维服务。它通过对企业业务活动规律的信息采集以及系统软硬件特点的采集、建模以及加上科学的分析、客观的评估、先进的预测、动态的调优等手段,保障了实施的IT服务与业务的同步心跳,不但保障了信息系统高效稳定运行,而且使信息系统达到与业务精准匹配的状态,提升企业的运行效率。
14.3 精准运维的方法
(1)精准运维能解决什么问题
传统IT运维工作常常遇到一些困惑。一是业务的高峰期说来就来,高峰期时现有的IT设施应对吃力,产生出大量平时没有出现的现象和问题,严重影响企业业务的开展,不少用户觉得这些IT系统该用时不给力,IT服务人员面临的各种压力很大,怎么办。二是不同的业务系统在要求信息系统资源时,都要求的很多,如果都按这种设计的话,企业投入又十分庞大,不按这种要求设计吧,出现资源不够情况,全是自己责任,因此,在进行信息系统架构设计和选型和日常优化资源分配时该怎么办。三是在采纳IT技术过程中如何将信息安全尤其是主营业务数据的安全策略应用在IT运维服务中,比如云计算和大数据技术在安全策略如何有效的纳入到日常的IT运维管理中?四是随着信息系统硬件设备逐年折旧和软件系统的升级改造,如何减少支撑主营业务的信息系统产生中断的频次和缩短因中断而需要恢复的时长,并且投入较低的运维成本?
而精准运维就是帮助企业解决这些困惑的,精准运维的核心理念有三点,第一确保IT资源的价值在业务活动中得到充分的发挥;第二确保信息资源的安全系数与企业的安全等级要求相匹配;第三确保IT系统的运行满足主营业务的运营效率要求。精准运维的这三个核心理念将能够因地制宜的解决企业事业单位遇到的这些深层次运维问题。
(2)精准运维的原理
精准运维的原理是利用一套精准运维成熟度分析模型,通过对企业的IT信息系统和业务进行调研、分析,找出IT运维服务的最佳方案并实施。
精准运维成熟度分析模型是假设某IT系统服务的企业业务是Y,影响Y在不同时期的最佳效果的四个关键因素是人员为X1,环境为X2,软件为X3,硬件为X4。在此我们可借用函数式来理解,即Y(t)=f(X1、X2、X3、X4)。模型是通过Y的需求和系统的特性以及IT最佳实践经验倒推出X1、X2、X3、X4应具备的相应要求范围,同时通过调研分析企业实际的这四个因素情况,并进行比较分析与前述要求范围分析出差距,从而找到重点要服务的事项与方法。
另外还必须考虑到企业是在不断发展的,因此,这些服务企业业务的IT信息系统也要适应它的发展而不断变化,所以,还要用发展的眼光来看待运维服务工作,精准运维必须考虑到随时间的推移业务的发展、设备的老化、软件的更新、人员以及环境的变动等因素,在企业可见的发展道路上预测四大因素的要求,从而及早应对。当然精准运维还用到了统计学的数据分析方法包括数据描述性分析、线性回归分析、方差分析、相关性分析等。
-
业务相关性分析法
业务相关性分析法主要是将信息系统安全、稳定、可靠运行的关键影响因素:人员、环境、硬件、软件等与现行业务进行相关性分析,从而找出管理中的优势与不足,让优势得以巩固形成长效机制,让短板得以改善补足竞争中的差距。
-
关键节点因果分析法
关键节点因果分析法是一种发现问题“根本原因”的方法,从分析业务流程与运维流程各节点之间的关系入手,梳理哪些运维流程节点是影响业务正常运行的重要因素?首先对常见故障中的问题点进行分类(如人员、环境、软件、硬件、网络、接口因素等),其次对找出的各要素进行归类、整理,明确其从属关系,分析选取重要因素,明确这些重要因素是否有前置影响因素。在通过重要因素帕累托分析法判断哪些运维流程节点投入什么资源可以有效保障主营业务的顺畅执行,从而确保业务得以顺利开展。
-
重要因素帕累托分析法
我们将运用二八原则,使用帕累托分析法在众多的关键运维流程节点中进行数据分析,判断哪些关键节点属于重要因素影响80%的业务达到安全、可靠、稳定运行,从而为制定优先的运维服务应急预案提供科学的分析依据。
-
设备贬值分析法
设备贬值指设备由于运行中的磨损和暴露在自然环境中的侵蚀,造成设备实体形态的损耗,引起的贬值。设备贬值分析法可以帮助我们合理的估算设备的损耗带来的潜在故障风险,从而帮助企事业单位进行有计划、有步骤地进行设备更新评估和采购预算。设备贬值分析法通常有两种方式,一种是年限法,即从设备的使用寿命角度来估算贬值,它假设机器设备有一定的使用寿命,所评估的机器设备的贬值率是与其已使用年限成正比的,并且是线性关系。贬值率=已使用年限/(已使用年限+尚可使用年限);另一种是修复费用法,这种方法的使用前提是设备的实体性损耗是可补偿性的,那么用于修复实体性损耗的费用就是设备的实体性贬值。比如,一台服务器的主板损坏,如要修复该主板,必需更换主板,更换主板的费用即为服务器本次的实体性贬值。
-
业务指标与IT指标对标法
分析企业业务指标与IT系统的有关指标的关联,找出一些规律,通过提升IT系统的指标促进企业业务指标的进步。
(3)精准运维提供服务内容
精准运维不同于一般的运维,是属于专家运维,是围绕提升资源使用率、提高系统安全性和改善业务运行效率三个核心理念将为用户提供集咨询、诊断、实施的一条龙服务。
-
解决一个或多个信息系统的资源与企业业务协调一致的问题。
-
解决一个或多个信息系统的对各种人员角色技能要求的问题。
-
根据企业的业务实际,提出设备的更新与扩充的建议。
-
根据企业的业务运行实际,提出更新系统软件和应用软件的建议以及新项目需求。
-
根据企业的业务运行实际,提出对信息系统环境及布局的建议。
................................................