王翀++赵俊峰++方泉
摘 要:随着国网江苏省电力公司工业化、信息化融合进程的不断深入,信息系统运维精益化管理在公司生产、经营和管理中的地位愈加重要。该文在充分调研公司现有信息系统运行现状的前提下,提出了改进业务影响分析法(BIA)模型,并在此基础上研究了一种新的信息系统运维服务分级管理方法。在江苏公司的实施实践表明,该文提出的模型和方法能有效优化信息系统运行成本控制,提高资源利用效率,提升运维服务管理水平。
关键词:信息系统 BIA 运维管理 运维体系 分级服务
中图分类号:F426 文献标识码:A 文章编号:1674-098X(2016)09(a)-0097-04
随着国网江苏省电力公司(以下简称“江苏公司”)信息化战略逐步推进,信息系统已实现业务全覆盖,信息与业务的融合速度大幅提高,信息化支撑作用日显突出,信息系统安全稳定运行已成为保障江苏公司主营业务正常开展的基础。当前云计算、物联网、大数据等新兴IT技术在江苏公司的应用逐步深入,江苏公司对信息服务敏捷和平稳提出了更高的要求。为进一步提升江苏公司信息系统运行管理水平,更好地保障信息系统安全、稳定、高效运行,江苏公司开展了信息系统运维分级服务课题研究工作。
1 现状分析
国内业界通常采用对信息系统进行运维分级服务管理的方法,在保障信息系统可靠性和可用性前提下,实现服务资源利用最大化。通过分级管理方式优化信息系统运维资源分配,是已知最有效的运维服务资源管理方案。20世纪90年代末,信息系统运维服务分级管理方案作为ITIL的一部分,被有关公司引入中国并不断演进推广。目前交通银行、中国移动等国内著名的大型央企,都采用了类似的方案进行信息系统运维服务管理。
目前江苏公司所有信息系统均按照运维服务的最高标准提供运维服务,无论是对运维服务需求高的营销、生产类核心业务系统,还是服务需求相对较低的电网非控制业务系统及管理信息系统,均实行统一的运行维护标准,因此,保障信息系统的运维资源投入越来越多,资源利用率相对较低。部分信息系统承载的公司核心业务运维资源分配不足,而部分非核心系统运维资源存在分配浪费。如何统筹管理各种运维服务资源,支持多样化的信息系统,优先保障信息系统特殊时期和高峰时期的运维需求,成为迫切需要解决的管理难题。
2 改进信息系统分级模型
2.1 模型目标及原则
业务影响分析(BIA)法(Business Impact Analysis),简称BIA,是一种分析业务中断对机构造成影响的方法,目前在金融、通信和能源等行业被广泛用于信息系统分级运维服务管理。该文依据业务影响分析法的方法论,结合江苏公司信息系統的实际特点,建立了一套改进的信息系统分级模型,构建了分级运维服务方法,实现了运维分级服务管理,更好地保障了信息系统的稳定运行,提高了用户满意度和运维服务价值。
该文提出的信息系统定级模型,根据江苏公司的发展战略、信息化发展规划、法规遵从等多个角度,从信息系统所承载业务的用户规模、内部影响、外部影响、可替代性、与其他系统的关联程度和主管部门监管要求等指标,评估因为系统故障造成的业务影响度,最终确定信息系统的级别,并据此制定各级别运维服务的保障措施。在研究过程中遵循以下原则:
(1)业务需求为核心原则。信息系统运维分级模型需要根据业务实际需求,评估保障系统运行的运维服务资源需求,以满足业务需求为分级基础。
(2)资源利用最大化原则。运维分级服务模型在满足各信息系统业务需求的基础上,合理建立、分配及利用服务资源,做到运维服务资源利用最大化。
(3)定级标准化原则。信息系统分级过程需要符合《国家电网公司信息化标准管理细则(试行)》(信息技术〔2010〕307号)的要求,建立一套规范的标准流程,按照标准流程能完成所有信息系统的运维服务分级,并且需要保证分级合理和可操作。
(4)可持续性原则。运维分级服务标准制定后,需满足长期有效可用、可改进,能够根据客观环境及需求的变化,基于现有标准扩展和修改,且不因某些可预见问题或原因而频繁更改。
2.2 模型内容
2.2.1 分级设置
基于业务系统的业务影响度不同,将江苏公司信息系统运维服务按照业务影响度由低到高分为三个级别:一般维护级(三级)、重要基础级(二级)和关键保障级(一级)。考虑到江苏公司信息系统在重大活动或主管部门有特殊要求等时期的服务保障需要,增加第四个级别-特殊保障级(特级)。
2.2.2 模型的流程
信息系统运维分级模型具体确定流程如图1所示,模型首先评估业务系统在业务正常期的业务影响度;再结合不同的业务周期,评估该业务系统在不同业务周期下的业务影响度;最后根据业务影响度评级标准,评估该业务系统所有业务周期下的服务级别。
首先评估业务系统在业务正常期的业务影响度Φ;再结合不同的业务周期Ψ,评估该业务系统在不同业务周期下的业务影响度;最后根据业务影响度评级标准,评估该业务系统所有业务周期下的服务级别Λ。
2.2.3 模型的算法
图1中计算业务影响度Φ涉及的信息系统要素包括业务重要度、业务影响深度和业务影响广度三个一级因素。其中,业务重要度(权重30%)由信息系统的类型和信息系统对其他系统的影响两个二级因素组成;业务影响深度(权重35%),即信息系统因为故障对企业、社会、国家的影响程度,包括造成的外部影响和系统可容忍的中断时间两个二级因素;业务影响广度(权重30%),即信息系统因为故障造成的影响范围的大小,包括信息系统服务范围和信息系统服务对象两个二级因素。另外,考虑到江苏公司的情况,增加一个二级因素:主管部门的行政要求(权重5%),即国家相关部门或江苏公司主管部门对信息系统的行政管理要求。以上各因素的评分划分如表2所示。
图1中业务周期Ψ通过业务周期系数(u)乘以该业务正常期的业务影响度获得,不同业务周期的业务周期系数如表3所示。
服务级别Λ的最终定级采取百分制计分方法,对业务影响度的指标划分权重,并对指标的每个选项赋予不同的分值,通过对信息系统各个指标分析、计算和汇总用于评估该信息系统业务影响度。
步骤一:计算信息系统的业务影响度Φ,如式(1)所示。
×× (1)
其中,K为二级因素分值,KQ为二级因素权重,FQ为一级因素权重。
步骤二:计算不同业务周期的影响度,如式(2)所示。
Λ =Φ×u (2)
其中,u为业务周期系。
服务级别Λ得分越高表示该系统的级别越高,得分与系统定级关系如下:得分在70分(含)以上为一级服务(关键保障级);得分在35~70分为二级服务(重要基础级);得分在35分(含)以下为三级服务(一般维护级)。
2.3 模型的应用
以江苏公司在运的某信息系统为例,该系统的7个二级因素评分为B、C、B、D、B、C、D,用该文提出的改进信息系统分级模型计算系统定级过程如表4所示。
根据计算,该信息系统在业务关键期内需要提供一级运维服务,在业务正常期内需要提供二级运维服务,在业务低谷期内需要提供三级运维服务。
3 系统分级服务方法
3.1 运维服务措施
根据江苏公司信息系統运维服务要求,结合国家电网公司《国家电网公司信息系统运行维护工作规范(试行)》(信息运安〔2009〕144号)的要求,在充分考虑信息系统本身及系统运行所需的硬件及软件支撑平台的基础上,该文提出的运维服务内容措施如表5所示。
3.2 运维服务要求
该文中每个级别运维服务要求的设计满足:不低于该级别下所有信息系统对运维支持的最高要求。根据工作时间可将承载业务的信息系统使用时段,分为工作时段和非工作时段。运维服务需要按照不同时段提供更细化的服务保障措施。表6中列举了一级(关键保障级)的运维服务要求。
4 结语
该文在充分调研江苏公司信息系统运维现状和实际运维需求的基础上,结合国内信息系统运维服务分级先进理念和方案,提出了改进的信息系统分级模型,并基于该模型创新提出了一种分级服务方法。该方法在江苏公司落地后,显著提高了人力、物力资源的使用效率,有力促进了信息系统的安全运行管理提升,并为公司正在推进的运维自动化工作打下了坚实的基础。
参考文献
[1]IT服务管理—基于ITIL的全球最佳实践(中文版)[M].北京:清华大学出版社,2006.
[2]IT服务管理指标[M].北京:清华大学出版社,2008.
[3]胡波.基于ITIL的IT服务管理系统的研究与实现[J].装备制造技术,2007(8):111-112.
[4]黄连月,袁勇,马玉林.信息系统运行生产化管理及实践[J].广西电力,2008,31(2):1-4.
[5]吴云峰,陈昌根,刘宇波.IT服务级别管理在大型企业内部的实施[J].电脑知识与技术,2009,5(14):3790-3791.