《IT运营之变更自动化技术研究.docx》由会员分享,可在线阅读,更多相关《IT运营之变更自动化技术研究.docx(6页珍藏版)》请在优知文库上搜索。
1、IT运营之变更自动化技术研究近年来,伴随银行IT系统规模的快速增长,传统运维模式的不足愈加凸显。本文以网络专业技术变更为切入点,深入研究自动化解决方案并建立了全流程运维技术栈。该方案旨在为数据中心提升变更质量和效率提供一个完整的参照案例,通过自动化转型突破瓶颈,支持银行更好地实现创新发展。一、变更的内涵与定义当前,业界基于ITIL(ITInfrastructureLibrary)方法论已发展形成了多种技术框架和落地模型,其中ITSM框架更是应用最广泛的参考模型之一,其核心内容主要包括服务提供与服务支持两大部分。服务提供指面向业务提供高水平的服务,通过签署服务水平协议,约定业务连续性目标作为服务
2、支持的约束条件;服务支持则覆盖了事故管理、问题管理、配置管理、变更管理和发布管理等5个流程以及服务台职能。基于上述划分,所谓“变更”主要指从变更管理这一流程中衍生出的技术相关工作,核心目标是完成数据中心生产运行过程中业务或应用提出的各类需求,例如在机房环境、硬件设备、网络系统、平台配置、应用版本等方面产生的技术调整,以及对技术调整动作的管理工作。尤其是伴随云计算、大数据等新技术的广泛应用,企业信息系统的设备数量和运行复杂度也大幅增长,手工操作模式已愈发难以满足数据中心的安全生产要求。在此背景下,变更自动化等技术需求成为生产运行的一个必要选项,也是提升生产连续性水平的一个核心要素。实践中,当业务
3、发展需求下沉到具体的生产运维工作时,会转换为大量的生产调整动作,并最终映射成为IT部门的生产变更管理和技术实施操作。具体而言,变更从需求来源和技术方向两个维度还可各自划分为不同类型。例如,按需求来源可大致划分为业务推广、应用投产、资源扩缩、基础建设等四类,按专业技术可大致划分为应用、系统、网络、设备等四类。然而,在上述变更工作中,往往还存在因变更错误、执行失误等因素导致的业务中断风险,从而为数据中心运维工作带来了巨大挑战。对此,本文拟分析建立一套标准、规范、高效的自动化运转机制,并以此为基础开发自动化工具,实现技术支持,最终构建一套符合生产运行需求的稳定、高效、灵活的变更自动化体系。二、变更自
4、动化技术应用解析1 .技术变更特点数据中心变更通常存在变更数量多、操作频率高等特点,尽管ITSM框架规定了变更管理的各项基本要素,但对于制定技术变更方案等专业化工作,仍需要各数据中心基于自身工作环境,结合设备、网络、系统等各方面的技术知识开展具体设计,以及开发出相应的变更自动化工具。以网络系统的变更自动化技术为例,某数据中心网络配合业务、应用需求,每年在生产运维工作中需要实施约5000余次生产变更,而单纯依靠人工管理很难突破现有运维瓶颈。对此,通过对高频变更进行分析和总结,自研产品或引入开源技术来支持变更自动化工具投产,不仅可以有效突破人工运维的效率瓶颈与安全瓶颈,消除技术对业务创新发展的制约
5、,还可以额外提供更好的运维增值服务,提升网络变更质量并降低例行化变更的实施风险。2 .自动化需求分析现阶段,数据中心层面的网络变更大致可分为三类:第一类是防火墙策略类,主要是按照业务访问的数据流关系,完成客户端和服务器间访问规则的开通、调整和关闭;第二类是网络接入类,主要是为承载业务的应用服务器搭建网络接入环境,包括线路连接、存储接入等;第三类是网络优化类,主要是按照网络系统自身需求,进行网络系统结构调整、例行重启、性能扩容等工作。而对于变更操作对象而言,落地变更自动化技术首先要求其具备以下三个特点:一是变更实施的操作步骤可以细化到标准的操作执行格式,能够用在同类型的不同设备对象;二是变更调整
6、的对象支持命令行接口(CLI)或应用编程接口(API)进行调整操作,接受通过标准格式的命令并执行反馈结果;三是变更调整的对象支持执行命令下达后的标准响应规则,可按照预期判断规则反馈命令执行后的正、负响应。实际上,数据中心网络系统中的主要设备都可以符合上述三个特点,在此基础上,参照变更实施划分的七个环节(包括变更需求分析、变更环境匹配、变更方案准备、变更方案审核、变更计划安排、变更方案实施、变更方案验证与回退),并在各个变更环节开展自动化技术研究和挖掘,即可组成变更自动化技术体系。举例来说,变更自动化工具可包括但不限于流程管理自动化、方案实施环节自动化和方案编写、步骤校验自动化等技术模块,并以此
7、来纳管超过70%的网络类标准变更,最终实现标准变更工作的全面自动化处置,进而打破传统手工运维在质量和效率上存在的技术瓶颈。3 .工具开发实践按照上文提出的变更自动化开发思路,通过对网络变更各个环节的标准规则加以总结,制定出变更自动化实现技术标准后,即可结合企业组织架构需求整理开发需求,最终由研发团队完成自动化工具的开发和投产。以交换机平台为例,网络交换机设备主要提供Telnet/SSH等远程登录和操作接口,以及负责抽象和制定命令执行后的响应回馈、异常处理等判断规则,并作为执行策略输入到工具开发阶段。针对上述过程,相应的变更实施自动化工具可采用业界主流的B/S应用结构,并基于JaVa平台进行开发
8、,从而实现自动化工具的灵活扩展和跨平台使用。变更实施自动化工具运行流程如图1所示。图1变更实施自动化工具运行流程实践中,变更实施自动化工具可为专业人员提供统一集成的人机交互界面,屏蔽不同厂商的异构设备差异,同时基于自动登录、自动执行、错误判断、日志获取等需求,开发设计了工具界面、方案识别、设备登录、指令执行、规则判断、信息提示等六个基本模块,各模块间的工作逻辑遵照数据中心实际需求设定,并灵活支持不同的处理逻辑来完成变更实施工作。此外,通过采用变更实施自动化工具,将可替代人工操作环节完成命令配置的精准落地,达成预先设定的网络调整和变更目标,最终使技术变更工作形成端到端的闭环流程。以一个普通的网络
9、变更为例,自动化工具效益对比分析见表1O表1网络变更自动化工具效益对比分析手工变更方式自动化变更方5工作流程9个手工环节无手_L环节操作风险人工失误机器执行人员要求专业骨干(26人)操作人员(2人变更效率1个变更处理约30分钟1个变更平均51(变更日实施时间3小时变更日实施时间1.工欲善其事,必先利其器。当前,推动传统运维工作向运营服务转型已成为运维领域的主流发展方向之一,而不断提升运维自动化水平,充分发挥运维数据的价值和作用,对提升数据中心生产运行的效率和水平均具有重要意义,例如,结合自身变更流程和技术特点推进自主开发,进而通过制造工具、使用工具、完善工具等一系列动作,将可大幅提升数据中心的生产运行水平,最终实现从量变到质变的跨越性突破,为业务可持续发展提供高质量保障。