《ITSS事件管理程序.docx》由会员分享,可在线阅读,更多相关《ITSS事件管理程序.docx(25页珍藏版)》请在优知文库上搜索。
1、一、目的事件管理流程主要功能是尽快解决日常工作环境中出现的事件,保持IT服务项目的稳定性,其目的包括:在成本允许的范围内尽快恢复IT服务项目报修故障1 .快速响应服务请求(电话,邮件,ITSM系统,即时通讯工具,现场等);2 .用户获得服务支持;3 .沟通及跟踪事件处理的状态;4 .和用户确认事件的解决和用户满意度。1、进行事件控制1 .按规范记录事件;2 .就事件的优先级、影响范围等进行分类;3 .分析,诊断,必要时进行升级;4 .监视并结束事件;5 .进行定期服务回顾。2、提供IT服务项目管理信息1 .提供一个日常服务接口;2 .人力资源利用情况;3 .故障处理情况;4 .服务支持率。二、
2、范围事件管理范围包括在服务工作中产生的操作咨询和故障处理,主要包括:服务请求和技术咨询:IT服务项目过程中,安装、部署、配置和使用等技术咨询。信息化升级、扩容和改造等技术咨询活动。故障处理:对IT服务项目的软件和硬件故障进行处理。信息安全事件:由于网络、主机和操作人引发的有关信息安全事件。三、角色、职责权限定义流程的实现是通过不同的流程角色以及其被赋予的职责来实现的,因此流程的每一个角色可以被定义为一系列职责的集合,在实际的管理操作中,不同的人员将被赋予不同的职责,也可能一个人被赋予多个职责,同时也可以将其职责授权给其管理结构之下的人员,因此,以下所提及的管理流程和角色的目的是为了在充分满足流
3、程所需角色的基础上,为具体的实现提供足够的灵活性。事件管理流程主要分为以下几个职责/角色,分别简述如下:1、服务台服务台:负责接收所有的事件,对事件进行初步的处理,并根据实际情况将事件分派到服务工程师。1.1职责:1 .在制定的响应时间内响应所有服务台热线电话、邮件、工单等事件报告;2 .完整记录所有接收的时间信息,包括:记录时间报告人的详细联系方式、事件特征表现、描述、发生时间等;3 .为事件进行适当的分类、为事件分配优先级等属性;4 .尝试使用知识库、初步诊断、分析相关信息等方式解决事件;5 .如果服务台不能解决事件,应当将事件分配给服务工程师;6 .检查事件的处理进度,保持与用户的联系,
4、适时通知事件处理进展;7 .在事件处理过程中,催办事件处理进度;8 .与用户确认时间解决方案及用户满意度反馈,关闭事件。1. 2技能要求:1 .熟悉技术平台和技术环境;2 .较强的沟通能力;3 .对简单的故障要有快速诊断和解决的能力;.熟悉事件处理流程。1.3人员安排:结合公司实际情况,设置服务台人数,负责受理桌面支持、核心业务系统类支持、非核心业务系统类支持(包括其它应用系统、网络接入等)三大类事件。在有驻场服务的项目中安排驻场项目经理或驻场服务工程师充当驻场服务台人员,可根据具体驻场情况安排人数。2、事件经理事件经理:通常由服务经理兼任,负责对服务台派单所有事件进行再一步的处理。同时负责事
5、件解决过程中的协调和监控,以及事件升级的判断以及具体执行。1.l职责:1 .与服务台及时沟通事件的状态信息;2 .将事件分配给最合适的一线支持服务工程师来处理;3 .检查事件的处理进度,保持与服务台和用户的联系,适时监督事件处理进展;4 .在事件处理过程中,若事件信息不完善等可打回服务台催促其完善信息;5 .负责对重大、紧急事件的解决协调资源,保证故障的最终排除;6 .当事件优先级为紧急或者事件将超过规定的时限,负责按照升级方法对事件进行处理确保有效协调资源,促进各类角色小组(如一线服务工程师、二线服务工程师)快速恢复正常服务;7 .确保和问题管理流程经理的有效合作;.确保正确和广泛地收集和分
6、析事件数据,发现IT和业务相关的问题。1.2技能要求:1 .了解技术架构和技术环境;2 .较强的口头表达能力和与用户沟通技巧;3 .处理纠纷的能力;4 .深刻了解事件管理流程;.较强的领导能力。1.3人员安排:公司的事件经理暂由项目部服务经理担任。3、一线服务工程师在ITSS体系中,服务工程师负责对服务台无法解决的事件进行快速有效的分析,提出解决方案以尽快恢复服务,并在必要时提供现场支持。1.1职责:1 .决定需要采取何种措施恢复服务并实施有效的行动;2 .必要时提供现场支持;3 .根据优先级提供有效的解决方案;4 .更新事件解决信息,已解决的事件转回服务台,由服务台关闭事件;5 .如果一线不
7、能解决这个事件,应当决定选择最合适的二线支持服务工程师来处理。1. 2技能要求:1 .熟悉技术平台和技术环境;2 .较强的沟通能力;3 .快速诊断事件和解决事件的能力;.熟悉事件处理流程。1.3人员按排:将公司项目部日常维护(包括硬件、软件等)人员纳入一线支持中,按日常所管系统类型或设备类型划分到相应维护支持组中;服务工程师可根据情况纳入到一线服务支持序列。4、技术工程师技术工程师是相关问题领域的专家。负责提供对服务工程师无法解决的问题进一步进行调研,找出解决方案并尽快恢复服务。1.1职责:1 .进行事件的深入调查研究;2 .根据经验和专业技能,决定需要采取何种措施恢复服务并实施有效的行动;3
8、 .必要时引入供应商的支持;4 .及时提供有效解决方案;5 .与其他技术工程师合作,确定解决方案;6 .已解决的事件转回服务台,由服务台关闭事件。1. 2技能要求:1 .深厚的技术背景,对所维护范畴的技术深入掌握.熟悉事件处理流程。1.3人员安排:主要由公司技术部各类业务系统及基础设施维护专家组成。5、岗位与角色映射事件管理流程角色角色分析说明成员服务台公司服务台职责:负责受理各类事件。结合公司情况,设置服务台人数。服务台人员驻场服务台职责:负责受理该驻场服务面临的一线服务支持类事件。根据驻场服务的情况,酌情安排驻场项目经理或驻场服务工程师人根据用户项目具体安排员。服务工程师服务工程师基础设施
9、维护支持组职责:负责用户小型机、PC服务器、存储设备、网络交换机、路由器、防火墙、网络链路等硬件维护工作。岗位设置:由公司项目部分派相关基础设施硬件技术支持人员担任。系统实施人员应用系统支持组负责用户各类应用系统及操作系统、中间件、数据库等系统软件的基础维护支持工作。岗位设置:由公司项目部分派相关应用系统技术支持人员担任。桌面支持组职责:负责总公司桌面支持工作。岗位设置:由公司项目部分派相关桌面技术支持人员担任。技术工程师公司二线服务工程师应用系统运维专家组职责:负责用户应用系统包括核心应用系统及非核心应用系统的维护工作。岗位设置:由公司技术部各类应用系统运维人员系统资深技术人员担任;以及相关
10、合作厂商的工程师共同担任(如IBMVMwareOracle微软等)。基础设施维护专家组职责:负责用户小型机、PC服务器、存储设备、网络交换机、路由器、防火墙、网络链路等系统硬件设备的维护工作。岗位设置:由公司技术部基础设施方面各类硬件设备资深技术人员担任;以及相关合作厂商的工程师共同担任(如IBM、HP、EMC、华为等)。事件经理公司职责:负责服务的督导与监控事件处理过程的正常运转,接收事件的升级通知和处理超时通知等。岗位设置:由项目部服务经理兼任。根据具体项目安排6、术语术语定义术语定义IT服务公司承诺的对用户提供的系统运行维护服务。一线支持服务台支持,主要包括服务热线,初级技术员和驻场技术
11、服务工程师。二线支持技术部非驻场工程师提供的软件和硬件技术支持,包括高级技术工程师,以及厂商提供的技术支持。重大事件用户合同中规定的重大事件。7、过程策略1.1责任人策略1 .用户通过电话,邮件,ITSM系统,即时通讯工具,现场等方式向服务台报告事件,服务台当班人员接到事件报告和服务请求后,及时在ITSM系统内作好记录,服务台当班人员为此事件的负责人。2 .服务台记录事件后,要分析事件是否在受理责任范围内。如果在受理范围内,由其进行分配给相关事件处理人员,并通知相关运维服务人员,要求运维服务人员回复对分派的事件单是否接受。3 .服务台当前值班人员负责向用户及时通报事件处理情况。4 .事件解决后
12、,服务台当前值班人员及时对申告人进行回访。1. 2分类策略由于用户提供的信息或许不完整或不正确,可能导致开始的分类与最终的分类有很大的差别。首先对事件按照基本事件类型进行分类,各类可以对应到相应的支持组,以便准确分配任务。事件分类:一次分类二次分类说明合同服务服务请求如:状态查询、重置口令,业务咨询,信息咨询,工单处理等。应用故障用户应用出现问题,如错误提示、异常退出、不办理业务,性能下降等。服务器应急故障机房服务器出现硬件故障,如系统停机、异常启动。网络硬件故障网络设备出现故障,如交换机故障、路由器故障等。用户资产维护桌面硬件故障电脑、笔记本、打印机等设备出现故障。桌面软件故障电脑、笔记本、
13、打印机等设备出现的软件故障。综合类其它类的服务事件。事件状态:编号状态描述1处理已在系统中记录,未派单给工程师。2派单已分配至工程师,工程师未处理。3受理工程师正在处理过程中,事件还未解决。4解决工程师已解决,服务台还未确认。5回访服务台确认,事件关闭。1.3优先级策略给事件分配优先级,以保证支持组对事件必要的重视。分级应基于事件的紧急程度和影响面。所有事件都应划分到不同的优先级中,其中划分为重要紧急的事件优先级为最高,根据事件的影响度和紧急度确定事件的优先级,事件优先级分为三级。事件级别级别定义影响业务范围影响业务程度业务修复紧急程度1影响到用户核心业务系统及及安全,数据存储安全情况。用户核
14、心业务系统受到影响,数据会造成重大丢失或损坏的肯能性。重要紧急2影响到用户很大一部分业务系统及安全,数据存储安全情况。用户很大一部分业务系统受到影响,数据会存在丢失及损坏的一般可能性。紧急3影响到用户部分非核心的一般业务系统及安全。用户一般性业务系统受影响普通事件分类与故障等级与技术支持合同相关,如有合同定义,则以合同定义为准。备注:时间级别为1-2级的为重大事件,需要走重大事件处理流程。1.4目标解决时间策略和升级策略为了更好的控制事件的解决,事件被分类分级,每类事件的解决都设定了目标时间。升级策略的目的是确保不同优先级的事件分配到合适的资源来解决。为了达到这个目的,定义了升级策略的时间框架。当达到其时间界限时,如果事件还未解决,将触发升级机制。事件升级时间表:事件级事件所处阶段事件汇报人员范围别项目经理(处理部门、服务台)部门经理(处理部门、服务台)公司领导业务管理部门电话邮件电话邮件电话邮件电话重要紧急事件发现30分钟内每1小时或有新进展超15分钟事件解决后30分钟内紧急事件故障发现30分钟内