《运维管理系统流程设计(含事件管理、故障管理、问题管理、知识管理).docx》由会员分享,可在线阅读,更多相关《运维管理系统流程设计(含事件管理、故障管理、问题管理、知识管理).docx(26页珍藏版)》请在优知文库上搜索。
1、运维管理系统流程设计(含事件管理、故障管理、问题管理、知识管理)目录1.1事件管理11.1.1管理目标21. 1.2业务需求点21.1. 3流程设计31. 1.4流程功能91.2 故障管理111.2 .1流程设计111.3 .2流程功能131.3 问题管理141.3. 1管理目标141.3.2 业务需求点151.3.3 流程设计161. 3.4流程功能201.4知识管理211.1.1 4.1管理目标211.1.2 业务需求点221.1.3 流程设计221.1.4 流程功能26运维管理主要为IT人员提供统一的协同式工作环境。通过IT流程的梳理及固化,实现IT内部纵向、横向,以及其他专业的有效协同
2、。通过与各类IT专业工具的集成,为IT人员提供日常工作的集中处理环境,实现各项IT工作的规范化、标准化、集中化处理,提高IT人员工作的效率质量。1.1 事件管理事件管理流程是对IT生产环境中导致IT服务中断或潜在中断的事件进行管理,快速恢复IT服务能力的管理流程。事件的来源包括IT用户报告的事件、监控系统自动转发的事件、客服系统自动转发的IT类事件等。它的目的是尽快恢复被中断或受到影响的服务,是以恢复服务为首要目的,可能采取临时解决方案,而不在于查找根本原因。主要业务环节包括事件的登记、事件的分配、事件的处理、事件的升级和事件关闭等。LLI管理目标事件管理流程的主要功能是尽快解决出现的事件,保
3、持业务支撑系统的稳定性,其目的包括:确保各类IT事件能够在成本允许的范围内,按照事件的优先级,快速、有序地解决,从而减少IT服务中断造成的影响。多渠道快速响应服务请求(电话/Web/邮件/即时通信工具等)。根据事件的优先级,影响度进行综合分类排序,如果判断事件优先级是紧急,则启动紧急事件管理流程进行处理。为客户提供及时的事件处理状态信息。监控事件处理过程,必要时进行管理和技术升级。确保IT事件处理过程中的关键信息能正确记录,为后续事件处理提供知识支持,为流程持续优化提供准确的数据信息。按规范记录事件信息及解决过程信息。服务台及后台技术资源利用情况。服务台、技术支持团队的工作效率。LL2业务需求
4、点登记各种渠道上报的事件,并对其进行分类和分级;按照对业务的影响程度和优先级分配事件;支持工程师解决该事件,并记录详细的解决方案;对超期事件进行升级处理;事件处理的解决方案可以形成知识,为后续工作提供参考;对历史事件进行趋势分析,形成问题;根据事件记录考核相关人员的绩效;对于重复上报的事件,能够进行关联处理;对事件处理的过程进行跟踪审计;事件单能够和问题单、故隙单等其他流程工单关联。LL3流程设计1.1.3.1流程图事件管理概要泣程IOI索益事件处理子流程IOOlS事件处理的施找服.务 台100.1事件记杀和分类*autt(中亳忸曲/故除岳瞽)100.2例始4件克林力件科决一一线支持-二畿支砂
5、(中吉描Ja)100.7关例W件IooS堂初事件再确认H记录解决力案Slff事件未修法:线十i(厂家)其他流程200何也管理酒程图:事件管理流程泳道图1.1.3.2流程表单项以下为事件流程表单信息项,实施时可结合的实际需要进行表单的信息项进行增删:序号信息项说明1事件ID事件单流水号。2请求人信息事件申报人的信息,包括:姓名、部门、电子邮件、办公电话、手机。序号信息项说明3登记时间在服务台生成事件记录的时间4地点事件发生的地点。5事件发生时间针对事件:指的是业务中断的实际时间(可能早于登记时间,需要调整确认)。针对其它:缺省值等于登记时间。6业务恢复时间针对事件的业务恢复实际时间。7事件来源参
6、见“事件来源定义。8用户事件提交渠道参加用户事件提交渠道定义。9事件影响度参见“事件影响度定义。10事件优先级参见事件优先级定义。11事件完成期限对应每一个事件优先级,系统根据流程相关定义中事件解决时限自动设定最终的完成期限。12所属系统类型参见所属系统类型定义。13事件分类参见“事件分类定义。14事件标题事件的简要描述。15事件描述对于整个事件内容的详细描述。16事件解决人事件的最终解决人。17事件状态参见事件状态定义。18分配对象被分配的技术支持组和人员。19事件日志反映事件信息项的变化历史,如一个事件在处理过程中事件状态变化的时间点等信息。20解决方案事件解决方案的描述。21业务中断时长
7、造成业务计划外中断的时间长度。22事件结束代码参见“事件结束代码定义。23重复事件标记标记为重复事件。24重复事件ID重复事件中主事件ID。25处理是否超时参见处理是否超时定义。26实际完成时间记录事件已解决的时间。27事件厂商参见附录C厂商和集成商名称标准。28关联配置项记录出现事件的配置项代码。29关联的问题单号记录由事件引发问题时,关联的问题单号。30关联的故障单号记录由事件引发故障时,关联的故障单号。1.1.3.3主要活动说明序号步骤名称责任人说明100.1事件记录和分类服务台服务台对来自用户和系统自动产生的事件进行详细记录序号步骤名称责任人说明服务台负责在接收到事件后进行分类转发,对
8、申告/告警/咨询/故障类事件进行分类转发对于初步判断为紧急的事件马上升级到一/二线人员处理对于非业务支撑维护职责范围的事件转给其它相关责任部门100.2初始支持服务台属于服务台技能范围内可以处理的事件,服务台应尝试解决,如果无法解决需及时升级到一/二线支持不属于服务台职责范围的事件,立即分派到相应的一/二线支持100.3一线/二线尝试解决一线支持/二线支持一线/二线支持人员在接受到由服务台派发的事件后,进行调查诊断,尝试解决在必要时根据服务协议联系厂商帮助解决并负责核查事件解决后,在事件管理平台记录事件解决方案并更新事件状态指定时限内不能解决的事件,通告事件经理,升级为故障管理流程100.5紧
9、急事件再确认一线支持二线支持一线支持人员接受到来自服务台的紧急事件后,根据事件优先级别标准再次确认事件是否为紧急事件如果优先级确实紧急,则通知相应的管理层,并立即升级到事件经理,转101紧急事件处理子流程如不是,转100.3一线尝试解决,开始正常事件解决流程100.6记录解决方案细节服务台一线支持二线支持在事件得到解决后,各线支持人员负责详细记录事件解决过程及方案并更新事件信息针对故障,一线/二线支持必须记录业务恢复时间100.7关闭事件服务台一线支持二线支持服务台与申报用户确认事件是否己得到解决,如果解决,事件以成功解决或变通方法解决而关闭;否则,事件以不成功关闭,重新开事件记录,并与原记录
10、做关联,分派到原处理人员继续处理服务台在关闭事件的同时必须确认事件单记录的业务恢复时间是否准确其它由一线或二线人员自行创建的事件单,则由开单人负责关闭序号步骤名称责任人说明处理过程对后续工作有指导或参考的,录入知识库100.8事件处理的监控服务台事件经理负责监控所有未关闭的事件的处理状况,对接收到的超时告警应及时关注事件经理负责协调资源,保证事件的最终解决101紧急事件处理流程事件经理事件经理负责协调紧急事件的处理,具体过程见紧急事件处理子流程1.1.3.4角色及职责说明1.1. 3.5事件经理事件经理负责事件解决过程中的协调和监控,事件升级的判断和具体执行。职责: 负责对事件的解决协调资源,
11、保证事件的最终排除。 确保和问题管理流程经理的有效合作。 确保正确和广泛地收集和分析事件数据,发现IT和业务相关的问题。1.1.3.6服务台人员服务台人员负责接收所有的事件,对事件进行初步的处理,并根据实际情况将事件分派到合适的二线支持工程师。与服务台一起工作进行事件处理的技术人员定义为一线人员。职责: 负责24X7的值班和系统监控。 响应客户投诉工单、热线电话、邮件、传真等事件报告。 完整记录所有接收的事件信息,包括:记录事件报告人的详细、事件特征表现、描述、发生时间等。 对事件进行适当的分类、为事件分配优先级等。 尝试使用工具对事件进行初步诊断,分析相关信息并解决问题。 对服务台解决不了的
12、事件,分配给最合适的二线支持小组/人员来处理。 检查事件的处理进度,保持与事件报告人的联系,适时通知事件处理进展。 与用户确认事件解决结果,关闭事件。1.1. 3.7二线支持人员二线支持人员是燃气行业内部相关问题领域的专家。负责提供对一线支持人员无法解决的问题进一步进行调研,找出解决方案并尽快恢复服务。在省公司的实际情况中,技术人员一般会按照所维护的应用、系统进行分工,如:网络支持、主机支持、应用支持等。这些技术人员都可以映射为二线支持人员,在流程中不明确区分。职责: 验证事件的描述和信息,进一步收集相关信息。 进行深入调查研究或协调厂商支持,提供有效的解决方案。 实施事件解决方案。 更新事件
13、解决信息,将已解决的事件转回服务台。1.1.3.8三线支持人员包括应用开发厂商的后端研发团队、提供远程支持的设备厂商、或厂商的现场服务。职责:口提供远程接入方式的支持,协助进行事件诊断及恢复。口必要时提供现场支持和深入调查研究,提供有效的解决方案。参与重大事件解决方案的实施。1.1. 3.9与其他流程关系 与监控系统的交互监控系统发现故障或异常后,可以通过事件管理的接口将重大故障自动传递到事件管理,注册为一个事件,并能自动填写事件ID、配置项、事件标题、事件描述、优先级、最终期限等。主要功能包括:令支持监控系统/其他系统自动生成事件的接口,并将监控到的故障信息填写到相应的事件单中。令支持与监控
14、系统的双向同步。即当事件关闭时.,自动确认监控系统中的相关告警。而监控系统中的告警消除后,应能自动关闭事件。令监控系统的后续相同告警可以追加的方式添加到事件单中。 与客服系统的交互客服系统在处理用户事件时,如果认为应当由IT服务部门解决,可以通过接口将用户事件自动传递到事件管理,注册为一个事件,并能自动填写事件ID、配置项、事件标题、事件描述、优先级、最终期限等。主要功能包括:支持客服系统自动生成事件的接口,并将客服系统中记录的信息填写到相应的事件单中。令作为客服系统的子流程,处理结束后通知客服系统,由客服系统和用户做最终的确认。令客服系统中相同事件的后续信息可以追加的方式添加到事件单中。 与问题管理的交互对于重大事件或者统计分析得到的事件发生趋势,可以产生相应的问题记录。主要功能包括:支持通过重大事件生成问题记录单,将事件中的相应信息自动拷贝到问题单中。令支持问题单和事件单的关联,一个问题单可以关联多个事件单。当关闭问题单时,应能够自动通知关联的所有事件单。 与知识