《云服务器故障应急预案.docx》由会员分享,可在线阅读,更多相关《云服务器故障应急预案.docx(10页珍藏版)》请在优知文库上搜索。
1、云服务器故障应急预案一、目的为了确保云服务器(以卜简称云平台)运用过程中遇到突发事务后能正确、方序、高效地进行应急处理,保障工作的iE常运转,结合实际,特制定本预案。二、适用粒S1.本预案适用于云平台中可能出现的各类突发事务。三、9(案流程云平台服务故障预防措施包括分析风险,建立检测体系,打算应急处理措施,限制影响扩大。3.1 M各部门在云平台运用过程中遇到突发问题导致系统无法正常运转时,报技术部系统对接人确认,状况属实马上报知运维工程师和数据陈管理员O3.2 了解和分析依据实际状况,技术部支配应急值班(附表1),确保到岗到人,联络畅通,技术人员即时开展软件的检修工作,对详细状况进行了解并进行
2、初步推断、处理,并将初步状况上报运维工程师知晓C3.3 处理方法3.3.1 如突发问题为操作系统引起首先由技术人员对突发问题进行分析,确定引起问题的详细缘由,如操作系统已无法启动,则由技术人员将详细状况通报运维工程师,进行系统备份复原,如操作系统可启动,则由技术小组依据实际状况进行妥当快速处理。3.3.2 如突发问题为软件引起首先由技术人员收集系统H志,对突发问题进行分析,确定引起问题的详细缘由,通过探讨确定初步解决方案,并对突发问题进行初步解决,如仍无法解决,则由技术人员备份数据库后,重装云平台解决。3.3.3 如突发问题为网络引起技术人员先将问题反馈给数据中心运维人员,协调网络管理员进行初
3、步检杳后确定问题缘由,并在最短时间内赐予解决。在事务处理过程中,技术人员要随时将突发问题处理状况上报数据中心运维人员。3.3.4 如突发问题为数据库引起技术人员先将问题反馈给数据库管理员和服务器运维人员,确定问题。数据库软件本身问题,可切换至实时备份数据库。也可以采纳新建立数据序,复原备份的数据库文件,假如原云服务器都无法复原,可以采纳其他云服务器进行更原.3.3.5 特别状况处理打算好阿里云平台的帐号、域名备案、服务器,如遇目前云平台UC1.OUD都无法运用的特别状况,全部迁移至阿里云平台。技术部负责每周二和周五15点检查Ue1.OUd余额状况,若余额低于5000元当天申请续费付款流程,确保
4、余额大于5000元;检查完成后,福登汜云服务器例行检查记录表注:定期对服务器进行检杳,填写云服务器例行检杳记录表。四、信原平安事务分类4.1有害程序*#有害程序事务是指蓄意制造、传播万害程序,或是因受到市害程序的影响而导致的信息平安事务。有害程序是指插入到信息系统中的一段程序,万害程序危害系统中数据、应用程序或操作系统的保密性、完整性或可用性,或影响信息系统的正常运行。有害程序事务包括计算机病毒事务、蠕虫事务、特洛伊木马事务、僵尸网络事务、混合攻击程序事务、网页内嵌恶意代码事务和其它有害程序事务等7个子类。42网络攻击*务网络攻击事务是指通过网络或其他技术手段,利用信息系统的配置缺陷、协议缺陷
5、、程序缺陷或运用暴力攻击对信息系统实施攻击,并造成信息系统异样或对信息系统当前运行造成潜在危害的信息平安事务.网络攻击事务包括拒绝服务攻击事务、后门攻击事务、漏洞攻击事务、网络扫描窃听事务、网络钓鱼事务、干扰事务和共他网络攻击事务等7个子类。4.3 信息破坏*务信息破坏事务是指通过网络或其他技术手段,造成信息系统中的信息被篡改、假冒、泄漏、窃取等而导致的信息平安事务。信息破坏事务包括信息篡改事务、信息假冒事务、信息泄漏事务、信息窃取事务、信息丢失事务和其它信息破坏事务等6个子类。4.4 信息内容平安*务信息内容平安事务是指利用信息网络发布、传播危害国家平安、社会稳定和公共利益的内容的平安事务。
6、4.5 设备设茶故障设备设施故障是指由于信息系统自身故障或外国保障设施故障而导致的信息平安事务,以与人为的运用非技术手段有意或无意的造成信息系统破坏而导致的信息平安事务。设备设施故障包括软硬件自身故障、外围保障设施故障、人为破坏事故、和其它设备设施故障等4个子类。灾难性事务是指由于不行抗力对信息系统造成物理破坏而导致的信息平安事务。4.7胡榜其他事务类别是指不能归为以上6个基本分类的信息平安事务。五、应急处理5.1 平安*务等级确定信息平安事务分级的参考要素包括应用系统、数据系统、客户信息等公司重要信息。本公司将信息平安突发事务级别分为三级:一般、较大、重大。一般:公司较小苑围出现并可能造成较
7、大损害的信息平安事务。较大:公司部分网络与信息系统、网站受到大面积、严蛟冲击。重大:公司大部分网络、信息系统、网站基本瘫痪,导致业务中断,造成信息泄密的平安事务,纵向或横向延氏可能造成严竣社会影响或较大经济损失。5.2 覆案后动启动预案的权限。发生网络信息平安事务后,信息平安领导小组负贲启动相应预案,指挥、处理相关的应急响应工作。启动预案的流程。应急响应小组接到报告后,应当马h匕报信息平安简导小组有关负责人,并会同相关成员尽快组织专家蛆对突发事务性质、级别与启动预案的时机进行评估,向信息平安领导小组提出启动预案的建议,报信息平安领导小组批准。如发生重大平安事务,则报告人应同时上报应急响应小组和
8、信息平安领导小组有关负责人,应急响应小组应进行初步的应急处理,防止损害进一步扩大。启动预案后的应急处理。在信息平安领导小组作出启动预案确定后,应急响应小组马上启动应急处理工作。5.3 现场应急处理现场应急响应小组应尽最大可能收集事务相关信息,明确事务类别与来源,爱护证据,以便缩短应急响应时间。检查威逼造成的结果,评估事务带来的影响和损害:如检查系统、数据的完整性、保密性或可用性,检杳攻击者是否侵入了系统,确定暴露出的主要危急等。抑制事务的影响进一步扩大,限制潜在的损失与破坏。根除恶意代码造成的不良影响。在事务被抑制之后,通过对有关恶意代码或行为的分析结果,找出事务根源,明确相应的补救措施并彻底
9、清除。与此同时,对于攻击源头在外网的,应报执法部门和其他相关机构将对攻击源进行定位并消退。清理系统、复原数据、程序、服分。把全部被攻破的系统和网络设备彻底还原到它们正常的任务状态。另外,复原工作中假如涉与到涉密数据,须要额外遵照公司对于涉密数据的相关要求。5.4 报告和总结应急响应小组应回顾并整理发生事务的各种相关信息,尽可能地把全部状况记录到文档中。发生重大信息平安事务的单位应当在事务处理完毕后5个工作日内将处理结果上报给公司。5.5 应急行动结束依据侪息平安事务的处置进展状况和现场应急处理工作组看法,应急响应小组应组织相关部门与专家组对信息平安事务的处置状况进行综合评估,并向信息平安领导小
10、组提出应急行动结束建议,并报信息平安领导小组批准。应急行动是否结束,由领导确定。附件1:信息平安*务报告表信息平安务报告表报告时间:(年/月/日/时/分)报告人:联系电话:发生信息平安事务的信息系统名称与用途:负责人:信息平安事务的简要描述(如以前出现过类似状况也应加以说明):初步判定的事故缘由:当前实行的措施:本次信息平安事务的初步影响状况:本次信息平安事务的初步影响状况事务后果:口业务中断口系统破坏口数据丢失口其他影响他国:个局域网口单台主机口多自主机“整个信息系统口整严峻程度:严峻口极严峻口很严峻口严竣口一般口不联系方式:值班电话:传真:附件2:信息平安亭务应急处理结果报告表信息平安事务应急处理结果报告表原事务报告时间:(年/月/日/时/分)联系电话:联系人:信息系统名称与用途:已采纳的平安措施:信息平安事务的补充描述与最终判定的事故缘由:本次信息平安事务的初步影响状况:事务结果:影响范围:严峻程度:本次信息平安事务的主要处理过程与结果:针对此类信息平安事务应实行的保障信息系统平安的措施和建议:报告人签字: