《灾难恢复应急预案.docx》由会员分享,可在线阅读,更多相关《灾难恢复应急预案.docx(45页珍藏版)》请在优知文库上搜索。
1、上海观安信息技术股份有限公司灾难恢复预案模板TSC-RA-4-14本文件中出现的任何文字叙述、文档格式、插图、照片、方法、过程等内容,除另有特别注明,版权均属上海观安信息技术股份有限公司和客户公司所有,受到有关产权及版权法保护。任何个人、机构未经上海观安信息技术股份有限公司和客户公司的书面授权许可,不得以任何方式复制或引用本文件的任何片断。修订历史记录版本号拟制人/修改人拟制/修改日期审批人更改原因主要更改内容(写要点即可)VI.O陈芳2019-10-26李俊定稿目录第1章容灾组织架构及职责11.1. 灾难恢复组织架构I1.2. 灾难恢复组织角色职责1第2章突发事件快速分类2第3章应急响应和恢
2、复流程4第4章应急响应操作54.1. 事件检测及响应54.2. 人员召集94.3. 损害及影响评估104.4. 灾难预警134.5. 确定恢复策略154.6. 灾难宣告164.7. 灾备中心接管运行18第5章信息系统灾难恢复切换手册21第6章应急和恢复时间表22第7章附件及工具237.1. 应急通讯237.2. 灾难恢复资源267.3. 表格及工具模板277.4. 灾备中心网络拓扑图377.5. 灾备中心建设布局387.6. 突发事件等级策略397.7. 突发事件快速分类40第1章容灾组织架构及职责工工灾难恢复组织架构1.2.灾难恢复组织角色职责组织名字团队/角色职责第2章突发事件快速分类风险
3、事件种类场景列举事件等级应对策略预警及切换决策角色区域性自然灾害类事件区域性自然灾害事件,如:地震洪水飓风其他气象灾害等造成生产数据中心损毁I级(黑色)XXXXXXXX社会性灾难事件恐怖袭击爆炸内、外部攻击及破坏造成生产数据中心损毁I级(黑色)XXXXXXXX 瘟疫爆发辐射或危险品泄露 交通封锁社会公共事件导致生产数据中心5个工作日内无法进入、运行维护无法保证I级(黑色)XXXXXXXXXXXX机房环境或楼宇灾难事件生产数据中心火灾,造成生产系统设备损坏停机生产数据中心漏水,造成生产系统设备损坏停机生产数据中心机房结构性破坏,造成生产系统设备损坏停机生产数据中心供电系统瘫痪,造成生产系统设备停
4、机生产数据中心机房空调系统发生故障,且发电机无法运行,导致机房温度达到30C。以上,且预计5个工作日内无法恢复运行H级(红色)XXXXXXXXXXXXXXXXXXXX风险事件种类场景列举事件等级应对策略预警及切换决策角色IT设备软硬件故障系统的生产主机发生故障,引致系统运行中断,预计在5个工作日内无法恢复M级(红色)XXXXXXXX其他非核心业务系统软、硬件故障,造成系统停机、数据丢失、数据逻辑错误或重大安全隐患的M级(橙色)XXXXXXXXIT内、夕卜部攻击及破坏,病毒网络安全攻击代码漏洞人为破坏(软、硬件)造成系统停机、数据丢失、数据逻辑错误或重大安全隐患的山级(橙色)XXXXXXXX人为
5、误操作故障人为操作严重失误IH级(橙色)XXXXXXXX数据库逻辑故障故意破坏数据库逻辑故障造成系统停机、数据丢失、数据逻辑错误或重大安全隐患的第3章应急响应和恢复流程第4章应急响应操作4,.事件检测及响应目标检测并确认突发事件性质,进行事件初始响应资源XXXXX提示不要浪费时间去收集不容易得到的信息跟踪一切稳步进展而不是惊慌失措不要惊慌!当接到突发事件的电话记录以下信息:备注场地安全一人员是否需要撤离?机房是否可用?IT部门情况一受到何种影响:硬件、软件、网络、文档、处理能力、备份,是否需要启动灾备中心?供电和空调一电力和UPS是否正常?空调是否正常,温度是否上升?通讯一主要电话线路、交换机
6、、总机、呼叫中心是否受影响?员工一是否需要其他人支持,可以找到谁?业务运营一受到多大影响?指挥中心/灾备中心一具体位置,道路是否通畅?接完电话-做任何事之前考虑是否需要供应商(包括基础设施、IT设施等)协助以便快速恢复?计划和谁联系对于需要立即赶到指挥中心/灾备中心的员工: 简单扼要介绍发生了什么事 指挥中心地址/灾备中心地址 确保他们随身携带了必要物资(参见附件7.22) 你的最有效联系方式对于需要待命的员工: 通知其拨打公司语音信箱,以了解公司动态 记录他们的电话号码在通讯录上标出正在联系的小组成员,确保无人被遗漏检查列表编弓任务项目责任人完成状态完成时间1 主动检测: 监控系统 自身操作
7、 被动检测: 机构其他部门来电 本部门其他岗位 分支机构来电2检测并确认突发事件:联系现场和非现场人员,收集事件初步情况3接到事件通知后迅速开展事态初步评估: 接到通报后根据首次检测信息通知 进行故障定位; 初步评估设备损失; 初步评估软件损失; 初步评估业务影响损失; 是否人为因素、偶然因素; 是否内部人员破坏/外部人员破坏形成事件初步情况报告(参见附件731)4根据事件所属的领域,执行初始保护程序: 保存现场第一状态信息 如果确认可以控制局面,开展初始保护工作 若初步评估为人为破坏,排除重复破坏的可能性5设定问题诊断截止时间:如果使用本地资源可以恢复,不要浪费时间进行较长时间的检测和诊断如
8、果造成问题的根源不能在可接受的时间内被隔离或确定,必须立刻通知XXXX。并建议灾难预警或灾难宣告6跟踪以下情况: 事态是否可控 掌握的信息是否支持判断事态发展 需要进一步了解和关注的事项 定时执行通知突发事件等级提升或降低(参见附件7.6)7跟踪报告规程:15分钟报告一次:整体网络及机房环境编号任务项目责任人完成状态完成时间8联系下列人员,进行现场损害评估:必要时,联系外部技术协助(厂商、外部专家等)必要时,联系魁务进行保险理赔9如涉及机房基础环境破坏,需要从拿到现场损害评估的结果。10提醒相关人员不要对任何媒体发表任何未授权公布的声明与消息。4.2.人员召集目标确保IT部门成员完全理解事件状
9、况,召集人员携带必须物品到达指定地点资源XXXX提示注意集结时携带必须的物品检查列表gO任务项目责任人完成状态完成时间1选择集结方式: 全部集结:XXXXX 部分集结:XXXXX 不集结:仅远程控制2选择交通工具:联系租车公司3 轮流打电话给部门成员,填写电话记录单 将各人员所在位置记录在人员位置跟踪表,并定期更新。及时把基本情况通报HRo 尽量安排一个监督人检查和协调各项活动。4确定需要进行参与集结的供应商人员清单并依次打电话通知在指定位置集结5保持上下层信息通畅: 使XXXX始终了解聿大事项。 如有任何疑问,询问XXXX得到建议、指导或决策。 即使很匆忙,也要花些时间,帮助小组成员正确理解
10、期望他们做什么。6人员集结过程中的管理和控制,人员到位情况检查人员调配及异常情况处理4.3.损害及影响评估目标对受影响的区域和技术系统进行现场评估,确定损害的范围和程度资源提示检查列表编三b任务项目责任人完成状态完成时间1检查场地安全: 在进入现场进行损害评估前,要确保该区域安全,只有经授权人员能够进入 配备必要的安全设备 必要时,等待大厘物业检查受损害站点的安全性,确定其安全后才能进入2评估人员:执行损害评估的人员必须具备相关的技能、知识或经验必要时,协商厂商或集成商人员参与损害评估工作3根据突发事件的状态,确定配发装备: 身份标志(门禁卡、钥匙、门禁密码等); 装有评估软件的笔记本电脑、故
11、障检测设备; 若涉及机房基础环境破坏,包括安全设备(安全帽、告警灯、防护服); 铅笔、记事簿; 调查表格; 通讯工具; 照相、摄影装置(用于现场记录,为以后保险理赔工作保留原始纪录)。5犯罪取证和保险理赔: 联系保险公司和公安部门,以获得犯罪取证和保险理赔的具体要求;参见附件735 采用照相、摄影等手段,对损害情况进行记录,作为犯罪取证和保险理赔依据; 在进行证据记录和保全前,应保持现场原始状态,不得进行现场清理和搬动。6评估损害/损失的影响:编任务项目责任人完成状态完成时间 评估事件的大致影响。这是事故还是灾难? 在楼层布局图上标出损害区域和程度 基础/承重加固是否受影响,是否需要重做?7识
12、别关键设备的损害 服务器,交换机和桌面设备 配线架 网络和电信设备 电话机 供电设备 数据和语音线 空调 机柜8执行系统功能检查: 从管理控制台进行基本功能检查或诊断; 某些情况下,可能需要联络单个用户或用户组来获取信息; 尝试访问硬盘上的数据,如果可能将他们迁移到未损坏的设备上。9执行网络连通性检查: 检查配线架上的连通性; 检查线缆是否有明显的损坏; 检查外联线路状态: 互联网链路10检查数据备份和丢失情况: 备份任务执行情况: 故障什么时间发生? 故障发生时是否有备份任务正在进行? 哪些任务在故障发生前成功完成及其状态? 由于故障发生导致计划备份任务无法按时执行?当前备份状态是什么? 是否有计划的备份任务由于故障发生无法启动? 是否有数据丢失或没有备份? 数据备份可用性: 最近的本地和异地数据备份 数据备份的可用性 数据丢失情况: 数据丢失范围编任务项目责任人完成状态完成时间可通过其他渠道追补的数据11其他评估项目1 可预测的数据处理时间和服务中断时间 可挽救的数据处理和网络设备 可挽救的文件和记录 可以通过其他渠道包括备份数据重建的文件和记录 可以从其他渠道包括备份来重建的文件和记录12填写评估汇总表(参见73