2019数据中心场地基础设施运维管理标准.docx

上传人:王** 文档编号:1348692 上传时间:2024-06-21 格式:DOCX 页数:49 大小:182.59KB
下载 相关 举报
2019数据中心场地基础设施运维管理标准.docx_第1页
第1页 / 共49页
2019数据中心场地基础设施运维管理标准.docx_第2页
第2页 / 共49页
2019数据中心场地基础设施运维管理标准.docx_第3页
第3页 / 共49页
2019数据中心场地基础设施运维管理标准.docx_第4页
第4页 / 共49页
2019数据中心场地基础设施运维管理标准.docx_第5页
第5页 / 共49页
2019数据中心场地基础设施运维管理标准.docx_第6页
第6页 / 共49页
2019数据中心场地基础设施运维管理标准.docx_第7页
第7页 / 共49页
2019数据中心场地基础设施运维管理标准.docx_第8页
第8页 / 共49页
2019数据中心场地基础设施运维管理标准.docx_第9页
第9页 / 共49页
2019数据中心场地基础设施运维管理标准.docx_第10页
第10页 / 共49页
亲,该文档总共49页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《2019数据中心场地基础设施运维管理标准.docx》由会员分享,可在线阅读,更多相关《2019数据中心场地基础设施运维管理标准.docx(49页珍藏版)》请在优知文库上搜索。

1、数据中心场地基础设施运维管理标准一、规范性引用文件5二、术语和缩略语52.1 术语52.2 缩略语7三、管理范畴83.1 管理目标83.2 参与数据中心建设过程83.3 测试验证93.4 技术文档103.5 管理边界10四、安全管理和质量管理114.1 人员安全114.2 物理环境安全114.3 质量管理12五、人员管理135.1 组织及人员135.2 培训及认证145.3 运维外包服务商15六、设施管理166.1 资产数据库166.2 预防性维护166.3 操作流程176.4 工具及备件管理186.5 供应商管理186.6 生命周期管理196.7 运维管理系统19七、运行管理207.1 运行

2、管理制度207.2 设施监控、巡检、及交接班管攀217.3 机房清洁管理217.4 标签标识管理217.5 变更管理217.6 事件管理227.7 应急响应227.8 容量管理237.9 能效管理237.10 预算管理24八、附录:数据中心场地基础设施运维管理最佳实践257.11 试验证的最佳实践257.12 据中心市电断电应急预案397.13 据中心机房基础设施运维人员架构图447.14 据中心场地基础设施运维中易犯的十大错误45一、规范性引用文件下列文件对于本文件的应用是必不可少的。凡凡是注明日期的引用文件,仅注日期的版本适用于本文件。凡是不注明日期的引用文件,其最新版本(包括所有的修改单

3、)适用于本文件。GB50157电子信息系统机房设计规范GB26860电力安全工作规程发电厂和变电站电气部分D1.408电业安全工作规程二、术语和缩略语1.术语1. 数据中心(DataCenter)主要功能为容纳一个计算机房和该计算机房的各个支持区的一栋建筑或者一栋建筑的一部分。包括容纳信息技术系统的主机房、支持信息技术系统运行的辅助区和行政管理区。2. 场地基础设施(SiteInfrastructure)数据中心内为信息技术系统提供运行保障和运行环境的场地设施。包括容纳IT系统的主机房,支持IT系统运行的供电系统、制冷系统、消防系统、安防系统、监控系统及其路由等配套设施及维护IT系统的辅助设施

4、。3. 运维管理(OperationandMaintenanceManagement)对数据中心场地基础设施进行日常运行和维护,确保各项基础设施系统安全稳定地运行。运维管理包括制定运维制度和计划、执行运维计划、响应场地基础设施故障、突发事件等紧急情况。4. 生命周期(1.ifeCyCle)通常指数据中心从投产到经济寿命结束的全过程。但也有将投产前的规划期、设计期、建设期、测试验证期作为生命周期一部分(孕育期)的说法。5. 测试验证(COmmiSSiOning)验证并记录数据中心设施作为一个整体及其所有的设备、子系统满足用户的设计目标和运行要求。6. 健康评估(HeaIthASSeSSinent

5、)全面系统性地对机房现有使用状态、设备运行情况、运维管理制度及流程等进行全方位的检查。7. 预防性维护(PreVentiVeMaintenanCe)为降低产品发生失效或功能退化的概率,按预定的时间间隔或按既定的准则实施的维护.8. 风险评估(RiSkASSeSSinent)针对运行的设备所面临的威胁、存在的弱点、造成的影响,以及三者综合作用所带来风险的可能性的评估,同时确定风险是否可容许的全过程。9. 容量管理(CaPaCityManagement)对于基础设施在空间、电力承载能力、制冷能力等方面的评估,以满足IT数据存储和处理的需要容量。为了实现其目标,容量管理需要与业务及IT战略流程保持密

6、切的联系。10. 资产管理(AssetManagement)对于数据中心基础设施中每个资产建立独有的标识,并详细进行资产描述、制造商、型号、安装日期、保修期等信息的记录管理。11. 可用性(Availability)在所有要求的外部资源得到提供的情况下,数据中心在规定的时刻或规定的时间段内处于能执行要求的功能状态的能力。它是衡量数据中心等级、运维水平的重要指标。可用性的计算如下:可用性冰蚊理12. 绿色运行(GreenOperation)指数据机房中的制冷、照明和电气等能取得最大化的能源效率和最小化的环境影响。13. 负载(1.oad)指连接在电路中的电源输出的设备。负载是把电能转换成其他形式

7、的能的装置。14. 气流组织(Ai1.FIOWOrganiZatiOn)指在机房内对冷热气流的流向按一定要求进行疏导和组织。2.缩略语1 .PUE(PowerUsageEffectiveness,电力使用效率)PUE是评价数据中心能源效率的指标,是数据中心消耗的所有能源与IT负载使用的能源之比。PUE=数据中心总设备能耗/TT设备能耗PUE是一个比值,越接近1表明能效水平越好.2 .S1.A(Service1.evelAgreement,服务等级协议)服务提供商和客户之间签署的、描述服务范围和约定服务级别的协议。3 .MOP(MethodOfProcedure,维护作业程序)MOP是维护作业程

8、序,用于规范和明确数据中心基础设施运维工作中各项设施的维护保养审批流程、操作步骤。4 .SOP(StandardOperatingProCedUre,标准操作流程)SOP即标准操作流程,是将某一项工作的标准操作步骤和要求以统一的格式描述出来,用来指导和规范Fl常的运维工作。5.EoP(EmergencyOperatingProcedure,应急操作流程)EOP是应急操作流程,用于规范应急操作过程中的流程及操作步骤。确保运维人员可以迅速启动,确保有序、有效地组织实施各项应对措施。6.CMMS(ComputerizedMaintenanceManagementSystem,计算机化维护管理系统)用

9、以系统性地设置并跟踪运维任务的执行情况,存储操作流程及相应运维人员的操作权限等维护工作相关信息。三、管理范畴1 .管理目标数据中心场地基础设施运维团队应与业主管理层、IT部门、相关业务部门共同讨论确定运维管理目标。制定目标时,应综合考虑数据中心所支持的应用的可用性要求、数据中心场地基础设施设施的等级、容量等因素。目标宜包括可用性目标、能效目标、可以用服务等级协议(S1.A)的形式呈现。不同应用的可用性目标的数据中心,可设定不同等级的数据中心场地基础设施的运维管理目标。2 .参与数据中心建设过程数据中心运维团队应充分了解自己将要管理的场地基础设施。对于新建数据中心,应尽早参与数据中心场地基础设施

10、的建设过程,以便将运维阶段的需求在规划、设计、建造、安装和调试等过程中得到充分的考虑;同时为后期做好运维工作打下基础。1. 应参与规划设计数据中心的规划设计是一个谨慎和严谨的过程,需要所有参与数据中心建设的相关方共同完成,才能确保规划和设计的有效性、实用性等要求。其中,场地基础设施运维团队应提出运维要求,从运维经验、实际运维难度、提高运维可易性等方面对规划和设计过程进行配合。2. 应参与相关供应商遴选数据中心场地基础设施运维团队应参与数据中心基础设施设备供应商选择的全过程,及时地了解各种产品及服务的品牌、型号、规格等关键参数,使之更能满足运维的要求。并就在安装、调试过程中的注意事项等提出建议,

11、还需要对后续的设备保修等服务提出要求。3. 应参与建造管理数据中心的场地基础设施运维团队应积极参与数据中心场地基础设施的建造工作,并协助做好建设项目的项目管理工作,着重关注工程建造中如材料的使用、工序、建造过程等工作,重点关注隐蔽工程的安装工艺和质量。数据中心场地基础设施运维团队应充分了解施工过程中的工艺。对于新建数据中心,从施工质量和日后运维方便性出发,尽早发现施工过程的问题,及时纠正,方便日后运维和节省日后整改成本。3 .测试验证数据中心场地基础设施投产前的测试验证是确保数据中心场地基础设施满足设计要求和运行要求的关键环节。1. 时间和预算数据中心的业主应设立测试验证专项预算,预算应包括外

12、部测试验证服务提供商的相关费用,以及在测试验证阶段产生的电费、水费、油费等相关费用。应制定测试验证的工期规划,以更准确地预测数据中心场地基础设施交付投产的日期。2. 测试验证参与方项目建设管理部门可作为测试验证工作的主体责任单位;运维管理部门可作为测试验证工作的主体审核单位;第三方测试服务商可作为测试验证的实施单位及整体组织工作的协调单位。但运维管理部门应要求测试服务商预先提供测试方案,在运维管理部门审核后方可进行。数据中心场地基础设施运维团队可参与测试验证工作,在此过程中熟悉设施和设备,可建立相关运维技术文档库,为后期的运维工作做好准备。数据中心关键设备提供商及工程总包商,应积极配合测试验证

13、工作,应在供应商合同中对此项有明确要求。3. 测试验证内容验证应覆盖所有关键子系统和设备应具备的功能和关键的操作程序,确保满足设计要求,必要时可做故障情景模拟来检验。测试验证中发现设计或者建设阶段的问题,应该在报告中充分体现;可以改造的部分,应要求建设单位进行改造;不能改造或暂时不需改造部分,应作为风险点在运维过程中予以特别的重视,并制定相关预案。4. 设施健康评估当接手已在运行的数据中心场地基础设施的运维工作前,运维团队应对设施的情况进行健康评估,了解潜在风险点,其中能够改造的部分,应该申请予以优化改造。不能改造的部分,应该作为风险点在运维中予以特别的重视,并制定相关预案。4 .技术文档完整

14、并准确的技术文档是后期运行、维护、维修、故障诊断、优化改造的基础。运维团队在开展运维工作前,应从业主或者原运维单位得到场地基础设施的全套相关文档,包括但不限于:数据中心的规划设计资料及竣工图纸、反映机房最近一次改造后真实现状的图纸、全套设备的清单及相关操作文档和保修保养资料、机房自动操作系统的逻辑图及说明文档、监控系统的点表、验收测试文档、数据中心所在建筑的建筑设计资料、竣工图纸。整体文档应在限定时限内进入运维管理知识库,并按照质量管理的原理和要求设定文档的起草、变更、审核、批准、保存、分发等职责权限。5 .管理边界为了明确管理责任,数据中心场地基础设施运维团队应将可能影响数据中心场地基础设施

15、运维目标达成的外界因素整合成管理边界报告,提交业主管理层并组织研讨,形成明确的决策,制定完整的协调沟通机制及权责界限。这些因素包括但不限于:不归本部门负责,但可能对于本部门有重大影响的供电、供水、供暖、制冷、消防、安防、监控、运营商线路接入等系统。四、安全管理和质量管理1 .人员安全数据中心场地基础设施运维团队要编制正式的数据中心生产环境(工作场所)的安全方针,设定严格的安全生产规范;并根据安全方针制定有效的、明确的安全计划,来教授和培训安全原则、危险识别、纠正缺陷和控制风险。并加强对于该部分规范的合规度的培训、考试和审核检查,以确保数据中心运维人员的人身安全。相关安全生产规范主要包括: 数据中心生产环境安全管理规范; 数据中心场地基础设施各系统安全管理手册: 数据中心场地基础设施涉及安全的应急预案; 数据中心场地基础设施管理过程涉及的技术方案中的安全管理策略。数据中心场地基础设施中与电气相关的工作存在着固有危险。设施运维团队应当创建一份正式电气安全计划,以最小化所有工作人员受到电气伤害的风险,确保现场电气系统达到相关法规标准。电气安全计划中的条

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 建筑/环境 > 招标文件

copyright@ 2008-2023 yzwku网站版权所有

经营许可证编号:宁ICP备2022001189号-2

本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!