《机房环境监控系统设计方案详细版XX版.docx》由会员分享,可在线阅读,更多相关《机房环境监控系统设计方案详细版XX版.docx(55页珍藏版)》请在优知文库上搜索。
1、机房环境监控系统设计方案详细版XX版机房监控管理系统设计方案书一、项目背景5二、设计思路及要点5三、总体设计方案73.1 系统设计71. 1.1设计根据73. 1.2串口设计74. 1.3系统结构73.2 系统性能93.2.1可靠性93.2.2稳固性103.2.3精确性103.2.4实时性103.2.5安全性103.2.6保护性113.2.7扩充性113.2.8易操作性113.3 系统功能123. 3,1界面管理124. 3.2客户端管理135. 3.3报警管理136. 3.4故障管理147. 3.5联动管理148. 3.6安全时段功能159. 3.7数据管理要求1510. 3.8日志管理要求
2、1611. 3.9增强型IE权限管理1612. 3.10双向短信查询功能1713. 3.11增强型告警功能1814. 3.12报表功能1915. .13能效管理功能213.4 系统实现223.4.1动力监控223.4.1.1配电柜监测223.4.1.2配电开关监测223.4.1.3UPS监测233.4.1.4蓄电池监测243.4.1.5精密配电柜监测253.4.1.6直流/交流配电屏监测263.4.2环境监控273. 4.2.1精密空调监控274. 4.2.2普通空调监控285. 4.2.3新/排风机监控296. 4.2.4温湿度监测307. 4.2.5机柜温度监测318. 4.2.6漏水监测
3、321.4.3 安保监控333. 4.3.1防盗监控334. 4.3.2视频监控345. 4.3.3消防监测351.4.4 IT设备监控363. 4.4.1服务器监测364. 4.4.2路由器监测375. 4.4.3交换机监测383.5推荐监控对象393.5.1动力监控393.5.1.1STS/ATS开关柜监测393.5.1.2发电机监测403.5.2环境监控413. 5.2.1照明监控414. 5.2.2防雷监测423.5.3 安保监控433.5.4 IT设备监控44四、售后服务454.1 售后服务标准454.2 售后服务支持体系454.2.1 例行性检查服务464.2.2 系统应急维修服务
4、474.2.3 服务资料的管理474.2.4 服务结果的确认484.3 售后服务内容及范围484.3.1 系统故障保护484.3.2 咨询月艮务484.3.3 备件保修与更换服务48五、运维外包495.1 背景说明495.2 平台设计理念495.3 解决客户机房管理中的难题495.4 平台架构505.5 平台特点515.5.1 网络接入安全515.5.2 平台系统安全515.5.3 “一站式”服务网站515.5.47 x24小时远程监控值守525.5.48 时远程巡检535.5.49 速故障处理545.5.50 业运维分析54一、项目背景目前在信息技术全面深入支撑业务同时,企业要紧投资在防火墙
5、(firewall),存储备份(backup)s加密(VPN)、防病毒(anti-virus)s入侵检测(intrusiondetect)MailSystem.ERPSystem,网络设备、服务器等方面,用户对机房的监控管理受到了前所未有的压力:一是由于缺少关于机房基础设施、IT设备的监控,导致空调、电源特殊、网络中断等情况时有发生,却得不到实时监控与解决;二是监控系统种类繁多,基础设施监控系统、IT监控系统、KVM系统等既相互独立又相互关联,纷繁复杂交织在一起,运维过程中难免“牵一发而动全身”的现象;三是新业务的需求不断涌现,支撑体系相应为之升级,甚至被迫“伤筋动骨”,软件升级次数多、频率高
6、、厂家售后服务系统不完善不能跟上用户需求的增长。这些因素都成为机房稳固运行的隐患,影响业务层的稳固运行,给企业带来不可估计的缺失,同时也证明了一套功能完善、运行可靠的信息监控管理系统已成为机房规划建设中不可缺少的构成部分。二、设计思路及要点就全国各地机房信息监控管理系统建设与使用情况来看,由于参与建设的监控厂家水平良莠不齐,导致国内部分机房不能表达信息监控管理系统的价值所在。如何规划一套涵盖监控与管理,但又能够模块化逐步集成的解决方案;如何选择与业务层匹配的监控对象;如何确保系统的实时性、准确性同时具有有用,不花哨的功能;如何选择一个能够长期持续优质服务的监控厂家成为本项目的设计要点。项目的设
7、计要点:1)监控、管理、服务缺一不可信息监控管理系统设计往往注重数据监控采集,忽略监控数据的分析处理与售后服务的持续保障能力,使得项目容易出现虎头蛇尾的局面。为确保业务的稳固运行,须对机房的动力、环境、安防、IT设备设施进行全方位监控;监控发生告警时,如何通过系统管理功能高效地运维是设计考虑的关键因素;同时系统建设完成后,应确保可持续服务满足系统的正常连续运行。因此在系统建设时,须使用整体规划的方向,通过统一建设或者分步实施的手段来承建机房监控、管理、服务相融合的系统。2)监控管理一体化是趋势目前基础设施(动力、环境、安保)与IT设备统一监控,各监控模块与功能模块一体化也成为必定趋势,一体化是
8、纲举目张的过程。一体化系统没有复杂的硬件连接与软件二次开发,一方面可通过一套平台实现对所有对象的统一监控管理;另一方面可通过完整的监控数据,对数据与报警进行综合分析诊断,推断故障根源,提高运维效率。系统具备更广泛的习惯性与经济性,标志着系统更加成熟,易于升级换代。3)数据分析是降低运维难度的金钥匙原始的监控数据展示已不能满足用户的需要,如何把监控数据提炼成用户需要的数据是本项目设计的难点。比如当机房断电时,会产生一系列的故障时间,通过智能化分析手段,对告警进行过滤,可准确定位为“UPS市电供入断开”,而不可能发出一系列无关告警;原始的动力数据通过分析模块,能够将机房内的能耗进行综合计算分析,得
9、出机房的PUE值及其他有关能耗指标值,为优化方案提供有力的支撑数据。4)管理需要为本单位人员结构量身定制为了实现运维管理的集成化、标准化与规范化,搭建运维服务台是提供了IT服务部门与业务部门用户之间的一个中心联络点,满足业务部门用户与运维人员之间的协调与沟通,并对问题的处理进行有效的跟踪与监控。ITIL是公认的it最佳实践,但假如没有通过量身定制,在实施时容易出现“水土不服”,如何针对本单位人员结构特点定制有用的运维管理功能,是本项目实现高效运维管理的关键。5)直观展示是提高工作效率的起跑线报警信息在所有监控数据中比例能够用“沧海一粟”来形容,大量数据有可能会让重要报警淹没在信息流中。数据分析
10、处理的结果,如何以一种既最直观的方式展示,也是值得深究的学问。信息监控管理系统应当要有能力把用户所关心的设备集中一个页面或者首页上展示,应当要有能力将所有正在报警的设备自动集中到一个页面或者首页上展示,应当要有更快捷的报警页面展示方式,比如自动弹出报警页面、点击报警时间弹出报警页面等。6)服务是系统稳固运行的基石信息监控管理系统建设完成后,有形产品在需求的比例中下降,服务的价值正在变得越来越重要。解决系统软硬件发生的故障、业务体系扩容带来的系统升级、协助运维部门做好工作成为一家优秀服务提供商的工作重点。服务提供商与用户之间的量化服务级别指标(SLA)应当要成为客户满意度的评定标准之一。三、总体
11、设计方案3.1 系统设计3.1.1 设计根据电子信息系统机房设计规范(GB50174-2008)电子信息系统机房施工及验收规范(GB50462-2008)安全防范系统验收规则(GA308-2001)计算机场地安全要求(GB9361-200X)3.1.2 串口设计对RS485/RS422接口类型的智能设备,通过手拉手总线连接,使用轮询通讯方式实现对设备数据的采集。单条串口总线串接的设备越多,采集周期越长。常量名称参数值单条命令采集周期0.ls(视被监控设备而定)单条命令平均包含的测点数lO(根据设备厂家通讯协议而定)采集周期间隔0.ls(可配置)同端口下设备采集间隔时间0.Is页面刷新周期Is一
12、条串口总线的采集周期;设备1采集周期+设备N采集周期+(同一端口下设备个数-1)*0.Is+采集周期间隔。我司通过丰富的项目经脸总结,针对不一致设备,结合项目数据刷新要求,给出本项目全面设计。3.L3系统结构为了确保系统的稳固可靠运行,系统使用了模块化的架构进行设计,确保任何模块出现故障不可能影响同级别的其他模块的正常工作。同时为了满足本项目现在与以后的规模需要,使用分布式系统架构能够确保系统后续的扩容能力与系统反应速度。监控管理平台是一个高可用性的分布集中的机房弱电集成监控系统,从硬件来说能够分为监控单元(SU)、监控管理中心(SC)、监控业务台(SS),使用分布式系统结构,每个模块各施其职
13、,互不干扰。整体架构图如下:Wtl各部分的要紧作用如下:监控单元(SU):动力、环境、安防监控单元由各类I/O采控模块、传感器构成,直接连接各类被监控设备,采集如UPS、空调、温湿度、漏水等的现场信号,将采集的现场信号通过RS485方式上传到监控服务器的串口。IT监控单元由各类被监控的IT设备通过TCP/IP方式,使用SNMP接口将信号上传到监控服务器。监控管理中心(SC):由主机房的监控管理服务器(主备机)构成,监控管理服务器可脱网工作并具有独立数据处理及数据存储能力,用于将现场监控信号进行存储、实时处理、分析与输出,处理所有的报警信息,记录报警事件,并负责将操纵命令发往前端设备,实现对现场
14、设备的远程操纵。监控管理服务器支持使用“双机热备”方式设计,确保监控系统的稳固靠运行,监控管理服务器已通过国家3C认证,负责整体系统的集中管理与调度,收集与处理由监控单元(SU)发送上来的数据与报警监控管理服务器支持IE的远程访问,用户能够实现各类统计报表、数据分析挖掘、告警管理、权限管理与系统配置管理等,通过运维管理模块能够实现设备管理、事件处理、服务台、检修计划、知识库、统计分析等功能,并完成各类统计报表。监控业务台(SM):用于进行远程的WEB浏览,系统能够提供三维的展示方式,便于管理人员随时随地熟悉机房的工作状况,可直接观看到与监控服务器一致的监控画面,在具有相应权限下还可对设备实现远
15、程操纵,如空调的开关机等。系统支持B/S分布模式的模块化结构,软硬件的安装与保护集中于监控服务器端,易于实施与保护。客户端负责展示用户界面,监控管理系统在B/S浏览时,在浏览器登录监控管理系统时能够进行修改界面、配置等操作,数据处理放在监控管理中心(SC),当监控需求增加时,只需对监控单元(SU)进行升级或者扩展成多个监控单元(SU)即可,大大地加强系统的伸缩性。各监控单元内都以分布式模块化设计,任何一个被监控对象发生故障时,不影响本监控单元或者其他监控单元内的数据采集工作。3.2系统性能3.21可靠性系统满足核心配套设备监控、管理需求作为第一要素考虑。系统符合电磁兼容性与电气隔离性能设计要求,不可能影响被监控设备的正常工作。系统具有自诊断功能,对软硬件故障能够自动重启恢复。监控设备具有良好的接地,抗干扰能力强。设备选用高可靠的工业级设备,