《计算中心一体化监控管理集成平台技术方案.docx》由会员分享,可在线阅读,更多相关《计算中心一体化监控管理集成平台技术方案.docx(10页珍藏版)》请在优知文库上搜索。
1、计算中心一体化监控管理集成平台解决方案PlatformCloudInsight,集成的、一体化的、全面的IT基础设施监控管理软件。它集成并整合EGO(Platform公司的服务器资源管理平台)、SNMP、TelnetSSHIPMkSQL(JDBC)等多种技术手段,实现多种IT设备的监控、报表统计和管理功能。1解决什么问题管理一个异构、复杂的计算中心,您是否遇到过这样一些问题: 列出今年所购买的所有软、硬件设备的配置清单 有哪些设备维护期将在明年到期 计算中心总的计算能力(CPU、核、内存等)和使用情况 设备出问题,用户比系统管理员先知道 新购买一组刀片,UPS的容量是否足够 交换机出现故障,如
2、何快速确定可能受到影响的设备 快速检查服务器的硬件状态:耗电量、CPU温度、CPU风扇转速2产品特点 一体化、集成的IT信息管理软件 集中、全面的IT基础设施监控管理 基于角色的权限管理和访问控制 强大的报警功能 高扩展性,支持超过5000个机器设备 超轻量级、高效率,产品本身的系统开销极低,监控的时效性高,监控数据延迟最小可到秒级 简洁,纯B/S架构,完全基于Web的访问和管理强大的定制和扩展能力,用户可以自定义新的设备,扩展开发新的数据收集程序,并可与其他管理系统整合和集成用户接口(纯B/S模式,完全基于Web)I.功能模块I.资产管理资源监控统计分析系统管理其他管理系统接口设备一览设备变
3、更维护期管理到期提醒网络、物理拓扑 机器 网络设备 存储设备 UPS机器使用网络流量 存储使用 UPS态 数据库 许可证使用 机房环境 系统日志 异常分析远程登录 远程开关机数据库 软件许可证 机房环境 系统日志 异常报警用户管理 设备管理数据管理(数据库,统计分析)模块化配置和管理,系统管理、数据收集(EGO, SNMP, Telnet, SSH, IPMI, Log1 JDBCPlatform Cloud Insight 的体系架构2.1一体化、集成的IT信息管理PlatformCloudInSight将资产管理、资源监控、统计分析和常用的系统管理功能有机地整合在一起,通过Platform
4、CloudInsight系统管理员可以一站式地完成大多数日常的系统管理工作,极大地简化系统管理工作的复杂性、减少工作量。OoUdMtM.n三UIABQSS_3SnV9MG%UVMM1r3tftS4m.8.XM.ijjoJB-3 OSA9.g. jq.如 oreXM31SM.0.OW.O.uJ, IWM力 1.加.jJQ.8 0CoiOG-HIMM-S 2JFM()23S*wea0SiM7.119.aa.utaM.W.S 0g.SMffw.I.II4)*wt3IMI3001皿11。22e9244皿WFt,PNrL 12XI7k0mw1*. 1I)0HlwtmJj 223aIIJDflXWXWHJ
5、nJMNB 心HRU 113Xjtrjao资产普理:机器清单,自动收集配置信息1.AM=4LMlI物理拓扑服务器性能分析统计2.2 集中、全面的IT基础设施监控管理PlatformCloUdlnSight通过多种协议和方法,包括:PIatfOrm专利的EGO资源管理协议以及SNMP、IPMkTelnet、SSHJDBC、SYSLOGFlexlmFlexnet等,提供了对计算中心几乎所有软、硬件设备的监控功能,包括:机器、交换机、存储系统(SAN,NAS,基于IP的存储,如:ISilon)、UPS、数据库、软件许可证、机房环境(空调、温湿度传感器等);并提供针对这些设备详细的、全方位的信息收集和
6、必要的远程管理(远程开关机,远程SSH、TelnetVNC登录等)功能。使用PlatformCloudInSight可以轻易实现对计算中心运行情况从全景到细节的监控和管理。机列我和机叁名I樽作不既I请色播z5I谪逸Zla簿I*逸恬二|次号机HWM63在曲43直纹:和CPUBJj126根效,252内彳,252G的册IL求三1T12MXLXA113 t校分一9ftc久IMfll4% OO-2CAwMtIhMtHU (M2EMVMQMMeiWtnM MMQMmtf w 2K4HMHiMtO VIAM:5 VtAJtIWJb*th2d 9 U 11 16 25 K )PMCMX 129GIgaWit
7、Mm( )11gttfthr*W,QqKiIetlMe14:(25)Gbltf tfu,RW N JT 41 42 4) 44 交换机监控,包括VLAN的信息分W值?管褶传网广初8谭内?F/且ft7ifl tXf 6UL*Sg,”加楷傅tT 切费飘科密柠FVVgiqiAofd赋修蹩由。有配IMgKN 科中数据库内存状态监控信。*务号:000002.#s:BJIWAntfIl : 15.出电压辨HSSh 50 OHZUP4称:Socomec状毒:OettetyMormalUP沏翅衅傅:Ri* L1219.CV.LZ2200V“人EM: 50 OHZ号:000002:08 : 69606 0Wnu
8、psC iso%UPS状态监控2.3 基于角色的权限管理和访问控制PlatformCloudInsight支持细粒度的系统管理权限划分和角色定义,可以轻易定制多种角色,以不同的权限访问系统。例如:可以定义网络管理员、存储管理员、数据库管理员等多种角色,相应地只分配合适的权限,避免管理员权限过大和不必要的误操作。2.4 强大的系统报警功能PlatformCloudInsight提供了强大的事件配置和报警功能,几乎所有的监控指标都可以定义为报警事件。并且,PlatformCloudInsight11I以在全局层面和指定设备层面配置报警事件,实现从宏观到精细的事件报警。针对所有服务器内存不足报警事件
9、定义操作规则名称状态资源类型黄源属性监测条件边界值严重级别备注I选择操作二J内存不足启用数据库数据库内存利用率90产重I选择操作二Ijob启用数据库作业失败次数2一般作业失败I选择操作二)space启用数据库表空间利用率5FI选择爆作二mem启用数据库内存排序命中率5一般I选择操作二cache启用数据库高速缓存命中率5I选择操作二jPga启用数据库PGA中率5警告PgaI选择操作工CPU启用数据库数据库CPU利用率80鳄CPU利用率高I选择操作二j内存利用率启用数据库数据库内存利用率90警告内存利用率高针对指定Oracle数据库已定义的报警事件2.5 高扩展性、超轻量级和高效率针对计算中心数量
10、占绝对多数的服务器设备,PlatformCloudInsight通过底层使用Platform专利的EGO资源管理技术,实现了高扩展性、超轻量级和高效率。PlatformEGO已经在多家客户生产环境中实现了5OoO个机器以上的统一资源管理和监控,并且在这种情况下,即使监控数据更新的延迟设为数秒,产品本身对被监控机器的系统开销(CPU、内存、网络等)极低、几乎可以忽略不计。正是有赖于PlatformEGo核心技术,PlatformCloudInSight成为一个功能全面、高效且超轻量级的监控管理软件。3支持设备现阶段提供如下类型设备支持,并将在未来扩展支持更多设备类型(例如支持SNMP协议的空调、
11、机房环境传感器等): 服务器:LinUx、UNIX服务器。 交换机:千兆交换机、万兆交换机、光纤交换机。 存储:支持SAN、NAS和基于IP存储(如ISilOn)。 UPS 数据库:Oracleo 许可证:FleXIm/Flexnet类型的浮动许可证。4功能模块 网络拓扑:可以实现网络拓扑图的编辑、美化和保存;多级网络拓扑的展开。 机房定义和设备物理位置可视化:机房平面图、设备摆放的物理位置(机柜、刀箱等)、设备照片。 设备管理:添加和更新设备定义,设备的维护期管理(包括维护到期设备查询,到期提醒等功能) 设备总揽:提供企业一个IT资产查询的平台,可以快速查询对各种设备的物理配置(例如机器的C
12、PU类型/数量/内存、交换机的端口数等)设备监控:可以对各种设备的运行状态进行监控;实现必要的设备管理功能,例如服务器、交换机等基于Web的远程登录等;提供常见的设备运行情况报表分析,例如:机器今天、昨天、最近七天、最近三十天、本月的CPU利用率报表;提供基于设备的事件监控功能和异常事件报警功能。 事件监控:可以从宏观上定义各种设备的报警事件,并实现异常报警功能。 系统知识库:可以通过数据库维护IT系统管理的经验和知识,并提供知识查询功能。5案例介绍5.1 挑战 全面,监控管理软件必须全面覆盖计算中心所有主要软件的应用情况、硬件设备状况,包括:许可证、数据库、服务器、交换机、存储、UPS、机房环境等。功能全面的异常报警,可以针对所有被监控的设备,快速发现和定位问题 复杂异构环境下的服务器监控管理,包括:Solaris.AIX.RedhatLinuxWindowsServer2003等;服务器总数超过200台,并且每台服务器所采集的监控指标多达数十项。 多种网络设备组成的复杂网络系统监控管理,涉及到华为、Cisco、FOrCelo等十几台千兆以太网、万兆以太网交换机。 多种类型的存储系统的监控,包括对光纤交换机的监控。 多个勘探开发数据库的监控,包括OraCIe9i和10g。 十几种商业软件许可证的监控。 轻量级、时效性。监控管理软件本身的系统开销必须很小,监控数