《数字化全病程健康管理:运维规范.docx》由会员分享,可在线阅读,更多相关《数字化全病程健康管理:运维规范.docx(7页珍藏版)》请在优知文库上搜索。
1、数字化全病程健康管理:运维规范1范围本文件规定了数字化全病程健康管理系统的运维环境、运维对象、运维内容和要求。本文件适用于数字化全病程健康管理系统的运维管理。2规范性引用文件下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件,仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。GB/T28827.1信息技术服务运行维护第1部分:通用要求GB/T28827.2信息技术服务运行维护第2部分:交付规范GB/T28827.3信息技术服务运行维护第3部分:应急响应规范GB/T30998信息技术软件安全保障规范3术语和定义本文
2、件没有需要界定的术语和定义。4运维环境4.1 硬件环境数字化全病程健康管理系统的硬件环境条件见表1。表1硬件环境条件设备名称硬件主要参数参考型号用途服务器1CPU数量:2颗32核CPU型号:XeonE5-2660CPU频率:2.2GHz内存:64GB硬盘接口类型:SATA/SAS硬盘容量:1TBRAID模式:Raid5Dell-R730部署安全接入管理系统服务器2部署终端管控系统网闸机型规格:标准2U机架式接口:4个以上100/1000MbaSe-TX以太接口网络吞吐量:800Mbps并发连接数:80000网御星云SIS3000-Z4101物理隔离,信息摆渡4.2 软件环境数字化全病程健康管理
3、系统的软件环境条件见表2。表2软件环境条件序号软件名称软件版本备注1虚拟机服务器软件ESXI5.X2虚拟机操作系统CentOS6、windows2008R23安全接入管理系统软件iSAP1.04安全接入管理系统数据库Mysq15.X5终端管控系统软件MAAS3606终端管控系统数据库Oraclellg7应用服务器软件Tomcat7.08消息中间件软件Kafka集群部署9分布式文件软件HDFS集群部署5运维对象5.1 基础设施基础设施组成应符合表3的规定o表3基础设施组成序号名称内容1网络和网络设备系统运行的网络线路、路由器、交换机等硬件设备。2主机设备应用服务器、数据库服务器等硬件设备。3存储
4、和备份设备存储、带库等用于存储业务数据的设备。4安全系统防火墙、入侵检测、漏洞扫描、安全审计、防病毒、流量监控等软硬件。5系统软件操作系统、虚拟化软件、应用中间件、数据库、数据分析软件等其他软件系统。6机房动力和环境机房以及配电、UPS、空调、温湿度检测、漏水检测、门禁、安防、消防、防雷等设备。5.2 应用系统包括业务受理系统、协同工作系统、综合评价系统、应用维护系统等子系统。5.3 相关数据包括管理部件等基础数据以及系统运行过程中产生的业务数据、配置文件、日志等各类数据。5.4 用户终端计算机、通讯设备、客户端等各类终端设备。6运维内容和要求6.1 服务热线要求运维服务热线在接听、受理系统相
5、关问题咨询或投诉时,应符合表4的规定。表4运维服务热线要求序号服务流程服务要求1受理1)应详细、准确记录反映人、受理时间、反映内容等信息,并录音。2)接到电话10min内,应完成电话记录并交办。3)如反映人询问问题解决时间,应根据问题性质告知。1)如咨询方面的问题或电话能直接答复的问题,应直接回复。5)结束通话前,应询问是否还需要其他帮助等服务用语。2交办1)问题交办前,应根据问题性质及处置要求确定交办时限。2)交办类电话,应在接到电话IOmin内,交办给相应运维服务供应商。3跟踪1)应根据问题等级,定期跟踪相应运维服务供应商问题的处理进度,记录跟踪过程并录音。2)问题解决不及时、问题反映人不
6、满意或重复来电反映等情况,应做好记录并按规定向运维管理部门上报。4回复1)问题解决后,应向反映人回复,反馈过程应做好记录并录音。2)如问题在3个工作日内无法处置完毕,应告知反映人处理进度。5结案1)应经反映人确认处理结果后结案。2)应定期将结案问题报运维管埋部门备案。6.2 系统巡检要求6.2.1 巡检的启动时间、范围、方式、频次应符合表5的规定。表5巡检的启动时间、范围、方式、频次类别启动时间范围方式频次日常巡检系统运行期间固定时段系统和应用服务器、数据库等关键系统和设备远程巡查每日三次或四次机房、视频等辅助系统现场巡查、远程巡查每日两次大屏等辅助设备现场巡枪每周一次计算机等用户终端现场巡枪
7、每半月一次停机巡检系统停运期间停机期间重点巡检系统主机以及机房、消防等设备,停机即将结束时(系统正式运行前)进行一次全面巡检。现场巡查、远程巡三停机期间、停机即将结束时各类别启动时间范围方式频次进行一次应急巡检防汛抗台、防雪抗冻或重大活动时重点巡检系统和应用服务器、数据库等关键系统和设备。远程巡查宜根据不同应急状态设定频次,i般每两小时进行i次6.2.2 根据巡检内容需要,可通过直接登录系统或借助专业运维软件进行巡检。6.2.3日常巡检、停机巡检、应急巡检均应制定相应的巡检计划和方案。6.2.4巡检过程中发现需系统集成方或软件开发方解决的问题,可由运维服务供应商直接交系统集成方或软件开发方解决
8、,问题解决情况按月报运维管理部门,重大问题应在问题发生当日报运维管理部门。6.3故障应急要求6.3.1系统故障等级划分、解决时限、通报要求应按表6执行。表6系统故障等级划分、解决时限、通报要求等级程度解决时限通报要求一级系统中的关键设备或应用软件出现故障,导致系统瘫痪,重要核心业务无法开展,或出现严重信息、数据出错、重要数据丢失。自故障申报时起2小时内解决。1)故障发生后应及时报告运维管理部门,通知受影响的各有关部门和专业部门。2)每小时向运维管理部门报钓解决进度和情况。二级系统中的主要设备或应用软件出现故障,或处理性能严重下降,基本业务受到严重影响。自故障申报时起3小时内解决。1)故障发生后
9、应及时报告运维管理部门,通知受影响的各有关部门和专业部门。2)每小时向运维管理部门报告解决进度和情况。三级系统的部分操作性能受损,处理部分性能出现卜.降,系统功能削弱,但大部分业务运作仍可正常工作。自故障申报时起4小时内解决。故障发生后和故障处置完毕后,应及时通知受影响的有关部门和各专业部门。四级系统中发现有故障隐患的报错、软硬件临时性报错、某个单项功能出错需要修复。自故障申报时起2个工作日内解决。故障处置完毕后应及时通知受影响的各有关部门和专业部门。6.3.2系统故障应急流程和要求应按表7执行。表7系统故障应急流程和要求序号应急流程要求1准备1)做好数字城管系统故障应急的组织、人员、预案准备
10、;2)每半年进行一次应急预案的演练。2监测应通过运维热线用户反映的情况或系统巡检,及时发现系统异常。序号应急流程要求3预警1)发现系统异常后,应尽快确定故障原因以及影响范围;2)故障级别在二级以上的,应及时告知数字城管实施机构。3)启动故障应急预案,通知相应运维服务供应商,进入问题交办和跟踪流程。4处置密切跟踪并记录故障处理状态,二级故障以上的,每小时向上级部门通知解决过程和情况。5恢复运维服务供应商解决故障问题后,进行系统测试,确认故障排除。6通报故障级别在三级以上的,在发现故障后,运维管理部门应及时向受影响的数字城管各有关部门和专业部门进行通报。故障处置完毕后,应及时向上述部门进行再次通报
11、。表7系统故障应急流程和要求(续)序号应急流程要求7关闭应急处置工作结束后,运维服务供应商应对事件发生原因、性质、影响、处置过程等进行总结;根据应急处置中暴露出的管理、协调和技术问题,改进和完善预案。运维管理部门在故障结束一周内应向上级部门提交故障处置总结报告。6.4系统更新要求6.4.1系统更新应不影响系统正常运行,更新时间应尽量安排在系统停运期间或晚间系统停用时段。6.4.2系统更新提出方、实施方、实施时间应符合表8规定。表8系统更新提出方、实施方、实施时间更新类别提出方实施方实施时间硬件更新基础设施供应商基础设施供应商系统停运期间实施(故障应急维修可在硬件停用时实施)软件更新应用软件开发
12、商应用软件开发商系统停运期间或不使用时实施数据更新系统运维管理部门应用软件开发商及其他数据供应商系统停运期间实施6.4.3系统更新流程和操作要求应按表9执行。表9系统更新流程和要求序号更新流程更新要求1更新准备1)更新提出方应向运维管理部门提交更新申请:2)风险较大的系统更新应提交更新预案;3)完成应用软件的测试。2更新审核1)运维管理部门应根据提交的更新材料,包括应用软件测试报告等,决定是否更新、更新时间和条件;序号更新流程更新要求2)运维管理部门确定更新后,应及时发布更新通知,并告知各相关单位、部门。3更新实施1)实施更新前,更新人员应做好系统备份工作:2)实施更新应执行规定的更新方法和更
13、新步骤:3)软件更新宜每月集中操作一次,并在系统规定运行时间外实施。硬件更新或数据更新宜安排在系统停机检修期间;4)部件或基础地形图数据更新后,应对信息采集器系统数据进行同步更新。更新验证1)更新完成后,应由实施方进行验证测试;2)应用软件验证测试结果应与更新审核时提交的测试报告相对照;3)软件更新验证测试完毕后,应删除所有测试数据。5更新运行1)更新后系统正式运行第一日,更新实施方应派支持人员现场解答系统使用疑难问题和处理I系统突发事件;2)运维管理部门应于更新后系统正式运行第一日,将需求更新情况告知需求提出人。6更新评定需求提出人和使用人应根据更新后系统使用情况,在更新后两周内对更新结果进
14、行评定。6.5 安全管理要求安全管理要求应按表10执行。表10安全管理要求序号安全管理内容安全管理要求1系统安全对防火墙、入侵检测、漏洞扫描、安全审计、防病毒、流量监控等安全系统软硬件功能检测,按相关安全规定执行。2网络管理1)编制网络规划设计方案:2)对主要的网络设备应进行定期导出网络配置操作,周期可每月操作一次:3)开展网络日常管理监控。3主机管理1)对所有服务器进行定级,对核心服务器(如数据库、应用服务器)进行定期病毒和恶意软件扫描,形成分析报告;2)每月一次检查系统漏洞情况,关闭WindoWS系统自动更新功能,统一进行漏洞更新。4数据管理1)对系统所有案卷信息等核心数据进行的操作,应经运维管理部门审核;2)核心数据操作应在系统停运期间进行;3)核心数据须建立本地灾备(有条件的可采用异地灾备);O定期对核心数据的使用情况(如图片存储情况,数据库表空间大小等)进行巡检;5)对涉密数据应按保密