《APP运行维护服务服务方案的详细描述.docx》由会员分享,可在线阅读,更多相关《APP运行维护服务服务方案的详细描述.docx(8页珍藏版)》请在优知文库上搜索。
1、APP运行维护效劳效劳方案的详细描述1.效劳方案1)组织效劳架构工程组织架构人员分配数量姓名工程经理工程成员2应用系统技术效劳升级局部应用系统技术效劳升级局部包括前台效劳及后台效劳./会员账号系统功能模块:体彩APP系统前台“我的-注册/登录版块支持用户号码/个人邮箱进行快捷注册,填写验证码/邮箱验证码可进行校验,后台“用户治理版块可进行用户信息数据治理,可实现用户启用/停用/查看/重置密码多重功能./彩票工具功能模块:体彩APP系统前台“彩票-走势版块对黑龙江地区体彩各玩法开奖数据进行分析,支持数字彩(超级大乐透、排列三、排列五、七星彩和黑龙江6+1等)走势图等大数据分析模块,后台“彩票治理
2、-“走势治理版块可进行彩票工具系统策略设定及文案说明,便于彩民进行相关数据进行比照等./设计排版更新功能模块:根据黑龙江省体育彩票治理中央宣传部的相关要求,对整体体彩APP前端展示页面及后台治理界面进行UI设计、版式升级、界面美化等,同时完善各功能板块的突出显示及图标优化,前台开奖号样式及后台“彩票治理-“彩种治理版块可对图标进行治理./模拟游戏功能模块:体彩APP系统前台“游戏版块展示各类模拟游戏,包含即开型体育彩票模拟投注游戏及数字彩模拟选号系统两个游戏功能,其中即开型体育彩票模拟投注游戏通过模拟线下刮去涂层核对是否中奖的流程进行开发设计,可实现门不出户即可模拟线下刮奖的乐趣;数字彩模拟选
3、号系统可实现用户手动选号(注数、倍数、复式)后得悉购彩金额及可能中奖的奖金额度,后台“游戏治理版块对模拟游戏系统策略及用户参与情况进行设定和记录./开奖展示功能模块:体彩APP系统前台“彩票-”开奖版块展示黑龙江省体育彩票全部彩种及玩法的开奖数据,包含玩法规那么、开奖号、开奖详情等数据,后台“彩票治理-“开奖治理支持开奖数据录入、开奖详情文件导入(支持PDF格式),中奖情况录入(如一等奖中出注数、金额等),审核及发布功能./积分系统功能模块:体彩APP系统通过引入完善的积分系统来引导用户进行功能体验及使用,具体内容包括用户引导系统、临时活动奖励及积分兑换等.前台“我的-完善身份信息版块即用户引
4、导系统可帮助用户注册及完善相关信息,在这个过程中提供予用户小额积分奖励;前台“最新活动版块展示临时活动,实现方式为根据黑龙江省体育彩票治理中央相关活动要求开发的H5活动页面,用户如想参与临时活动需在该页面报名填写个人详细信息,参与积分奖励活动,进行排名或更大的积分奖励;前台“积分商城版块提供积分兑换功能,通过打通与黑龙江体彩积分商城的积分数据接口进行积分互通,可兑换相关积分商城礼品;后台“积分商城版块治理以上积分系统的全部功能,可实时查询用户积分奖励情况、临时活动参与情况及积分兑换明细及详情等信息.3)客服效劳/客服效劳:提供客服效劳,7义12小时值班效劳.4)端口效劳/端口效劳:体彩积分商城
5、(:/jf.hljtycp.org/index,html).5)运维(派驻)效劳/运维效劳:每个月定期巡检;故障诊断;流量分析;通讯线路检查;数据库优化;数据复制、备份;垃圾数据处理;配置优化;系统迁移;文档治理等./机房环境及物理检查1 .机房环境a.温度与湿度:最正确工作温度:20-25摄氏度;极限工作温度:10-40摄氏度;湿度:8-80%(在23摄氏度条件下).b同时机房要保证效劳器清洁:机房应保持效劳器清洁,假设空气灰尘过多,很容易造成资源读写错误及磁盘机中磁盘或读写磁头毁损.定时使用皮老虎、刷子去除效劳器灰尘.2 .电源电压:要求电压稳定,尖峰电压会损坏设备;电压范围:220V+/
6、-10%,即200-240V,50-60Hz;电源功率:视机器类型和系统配置而定;电源线:标准的零、地、火三相电,其中零、地电压不得超过3.0V;电源接驳:用符合电流要求的空气开关或其他设备和主机电源线接驳,保证计算机系统的可靠工作应使用稳压电源和UPS,对于冗于电源的接入,采用两路单独输入.检查效劳器、磁阵的安装、电源线主机接线符合要求效劳器状态检查:a.当效劳器处于启动和正常工作状态时,其前面板上的液晶显示屏上应无信息显示.b.当液晶显示器上出现带数字和字母的信息时,说明有硬件告警.可以通过查询相关机型的面板报警数字信息查到相应告警原因,情况严重的,那么要立即通知效劳器厂商进行问题排查.c
7、.当效劳器的状态灯出现橙黄色时,说明有硬件告警,此时要检查磁柜的电源、接线、硬盘等.如果有硬件故障那么立即进行更换和更正,如果查不出具体问题,那么需要联系相关厂商进一步诊断.d.当硬盘工作正常时,与各硬盘对应的硬盘灯会呈绿色,如无读写,那么绿灯一直亮,如该硬盘有读写操作,那么绿灯会不规那么闪烁,当硬盘损坏时或RAID出现问题时,那么硬盘状态灯将熄灭,或者呈闪烁状态:以13秒的频率有规律地、不停地闪烁.系统日常维护流程1 .系统启动系统启动正常顺序如下:首先对外设(磁盘阵列、磁带库等)加电,待所有外设加电自检完成后,主机加电正常起机.主机加电后,才能按POWER键起机.2 .系统关闭效劳器系统关
8、闭时,需要确认效劳器的效劳是否对现网业务有影响,同时需要对关闭的服务器运行中的程序进程确认,明确软件平安的关闭步骤,在进行关机操作.3 .系统与数据备份有效及时的系统备份是系统治理的非常重要的一环.当系统出现故障时,特别是文件系统被严重损坏或硬盘损坏时,常需要使用系统备份来恢复系统.在以下情况下应做系统备份:a.新装机.在硬件及系统软件安装完成后,应做系统备份;b.软件改动.系统软件或应用软件有改动时,应做系统备份;c.定期备份.对系统进行定期备份,最好每三个月做一次备份.4 .系统恢复当系统发生比拟严重的故障以致采取一般性维护手段不能在短期内恢复原系统,与上级确认后,可将最近一次的系统备份倒
9、回机器内以全面恢复系统到最近一次做备份时的系统环境,然后可将当日的数据备份再倒回系统内.至此,系统可恢复正常运行.此后,应当厂商再进行整个事件的全面分析与回忆,以期找到故障发生的原因,并采取相应举措以杜绝类似事件再次发生.5 .平安工作守那么a.统定期进行系统备份;b.当有系统变更或进行操作系统补丁安装的时候,必须作一次系统备份;c.在发现有硬盘故障的时候,注意当天的数据备份.在更换硬盘的时候,请确认当天数据备份已经完成;d.在更换敏感的电子元件,时候一定要防静电;e.在插拔外围设备的时候,请把外围设备下电;f.在进行文件删除的时候,请留意当前路径是否正确;g.在进行文件解压缩的时候,请留意参
10、数和路径.故障定位、故障排除1 .硬件故障硬件故障有很多种,对系统产生的影响也不一样,这里按其故障对系统的影响程度分:致命影响的硬件故障和只影响功能的硬件故障两类进行硬件分类:其损坏对系统产生致命影响(将使机器宕机或无法启动)的硬件包括:主板、CPU、RAID卡、电源模块、风扇、本地硬盘、内存损坏等等.这些设备的损坏等将使系统无法完成自检、引导和启动,液晶显示屏上都将有错误信息,可根据液晶显示屏上的错误码对照错误原因,如果是工作状态下出现这些硬件损坏,那么系统将被挂起或宕机.其损坏对仅对系统产生功能影响(机器不会宕机并能正常启动)的硬件包括:网卡、本地硬盘有坏块、显卡、和其他外围设备.这些设备
11、的损坏只影响特定功能,如网络功能、显示功能、访问磁阵的功能等,对于本地硬盘有坏块的情况,那么要看坏块中是否包含了重要的系统文件,如果不是重要系统文件,那么系统功能不受影响,但也建议立即更换该硬盘.故障定位和排除:液晶屏上的错误码:根据错误码确定是什么硬件出了故障,对系统来讲,原那么上必须业务切换使得损坏效劳器离线不影响用户使用的情况下,然后修复故障机器,恢复系统.2 .磁阵故障磁阵引起的故障是目前碰到的最频繁、危害最大的故障,据不完全统计,其故障覆盖到总故障的70%以上,具体来讲,可能引起磁阵故障的环节包括:磁阵硬盘、主机上的RAlD卡、与主机相连的SAS线、硬盘的位置和接线方式、以及盘柜使用
12、的电压及周围磁场、磁阵/硬盘/RAID卡等都可能造成异常.磁阵的问题是最复杂的,一般有物理损坏的原因也有环境原因,这是主因,如接线、插盘位置不符合要求、未及时查看系统告警等造成系统中断等辅因.根据经验,不管是什么硬件故障导致故障,系统都会产生告警,如果存在硬件故障时,可从状态灯上观察到:当单块硬盘出现故障或未被使用时,其面板上的硬盘状态灯会不亮,阵列的状态灯黄灯会亮.效劳器的磁阵所配置的RAID卡一般都带有一块充电电池,该电池用于在忽然停电的情况下保护RAID卡上的信息不丧失,这块电池的平安寿命一般是22000小时,差不多两年半的时间,也就是说,一般两年半以后需要更换这块电池.处理步骤:(按优
13、选方式列出,从中选择一种即可).更换效劳器配件:选择系统闲时,更换主备机RAID卡电池,可以采用:停备机一?更换备机RAID卡电池一?起备机(双机效劳)一?主备倒换一?停原主机一?更换原主机SSa卡电池一?起原主机(双机效劳).3 .网络故障由于我们应用对网络依赖很强,所以当网络出现全阻或瞬断都将对系统产生重大影响,网络故障一般可分为硬件故障(如网卡故障和交换机、路由器故障)和软件故障(网络中有IP包攻击或网络拥塞)两种情况.硬件故障:网卡对于网卡故障,每台机器都配置有至少两块网卡,所以当单块网卡或网线出现问题时,切换网卡故障排查方法:如果诊断出网卡有问题,那么关闭系统后进行更换.(如果是主机
14、,那么先手工切换为备机后再操作).由于系统在封闭网络中运行,所以发生网络拥塞的可能性比拟小,但如果网络拓扑比拟复杂的话,也可能发生这种情况,在主机上的表现为ping主机丢包严重,主机链路时通时断,数据包丧失,设备功能异常.问题排查:尽量使内部应用的机器从网络上隔离出去;如果情况仍未改善,建议配合机房查询网络;由于网络故障出现会导致远程登录失效,所以无法进行系统维护.所以建议任何一套效劳器都要配置一个维护台.4 .OS故障一般来说我们所使用的是一个比拟稳定的操作系统,出现故障一般是人为因素引起的:a.没按要求打OS补丁;b.应用程序或数据库消耗内存太多或存在内存泄漏导致物理内存被耗尽导致系统挂起
15、;c.人为删除了重要的目录或文件,如:Cdev/usr、/binsbin/etc等.故障排查:a.检查操作系统补丁是否符合要求;b.检查内存、CPIJ使用情况.2 .详细设计方案/整体系统升级方案本工程采用阿里云效劳器群组方案./软件平台升级方案本工程采用主流开源系统构建平台系统java语言)、基于JSON标准进行数据交换、中间件技术采用nginx+tomcat,数据库结构采用Mysql语言./网络系统升级方案本工程采用分散式网络配置,把效劳器、UPS和局部HUB放置在中央机房,把各子系统的线口引到各子系统所在的地理位置.系统可扩充性好,系统配置灵活,节省材料费用./平安系统升级方案本工程采用国家信息平安二级等保标准进行建设.3 .网络平安应急预案/机房停电应急举措接到长时间机房停电通知后,需在停电前停止业务、保存数据,关闭用电设备;遇到突发性临时停电时,马上了解停电原因,检查机房UPS及其它设备是否运行正常;恢复供电后,详细记录停电日志及时间原因./主机故障应急举措主机故障多由硬盘故障、处理器故障、内存故障、网卡故障及电源故障等原因引起,需定期对相应硬件设备进行检修维护.存储系统故障应急举措存储系统故障多由瞬时故障、临时故障及永久故障引起.瞬时故障时间极短,瞬间可自行恢复正常响应;临时故障需要更换硬件或重