《如何设计数据备份系统.docx》由会员分享,可在线阅读,更多相关《如何设计数据备份系统.docx(6页珍藏版)》请在优知文库上搜索。
1、引言对于企业来讲,数据备份是信息系统容灾的基础.它是指为防止逻辑错误以及物理错误导致数据丢失,而将数据集合从应用主机的存储系统包制到其它的存储介质,数据省份对r任何企业都是it的关键性工作,它自接决定企业时数据威胁及事故的应对灵活性和应对水平。近些年来.陆着互联网相关科技的飞速发展,数据本身发生了极大的变化,从数据量级、数据形态、数据关联等多方面都发生了翻天覆地的变化.这无疑对数据备份系统的设计规划提出r极大的挑战,囚此,有必要明确数据备份系统设计的清晰逻Hi思路以及必要的分析步骤。1 .确定备份对象及数据特性苜先,所谓确定备份对象就是要决定哪些数据需要备份。我们需要确定数据的重要性程度.本文
2、通过结果导向的思路从以下维度来分析企业数据的重要性,最终决定哪些数据需要备份,哪些数据可以不备份,哪些数据需要根据企业的实际业务情况来决定。首先我们银定一个结果,那就是某个应用系统的某类型数据由于硬件故障或者其他原因导致数据丢失掉了.那么就看企业对该结果的容忍程度,蜴设不能容忍,那么就没什么好商员的了,肯定要做备份.有行业监管标准的通常会按照监管标准确定数据的至要性,没有行业监管的通常需要按照数据对企业的经济膨响和社会影响程度来确定。无论是哪一种方式,S终都要以量化的形式确定下来数据的分级标准.接下来,就是要根据确定下来的备份对象来分析它的IT特性和业务特性.所谓IT特性就是数据在量级、形态、
3、发展等方面展现出来的特性.近些年来,企业的数据逐渐呈现多元化格局,传统分析方法可能会以简单粗昼的方式,将数据分为结构化、半结构化、非结构化.但是近些年来随着互联网的不断发展和扩展,数据已不能简单地以数据模型特点来划分了,很多数据展示出来混合模式的特点.并且在半结构化和非结构化归类当中需要更加细分,例如:(1) .NoSQ1.&NewSQ1.数据库中的文档、JSON,键值等类型数据。(2) .以ASC方式记录的文本、PDF、XMI等文件形式的数据.(3) .以二进制方式记录形成的图片、网页等数据。(4) .以视频流方式记录形成的媒体类数据.所谓数据的业务特性就是不同数据之间的业务关联性,割裂了业
4、务的关联性,即使数据%份可以很好地完成,但是数据恢复是无法完成的,因为多种数据只有通过业分的维度联系起来才能形成业务层面可以识别的业务信息.因此以应用系统为单位的数据关联性分析也是必不可少的步骤。2 .确定数据备份策略所谓数据备份的策略,从大的维度要确定哪些数据全量备份?哪些数据增量备份?哪些数据需要差Sl备份?从细的维度要确定备份的频度、模式、窗口等各种必要因素。这部分内容需要考虑到数据本身的量级、数据的具体类型、极端条件下对数据恢复时间及数据丢失量的容忍程度、数据备份系统以及备份介质本身的性能特性、业务发展的规模及趋势判断等等。同样会从以下几个维度进行评估:(1) .数据库里面的结构化表数
5、据,这部分数据通常是比较电要的.一般来讲既要有全量的备份,也要有事务日志的差SJ备份.全JR备份的频度需要、副本数缜、时间需要综合数据的量级、变化的速度、业务的繁忙窗口等综合考虑。归档日志的备份频度、备份源选择、备份作业发起的时间、备份的窗口需要根据归档速度以及业务要求的RTO目标等来进行综合评估。(2) .可单独利用的文件类型数据,主要包括一些可以单独恢复利用的的日志、图片、PDF等.该类数据一股情况下数据最级较大,但是否要性相对而言偏弱.因此需要结合现有备份工具确定全量备份和增量备份的相关因素。(3) .需要结合结构化信息利用的文件类数据,一般是通过业务系统端有序将结构化信息和非结构化文件
6、读取、校验、转化等最终转化成业分端可以识别的有效信息。这类数据的备份不仅仅要考虑通常的策略因索,还需要综合所有涉及到的数据,以恢笈目标为依据来决定最终的备份策略,3 .确定数据备份工具及备份介质所谓数据备份的工具,就是采用什么样的备份软件.备份软件有很多,市场上备份软件非常多,传统的备份软件有EMCNetWorker、Smvault等,近些年来随若云计算的不断发展,一些新型的面向云计晓领域的备份软件也不断涌现.但是作为企业来讲,选择备份工具更里要的是要根据备份数据的特性来选择,在符合数据特性的基础之上再来选择工具的技术标准(备份速度、恢复速度、实现功能、兼容性、稳定性等).通甫对于事务性的数据
7、备份工具,要考虑到备份工具本身对数据恢复时的事务支持.对于海景非结构化数据的备份要考虑到备份工具的效率问题,备份软件底层对数据的识别原理决定了其本质效率.可以采用具备快照功能、对蕊识别功能的工具来大幅提升备份效率.所谓数据备份的介质,就是采用什么样的存储设备.传统备份介质包含毡带设备、通用NaS存储、物理或虚拟带库、光存储、DalaDOmain等,近些年来随若云计卯的发展出现了很多具备数据的价功能的分布式对象存储,还有公有云上的一些具备备份功熊的资源池资源.企业选择什么样的备份介质同样取决于数据的情况。主要决定备份介质的因素包括其备份的效率、空间以及成本,数据的恢复目标决定了备份介质的存取效率
8、要求,数据的量级决定了第份介质的空间要求以及扩展要求,数据的巾要性及安全要求决定了存砧介质是否可以采用公有云资源.在符合以上原则的前提下,遵循最优的性价比.4 .确定数据智份系统架构企业的备份系统不是单一的备份工具,它是包含了数据、IM.介质、恢宾等各方面的有机整体,需要将选择的各类元素进行有机整合,形成完备的数据备份和恢宜系统.在进行整体规划之前,需要先解决以下几个问题:(1) .备份系统的网络架构是私有还是混合?取决于是否利用外部云资源.(2) .备份系统是否有双备份域的要求?取决于数据中心整体容灾要求.在解决了以上几个歪要问题之后,接下来就是对于备份系统当中各个元素以及其组合方式的规划和
9、设计工作了,具体说来包含以下几个方面:(1) .数据客户端层:要备份的数据保存在哪些服务器?保存在哪些位置下?需要安装哪些客户端代理或者部署哪些软件脚本?安装部署的具体方式是不是要采用集中管理的模式?(2) .数据备份过程控制层:主要包括备份主服务器和备份作业服务器,主服务器根据配置好的调度策略以及整体架构中的备份元素发送作业调度指令,并且将存储片的元数据存储到主服务器上的数据库当中.然后作业服务器可以通过与客户端的交互完成具体备份作业.这里除了需要考虑到功能上的基本元素配置问题,还需要考虑到商可用及性能要求,通常采用分布式架构可以解决.(3) .数据存储层:备份数据最终要存储的地方,可以通过
10、光纤网络或者以太网络实现其与备份控制展的连接.传统模式一般会是光纤网络和虚拟带库的组合模式.其优点在于备份速度和容量的性价比上.但是近些年来随着以太网技术的发展,利用高速网络实现的备份数据传输同样可以保障其备份速度,同时具备更好的灵活性。另外,数据存储层还需要考虑到归档、离线、在线等数据生命周期和存储介质的映射关系以及数据的流动瞅序.(力,数据恢发层:通常数据恢发实际发生的概率非常低,数据恢次也茶木上是在数据的燃始存放位置进行快红。但是为了保障危急时刻的有效性,很多企业的IT部分要时备份系统功能进行定期验证,这个事后就需要异机恢更.因此考虑好具备有效性验证的数据恢复资源,并将其融入(网络、空间
11、、配设、应用)到备份系统当中也是必须考虑的重要一环。5 .优化备份作业调度通常按照编制好的作业备份表进行备份调度之后,会产生一些问题.比如:备份作业过度集中于某一个时间段,备份作业频繁挂起,备份作业影响网络性能等等.引起着一系列问题的原因在于以下几个方面:(1) .业务RTO目标与备份作业频度的不平衡.按照业务RTO的过高要求,数据备份的频度和数据备份的效率无法满足,这个时候需要考虑结合数据阵本身的归档配笆参数、数据备份工具的效率参数.承载业务本身的硬件性能等多个方面进行调整,从而达到平衡状态.(2) .全量备份作业的时间窗口没有周期性进行调整.通常来滋全量备份的作业时间必须在规定的时间窗口内
12、完成,否则就会影响网络性能。但是全员备份作业的作业量会呈现不断培长的态势,最初设计的时间窗口已经无法满足要求,这个时候就需要根据备份作业的实际情况进行调优。一方面要从应用层面调整数据量的蕤增,该离线离线该归档归档.另外一方面要及时调整作业的启动时间和分布.(3) .业务高峰期的作业分布不够科学合理。通常我们应该针对某些业务高峰期的备份作业日志进行观察、统计、梳理,在这些特殊的业务高峰期,尽可能减少备份作业数量。一方面让备份作业在相邻周期段内趋于平衡分布,另外一方面要保障业务高峰期的备份作业适度减少.总而言之,备份作业的调度是一个长期的过程,需要管理人员经常调阅作业调度口走进行分析,从作业分布.重点时间窗口、作业调度失败情况、作业平均持续时间等多个维度桢理分析,并且需要定制合理周期将其作为常规数据备份管理工作.6 .结语对于企业来讲,数据是企业得以生存发展的关键资源,备份是保护企业数据的最后防火墙.数据备份亘接决定企业IT应对重大风睑的能力和水平。今天又是一个数据大爆炸的时代,带给数据备份的挑战也会呈现蜂拥而至的状况,作为企业的数据管理人员,用什么样的工具不重要,重要的是有明确的数据备份管理思路,思路决定最终的结果.望所思有所触,以上.