《分布式存储在云环境下的应用和部署.docx》由会员分享,可在线阅读,更多相关《分布式存储在云环境下的应用和部署.docx(14页珍藏版)》请在优知文库上搜索。
1、随着互联网数据规模越来越大,并发请求越来越高,传统的关系数据库系统在性能、价格、可扩展性方面已经不能很好地满足需求.谷歌、亚马逊等互联公司率先在后台基批设施中引入超大规模分布式存储系统,用来解决海量数据的存磕问题.与传统的集中式存储技术不同,分布式存储没有将数据存储在某个特定节点上,而是通过网络将各个节点分散的存储资源汇聚成一个虚拟的存储备,将数据分散在各处.相较于集中存储,分布式存储成本低,扩展性好,弱化了关系数据模型,可以得到高并发和高性能.1分布式存储概念及特点分布式存储系统,是将数据分散存储在多台独立的设备上.传统的网络存储系统采用集中的存储服务器存放所有数据,存储服务器成为系统性能的
2、瓶颈,也是可靠性和安全性的焦点,不能满足大规模存储应用的需要,随着各行业数字化转型的加速,越来越多的数据被生产出来,分布式存储成为我们应对海量数据挑战的由要助力.从20世纪80年代开始,历经几十年的演进,分布式存储已经走过了四个阶段:第一阶段是1980年代的网络文件系统,通过少量服务器实现网络环境下的简单文件共享;第二阶段是1990年代的共享SAN文件系统,已经能够外接SAN设备实现更大的文件系统;第三阶段是2000年代的Share-Nothing存储,开始利用通用服务器构建起高扩展的存镭系统;第四阶段是2010年代逐步产生的企业级云存储,这类存储开始具备丰富的企业特性,存储性能、效率和数据保
3、护能力有了显著的增强,开始在各行各业中广泛应用.的规模可以动态伸缩,满足应用和用户规模增长的需要;6)按翕服务:云是一个庞大的资源池,你按需购买;7)廉价性:由于云”的自动化集中式管理使大量企业无需负担日益高昂的数据中心管理成本,云”的通用性使资源的利用率较之传统系统大幅提升,因此用户可以充分享受“云”的低成本优势.3分布式存储在云环境下的应用场景3.1分布式存储系统架构云和AI时代,数据迎来海量增长。高速SG通信、商清8K视频、自动驾戚和大数据分析等越来越多的新兴应用正逐步推高对数据存储的需求.企业不断扩展业务边界,整合云场景存硫资源,以更低TCO(TotalCostofOwnership)
4、,更灵活的弹性部署应对非结构化数据快速增长.在这样的背空下,分布式存储架构成为了首选。各存储厂家纷纷推出自己的分布式存储产品,通过存储系统软件将每个硬件节点的本地存储资源组织起来,按需为上层应用提供文件存储、对蕊存储、大数据存储和块存储服务.实现海量数据储存更经济、多样性数据使用更高效、在线业务承载更可靠,其系统架构如图1.w三云/虎队化总资若也大Ing存一分离3H(S测序图1分布式存储系统架构图”目前大多分布式存储产品都会提供基于三层的分布式存储架构,会融合分布式文件、对象、大数据和块多个服务形态,支持文件、对源、大数据服务部署在一个集群,并统一管理,整体功能架构由存储接口层、存储服务层、存
5、储引擎层和存储管理组成,如图2所示,此外还会提供一些杀毒、异构开源存储管理的特色功能.MFS/CIFSHDFSPOSWMPISCSISCSIPEST/SNMP图2分布式存储软件功能架构,分布式存储系统具有海量数据储存更经济、多样性数据使用更高效、在线业务承载更可靠等优势,已被广泛应用于如下场景:1)HPC(HighPerformanceComputing)场景:在气象、基因、石油等HPC高性能计算场景,应用对分布式存储的性能要求高.文件服务提供的DPC可减少跨网络传输延迟,并提供标准接口给应用,在不修改应用的情况下提供比标准协议更高的性能。2)内容存储、备份归档场景:高性能、高可克的企业级对象
6、存储资源池可满足互联网数据、在爱音频/视频、企业网盘等实时在线业务吞吐量大、热点数据频繁访问的业务需求,以及长期保存、在线访问需求,例如应用于金融电子票据影像、双录(录音/录像),医疗影像.政企电子文档和车联网场景存储、备份或归档.网络接入集群系统分布式系筑文件系统网格计算存储虚拟化节点1身份认证AM接口、应用软件、Mb版务等节点2访向控制用户访问层蚊据雇务层内容分发故据压缩故据去元计费故据加密数据&份数据容灾数据管理层存储集中膏理状态腔控故推存静层节点3节点N图3云存储系统架构用户访问层是基于云存储开发的应用程序的入口,授权用户可以通过标准的公共应用接口登录云存储系统,享受云存储服务。云存储
7、产品服务商不同,云存储提供的访问类型和访问手段也不同.数据服务屐是利用云存储资源进行应用开发的关键部分,云存储平台通过数据服务层为用户提供统一的协议和编程接口,进行应用程序的开发.应用接口层是云存储最灵活多变的部分.不同的云存偌运营机构可以根据实际业务类型开发不同的应用服务接口,提供不同的应用服务。数据管理层是云存悻最为核心的部分,也是最豆杂的部分.数据管理层采用集群技术、分布式存储技术,实现多存储设备之间的协同工作,对外提供高可用性、可扩展性的服务,同时还负责数据加密、备份、容灾以及必要的计斐等任务.数据存储层是云存储最基础的部分,由不同类型的存储设备和网络设备组成.数据存储屋实现海景数据的
8、统一管理、存储设备管理、状态监控等.存储层位于云存储的最下层,它是云存储中最基础的部分.存储设备的选择多种多样各种存储设备都可以用来构建这一展.云存储中的存储设备通常数飙众多且分布在多个不同位置,彼此之间通过互联网或者光纤通道等把各种网络连接在一起。分布在存储设备之上的是一个统一的存储硬件设备管理系统,通过这一层可以实现存催设备的逻辑虚拟化管理、多链路冗余管理,以及硬件设备的状态监控和故障维护。在行内分布式存储主要以分布式SAN为虚拟化资源池提供服务,以分布式文件为媒体/视版监控/HPC提供服务、以分布式对蕊为备份归档提供服务,以分布式数据库为大数据服务.3.2.1 为云平台底座提供基础存储资
9、源云环境下,分布式存储系统能够实现计凭资源和存储资源的单独横向扩展,计第资源不足时直接扩容计算节点,存镭空间不足时只需扩容存储节点,极大地节省硬件资源降低成本.对于云平台中部署的轻量级企业关键应用程序,可选用中等性能的磁盘类型,满足性能要求不高但是要求具有丰富的企业级特性场景,例如普通数据库、应用VM,中间件VM等数据存储需求,通过云硬盘的形式挂载给虚拟机或裸金属服务器使用,满足企业用户应用数据的存储需求.分布式存储在云平台提供基础存储服务,通过弹性云硬盘的形式提供给应用虚拟机和裸金属使用,在应用对性能要求不高的情况下,通常在初期用于渠道类应用、各类外围应用、灰度发布应用、容器技术应用、京面以
10、及开发测试环境,采用分布式存储做云平台底座存储设备,提供弹性扩展、存算分黑、存储类型可选、EC纠删可靠和高并发等便捷场景服务的作为结合点.为了应对互联网金耿带来的业务浪涌,除核心账务系统采用集中式高端全闪存储外,外围业务以及海最非结构化数据业务场景已经全面向分布式存储过渡.凭借分布式存储的弹性资源分配能力,金融行业的新业务开发和部署效率相比传统存储都有所提升和加速,突发资源获取周期从过去的天级缩短到小时级,资源池化后,存储效率得到显著提升,运维斐用也不断降低,整体TCO实现有效压降.银行的七大类业务系统(账务处理类、业务处理类、渠道服务类、服务支撑类、外联三方类、数据服务类、办公管理类),在与
11、金融云平台和分布式存储架构功能特点的结合中,我们对各类系统的资源需求变动、业务迭代速度、数据一致性要求、并发要求进行分析,得出云平台中适用的业务系统类型,如表1所示,进而为选择和配置云平台中各区域分布式存储提供依据。表】云存储系统架构“银行系统分类资源需求变动业务迭代,数据一致性并发要求“云平台适用性,账务处理类“低,慢,高“低,业务处理关“低3快“中.高6中.渠道at务类“快2低“较加距朦务支撑类“ffi,慢,低低“高*外联三方类“低,慢“高3高3低:数据服务类:,慢”中“高”中.办公管理类“高N快“低3较高“高3.2.2 为云平台提供分布式数据座存借资源在云计算平台中,传统数据库以OraC
12、le、DB2谟者HySqI的关系型数据库为主,但是当胞表数据量爆炸或者单个数据库无法承受高强度I/O时,集中式数据库是无法解决性能和数据处理粒颈问题的,难以应对应用层的高并发数据访问t业务核心数据用使用场景需要支持应用高峰期的密集访问,要求磁盘具有持续稳定的岛性能和低时延,通过选用超高性能的破盘类型,可以实现超演性能与超高可赤性的集合,满足关系型数据库等数据密集型场景卜低时延、福0性能密度的严苛性能要求.在基于MySQ1.的分布式数据座中,分表支持动态漂移,随着表的热度和大小进行动态的扩容和伸缩,保证资源分配最优化;而分布式存储节点可以无限水平扩展,从而提供可动态无限扩展的存储容量;性能随节点
13、扩展而线性增长,满足云计箕平台对容量和性能的需求,具备云服务所有的弹性、敏捷、按需和轻运维特性.因此,采用分布式存储优化后用于数据厮的数据存储,提高性能的同时确保了数据的安全性.在金融及其他领域,基于分布式存储加速多域融合,实现降本增效,通过对非关键业务进行云化部罟,并使用分布式存储构建统一的云资源池,实现多域融合.云资源池替换传统存储的烟囱化建设,大幅提升了存储资源的利用率,业务上线时间也大幅降低,为金融行业降本节支提供了很大助力.4分布式存储在云环境下的部署国内分布式存储相对于集中式存储而言是一种分布式技术,是在规格维度上按照扩展性进行分类的,国际上则是按照架构将存储分为企业级存储和软件定
14、义存慵.不论企业选择存储产品的资本与管理支出模式,也不论存储厂商是否能够真正做到分布式存幡的软、硬件解耦,本文暂定已经完成了对比集中式存储的全面而细致的选型评估过程,结合企业自身情况对分布式存储能第物善其用的前提下迸行下面的实施与部署,对冷热数据分展、数据湖建设需求以及高可用性要求能够充分考虑,如果多个AZ在百TB级别以上,建议进行较为合理的规划。在云基础架构中,分布式存储有两种部署形态,融合部署和分离部善,融合部署多用于云平台管理区域服务的使用,分布式存储多用于用户业务使用.根据交换机组网形态分多种组网形态和部署方案,如存储节点前后端共享网络和前后端独立网络部署方案以前后端独立部署为例按照前
15、后端网口的类型又可分为IOGE.25GE、100GE,IB网络四种类型(IOGE前端+10GE后端、25GE前端+25GE后端等),本文以IOGE前端+10GE后端独立组网为例,阐述云平台内分布式存储系统的部署方式.4.1组网规划规划云平台各网络平面时,对分布式存储业务网络平面、存储网络平面和管理网络平面进行合理规划,如图4和图5所示,针对各个网络平面进行规划设计.同时,针对物理硬件设备进行角色梳理和机柜位置合理规划,管理节点(管理分布式事务进程的服务器,负责块存储服务的告警、监控、日志、配置等操作维护功能)、存储节点(提供存储资源的服务器)、计第节点(运行应用系统的服务器),根据不通功能角色规划不同网络平面地址.D业务网络(iSCSI网络)用于计算节点和VBS之间通过iSCSI协议进行通信.2)BMU管理网络:BMC网络,用于接入节点Mgmt接口,提供远程硬件设备带外管理功能。3)存储网络:用于VBS和OSD间或者OSD和OSD间数据通信.4)容灾巨制网络:用于主端存储系统和从端存储系统间网络的数据传输.图5分布式存储物理组网“图4分布式存储组网架构4.2 节点网口规划根据组网规划,分别对计算节点、存储节点的网口进行