《借助 SAP 内存数据库加速创新推进数字化转型.docx》由会员分享,可在线阅读,更多相关《借助 SAP 内存数据库加速创新推进数字化转型.docx(16页珍藏版)》请在优知文库上搜索。
1、SAPHANA平台借助SAP内存数据库加速创新,推进数字化转型1/14目录4超越数据库维护,开展突破性创新6利用列式内存数据库,加快事务处理和分析处理12构建颠覆性应用,推动创新和业务增长13借助SAPHANA,锐意创新,推动数字化转型SAPHANA平台基于单T副本执行事务处理和分析处理,能够交付时洞察尔即时采取行动。SAPHANA(驱动数字转型的创新平台)提供突破性的内存技术,支持你快速访问和深入分析实时数据,进而即时采取果断行动.该平台集创新型内存数据库与高级分析处理、应用开发和灵活的数据集成功能于一体,快业务流程,更智慧地开展业务创新,以及简/PIT珈珈OoOCOQ0X0QoOOoOOr
2、OooODOoo开展突破性创新据库和图形处理库,并配备了健库加速器.就障碍,即时采取的早期数据库的处理器内存非常有限.在运算过程中,数据库几乎次次都要访问磁盘(磁盘是主要的储存媒介).因此,响应时间受到磁盘速度的限制.为了加快访问速度,IT部门针对每个工作负载或处理类型设计了专门的数据库,比如事务处理数据库、分析处理数据库、空间数据库、预测分析数事务处理数据库专门用于捕获实际的业务数据,但这种专门的数据库在处理特定的业务要求时,需要有自己的数据副本,这就造成了数据复制和同步方面的问遨.形成了多个数据版本.为了解决这些问题,数据提取、转换和加载(ET1.)工具应运而生r旨在同步各个缄库之间的数据
3、。最终,IT架构变得异常且杂,不仅妨碍了业务灵活性,还将企业资源限制在维护系统而不是推动创新上(见图1)。尽管增加额外数据库的初衷是为了加快数据访问速度,但企业仍然缺乏可行的实时洞察,指导他们立即采取行动.依赖非实时数据,决策者既无法快速响应不断变化的业务需求,也无法获得在当今数字经济时代生存发展所需的敏捷性。反应迟钝的企业终将4皮新的市场进入者颜薇.现在,通过将先进的多核处理技术与价格可负担的服务器整合一体,SAP提供了一款内存平台,支持用户在主内存中存储和处理数据,从而大大加快数图:采用传缭库和非实时的决策流程O1.O1.1.居库:务处理(O1.TP)和联机分析处理Q1.AP)相互独立I1
4、.O1.OIO-O1.1.O1.VI,ew依也制3X公3阚.Re出M取利用现代化创新技术,制定实时决策现在,随着64位处理器和多核处理器的发展,拥有超大内存的系统已不再像过去那样昂贵和遥不可及.比如,拥有八个插槽的服务器最高支持24TB内存,每GB内存的成本只要几美元.SAPHANA正是利用这类先进技术,将数据库、高级分析处理、应用开发和数据集成整合到极具突破性的单一内存平台,并通过该平台提供实时信息,帮助企业制定即时决策,通过利用内存计算和多核处理器架构的优势,消除磁盘延迟,SAPHANA能够交付卓越的性能,将硬件应用到极致。图2:支J寺实时处理的统一内存平台1.英特尔数3三表(11te4F
5、actSheet),hgs-QIWS1.QQn1.imC1.C血ngwsrmm3rCQnmRMSmanakSummaiY,M1.利用列式内存数据库,力通过充满活力的数酿取实时瞬,提高灵活性SAPHANA平台基于单一数据副本进行事务处理和分析处理,能够交付实时洞察,支持你在当下采取行动.作为一款通用的关系数据库管理系统,SAPHANA平台将数据存储在列式表中,利用内存处理和多核处理器技术加快事务处理和分析处理。SAPHANA支持用户利用广泛使用的结构化查询语三(SQ1.)管理数据;依据原子性、一致性、隔离性和持久性(ACID)标准,以可靠的方式存储事务;并通过多版本并发控制(MVCe)管理对数据
6、的并发访问。SAPHANA不依赖磁盘访问输入,输出指令,而是使用内存访问指令.考虑到内存的不稳定性,SAPHANA将磁盘存睹作为备份,以确保数据库的持久性,并处理数据库恢豆问题.利用内筋斌存储功能,力瞅运行速度SAPHANA利用列式存储技术管理内存数据.列式存储不仅能提高处理效率,还能带来诸多好处,比如:加快分析处理速度;通过最大B艮度地压缩数据,减小数据库规模;以及消除索引.加快分析处理速度与传统的行式数据存储方法相比,在执行分析处理时,列式数据存储方法的优势明显.尽管关系数据库是将数据存储为由行与列组成的二维表,但数据是按线性序列排列在内存和磁盘中.如图3所示,行式数据库和列式数据库都是按
7、记录顺序存储i图3:行式表和列式表存储列存储国家,地区产品销St美国美国日本AS产品A产品B产品A产品A3.0001.250|700450当执行常用数据库查询时,比如筛选特定列并针对特定列执行运第“,列式数据库提交结果的速度将远远超过行式数据库。这是因为列式数据库只需要读取少量邻近的内存位置,而行式数据库则需要扫描整个表.比如,当你运行查询,在列式数据库中查找总销隹量时,需要扫描整个表;但在列式数据库中,只斋扫描销量列最后面的几个值即可.以更少的内存处理更多的数据借助SAPHANA的词典编码技术,你能够将字符串值转换成整数,并利用高速CPU缓存(比如,1级缓存、2级缓存、3级缓存)处理更多数据
8、.此外,SAPHANA还采用了多种压缩技术,比如前缀压缩、行程长度压缩、集群压缩、稀疏矩阵压缩和间接编码压缩,这样就可以在内存和高速CPU缓存中存储和处理更多数据。SAPHANA平台还能根据列中的内容自动选择适当的压缩算法,因此能最大限度地压懒处M消除索引借助SAPHANA平台,你能够高速访问田唠据,而不需要数据库管理员创建索引。在列式存储中,每一列就是一个索引.这意味着,你不必创建索弓I,无需留出存储索引的空间,在处理事务的过程中,也不需要通过额外的处理来更新索弓I。现在,你的系统管理员能够将更多时间用于支持创新项目,而不是解决现有应用和报告的性能问题。消除预先聚合的数据和物化视图如今,商务
9、应用纷纷采用聚合表或物化视图来加快报告和仪表盘的速度.这些表需要在事务处理的过程中不断更新,并借助额外的批处理操作定期更新.由于大多数报告都依赖于这些预先聚合的中间表,因此只有按照数据预聚合的属性和级别进行杳询时,业务用户才能快速得到结果.举例来说,如果你的销售数据是按天、月、季度和年度;口信的,而不是按地区、国家、省、市汇总,你就无法快速获取按地区或国家编制的报告。借助内存列式存储技术,SAPHANA能够以聚合大量数据。此外,由于传统报告依赖预聚合表来显示汇总数据,因此用户很难向下钻取详细信息。借助内存列式存储技术,SAPHANA能够以前所未有的速度和特别的方式聚合海量数据.这意味若,用户可
10、以基于任何属性,快速汇总任何级别的数据。而且,他们还可以从汇总数据向下钻取详细信息,确定需要砌支持并行处理,提高处理效率采用列式存储方法,你还能利用多核处理器架构并行处理数据.每个处理器可以并行扫描一列数据或其中的部分数据,这有助于优化硬件利用率(见图4)。利用单一数据副本,加快事务处理和分析处理SAPHANA平台的内存列式存储技术针对写入操作采用经过优化的内部增量存储,无需复制数据,即可基于单一数据副本快速进行事务处理和分析处理。通过基于单一数据副本执行事务处理和分析处理,SAPHANA能够充分利用硬件资源,帮助你高效处理大规模的数据。这也意味着,你可以实时洞察充茜活力的事务数据,从而立即采
11、取相关行动(胸5).图4:多核处理器架构图5:基于单一数据副本进行事务处理和分析处理,交付实时洞察核心1核心2SAPHANA平台:联机事务处理(O1.TP)和联机分析处理(O1.AP)集于一体核心3核心4O1.O1.1.I1.O1.OIOMIO1.1.O1.SAPHANA上午10:00:00当百泌3三HH三上午10:00:01SAPHANA能基于单Tm居副本运行事务处理、分析处理和高级分析,支持下Tg用,将不可能变为可能。现在,你可以利用预测分析功能,构建提供建议的应用,层至利用机器学习技术完成部分处借助SAPHANA提供的工作负载管理功能,你可以确保混合处理简单或复杂的事务,并执行长时间运行
12、的分析直询SAPHANA配备了专门的工作负载管理器,帮助控制并行处理活动,并确定处理活动捌尤先I酹.支持单指令多数据流处理凭借单指令多数据流(SIMD)处理器指令,支持并行处理的多核处理器架构以及高速CPU缓存(1级、2级和3级高速缓存),SAPHANA能够进一步提升数据处理速度。相比通过主内存处理数据,通过CPU高速缓存处理数据的效率极高.凭借列式存储架构和先进的压缩算法,SAPHANA能终将更多数据保存在CPU缓存和主内存中。SIMD支持处理器根据单一CPU指令,对力哦至CPU缓存的多个值同时执行运算(见图6).XopY数据源数据源图6:借助支持SIMD的SAPHANA平台,加快处理速度支
13、持SIMD、X4X3X2X1.运算,Y4YJY2Y1.4opY43opY3X2opY2X1opY1支持开放标准,加速应用开发应用开发人员可以使用SQ1.语言,并利用JDBC、ODBC、ADO.NET,ODBO.MDX和XM1.A新放标准与缄库交互,从而脸基于SAPHANA的下T弋应用.SAPHANA本身支持开放数据协议和JavaScript标记,因此开发人员可以相对轻松地创建能够在台式电脑、笔记本电脑、平板电脑或智能手机上运行的基于Web的应用.支持开放标准还意味着,你能够简化将现有应用迁移到SAPHANA平台的过程,尽可能减少相关的变动.借助内SS的应用服务器,SAPHANA还支持Java、
14、JavaScript.NodeJS和C+运行时等编程语言,有助于加快应用开发.以经济高效的方式管理海量数据SAPHANA专门设计用于处理海量数据.借助动态分层功能,你能够将不常用的数据保存在磁盘而非内存中,这样,你就可以清楚明了地处理大量数据,并有效平衡价格与性能.利用多重存储分区表,你无需为内存和磁盘定义单独的表,就可以将数据分区存储在多个内存和磁盘存储层中.多毛存储表支持你根据范围分区、哈希-范围分区(hashrange)和范围范围(range-range)分区,选择时间范围,支持数据老化任务.无论是将数据存储在内存还是磁盘中,你永远都不需要复制数据,而是可以直接通过应用访问数据.借助而且
15、无需复制即可清楚明了地处理大量数据。IOJI4SAPHANA采用列式存储设计,并且支持先进的数据压缩算法,因此与处理未压缩的数据所需的内存相比,SAPHANA需要的内存少之又少。该平台支持单节点和分布式硬件配置.截至2017年6月,SAPHANA可以期高达20TB的单节点硬件配置,以及包含94个群集节点(每个节点具有3TB的内存)的分布式硬件配岂。(如需了解SAPHANA支持的平台和配置的最新信息,请访问httDs4w,dmcJexa2014-09-02-hana-hardVareenENndex.htm1.)而且需要数媚库管理员的协助.无法灵活地添力的IJ来捕获新数据给企业应用软件提供商带来了许多麻烦,为了满足全