数据仓库解决方案v0.docx

上传人:王** 文档编号:941933 上传时间:2024-03-01 格式:DOCX 页数:20 大小:312.62KB
下载 相关 举报
数据仓库解决方案v0.docx_第1页
第1页 / 共20页
数据仓库解决方案v0.docx_第2页
第2页 / 共20页
数据仓库解决方案v0.docx_第3页
第3页 / 共20页
数据仓库解决方案v0.docx_第4页
第4页 / 共20页
数据仓库解决方案v0.docx_第5页
第5页 / 共20页
数据仓库解决方案v0.docx_第6页
第6页 / 共20页
数据仓库解决方案v0.docx_第7页
第7页 / 共20页
数据仓库解决方案v0.docx_第8页
第8页 / 共20页
数据仓库解决方案v0.docx_第9页
第9页 / 共20页
数据仓库解决方案v0.docx_第10页
第10页 / 共20页
亲,该文档总共20页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《数据仓库解决方案v0.docx》由会员分享,可在线阅读,更多相关《数据仓库解决方案v0.docx(20页珍藏版)》请在优知文库上搜索。

1、数据仓库解决方案v深圳太极云软技术股份有限公司2016年1月目录(一) 概述3一. 国内信息化的现状3二. 以应用驱动,数据仓库建设应由后向前规划3三. “想大做小”(整体设计、分布实施)4(二) 系统架构5数据仓库架构6系统功能架构7(三)数据仓库建设方法8数据仓库建设8大步骤错误!未定义书签。L系统分析,确定主题92 .选择满足数据仓库系统要求的软件平台103 .建立数据仓库的逻辑模型104 .逻辑数据模型转化为数据仓库数据模型115 .数据仓库数据模型优化126 .数据清洗转换与传输137 .开发数据仓库的分析应用138 .数据仓库的管理14(四)系统功能全面介绍14企业数据门户14主题

2、分析15即席查询16多维分析工具16ETL工具17报表工具19(一)概述一,国内信息化的现状1.信息化建设的进展历史:在国内信息化建设过程中,基本上是按照当时业务系统的需求进行建设,过一段时间,假如有新的业务推出,就再建设一个新的系统,或者在原系统的基础上增加新的业务处理。这样的结果使每个系统与系统之间缺少真正的信息沟通与信息交换。2.为何要建立数据仓库:根据现状业务系统各自为政,相互独立。当很多业务系统建立后,由于领导的要求与决策的需求,需要一些指标的分析,在相应的业务系统基础上再增加分析与相应的报表功能,这样每个系统就增加了报表与分析功能。但是,由于数据源不统一导致了对同一个指标分析的结果

3、不相同。为熟悉决该问题,为了分析与决策的需要,将相互分离的业务系统的数据源整合在一起,能够为领导与决策层提供分析与辅助决策。二.以应用驱动,数据仓库建设应由后向前规划数据仓库到底应该怎么建设?我一贯的主张是应用驱动。什么样的应用呢?应用是应考虑政府管理的现状与决策层最关心的问题入手。分利用现有信息系统资源,进一步细化、量化权力清单,固化权力运行流程与办理环节,达到规范业务流程、监督个体行为、记录执法诚信、科学考核评价与提升管理精度,最终使群众的合法权益得到保护,实现权力有效监督与提升政府效能。通过分析经济进展、卫生健康、教育科技、道路交通、机构团体、生活服务、文体娱乐、安全避险、资源环境、社保

4、就业、财税金融、法律服务等这些主题的分析是否可行,应该先进行评估。这样从应用主题入手,就能够明白需要什么样的数据,来自那些业务系统与数据源,这些数据的全体进行一定的整合,按照分析的要求存储就构成了一个个数据集市(DataMart)o三.“想大做小”(整体设计、分布实施)为了避免原有业务系统相对独立而形成的一个个信息孤岛,以应用驱动建设数据仓库,往往会造成新的信息孤岛。这是由于应用往往是部门级的或者者是某一方面的应用,不能完全覆盖企业级的所有应用。当然我们这里不提倡一次建设的应用。如何避免这个问题,是我这里着重要要强调的。这里分两种情形进行设计,系统作用1 .整合业务数据在各业务系统中,数据不流

5、通,形成信息孤岛,商业智能解决方案建立统一数据仓库,整合业务数据,给管理者提供统一视图,统一决策界面。2 .支撑决策从数据中分析企业进展趋势,挖掘新的机会方法,根据数据决策,提图决策的及时性及准确率。3 .提供管理效能,量化办事效率基于系统分析内容,管理者能熟悉细化、量化权力清单,固化权力运行流程与办理环节,达到规范业务流程、监督个体行为、记录执法诚信、科学考核评价与提升管理精度,最终使群众的合法权益得到保护,实现权力有效监督与提升政府效能。(二)系统架构离线报表多维分析即席查询报表统计数据挖掘决策管理数据管理层共享数据视图数据仓库数据集市数据,层数据清洗、转换、加载信息整合服务(数据采集交换

6、)元数据管相关业务单位系统架构图在建立数据仓库,数据仓库按主题域存储各业务数据。数据来源要紧是政府管理结构的不一致业务管理系统。通过数据交换平台定期采集各管理机构的业务数据,后台数据处理工具ETL抽取、清洗数据,并加载入数据仓库中。架构于数据仓库上的系统功能要紧包含大数据门户、专题主题分析、即系查询、多维分析、自助报表的功能模块,通过这些功能模块为管理者获取数据与分析数据提供简单易用、功能强大的方法,为管理者决策及提升管理精度,最终实现权力有效监督与是升政府效能。数据仓库架构数据仓库是一个建设过程,而不是产品。数据仓库是通过对来自不一致的数据源进行统一的处理及管理,通过灵活的展示方法来帮助决策

7、支持。数据获取层实现如何从所有源系统中获得原始的业务数据,并对其进行一定的数据处理,按主题进行数据重组与格式转换,然后传送并装载到数据仓库系统中。数据仓库系统需要从多个源数据系统中抽取与汇总各个业务数据,这些数据源系统是数据仓库系统的数据来源。把上述数据源系统中的数据按照主题进行划分与组织,然后抽取并装载到数据仓库系统中。数据需要通过三个过程:数据抽取、数据转换、数据装载。这三个过程是在保证各个数据源系统与数据仓库系统能够成功连接(包含网络协议标准的转换、不一致平台之间的接口)的前提下实现的。保证把来自不一致的源数据系统的同类数据的一致性与完整性,转换完成的数据装载到数据仓库系统中。数据管理层

8、把数据存储到企业级数据仓库系统中进行集中管理。在数据存储层,数据是存放在两类数据库中:关系型数据库与多维数据库。数据存储是数据仓库系统的中心。取自多个数据源系统的明细数据,与用于分析的集成汇总数据都存储在这个中心。它在逻辑上是一个完整的库。数据使用层把数据仓库系统中的数据与分析结果提供给最终用户。按照用户的分析需求、使用报表、随即查询、多维度分析与数据挖掘进行数据展现。数据输出层的功能是使最终用户通过报表、图形与其他分析工具的方式简便、快捷地访问数据仓库系统中的各类数据,得到分析结果。提供多种数据分析方法,包含标准报表、即席查询报表、动态分析报表、多维分析、趋势预测、假设分析与数据挖掘等。系统

9、功能架构多维分析OLDP多角度、立体化、灵活动态的分析业务数据。产品简单易用,无需编写任何的代码,用户只需要通过语义层的定义就能够轻松搭建自己的多维数据模型。即席查询统计报表、指标的快速检索,帮助业务分析人员快速获得所需要的数据与统计信息。数据门户DataPortal进行统一展现,展现方式包含仪表盘、表格、报表、日历等内容,并支持用户个性化定制内容、指标等功能,实现真正的个性化服务。数据门户中展现的内容是管理者及业务人员最关注的指标,通过门户为他们获取数据提供最简单容易的方式。主题分析根据资源的组织,支持数据的深入挖掘与分析应用,跟踪、监控政策的执行情况及实施效果,让管理层熟悉细化、量化权力清

10、单,固化权力运行流程与办理环节,达到规范业务流程、监督个体行为、记录执法诚信、科学考核评价与提升管理精度,最终使群众的合法权益得到保护,实现权力有效监督与提升政府效能。报表业商业智能系统建设的重要构成部分,要紧对企业数据仓库中整合的各主题域业务数据,按照监督管理要求,面向各级部门,快速提供准确、全面、灵活的表达政府管理效能等方面实际的数据信息,为决策支持、业务管理提供有效的数据信息支撑。ETL工具:ETL是数据仓库最核心的后台组件,通过对及汇总来的不一致来源数据的抽取、清洗、加载实现数据仓库中数据的更新及流转。ETL工具(桥接器),实现了图形化及自动化的方式来配置ETL流程,极大的减轻了数据加

11、工的工作量,提高了数据准确性及处理效率。(=)数据仓库建设方法数据仓库决策分析的业务处理流程要紧分为四个阶段。1) 数据集中:各级政府部门业务数据统一汇总数据中心临时数据存储;2) 数据整理与转换:汇总后的业务数据通过ETL抽取、转换、加载到数据仓库中;3) 数据存储与管理:对数据仓库数据进行集中存储与管理、备份与保护;4) 数据挖掘与展现:用户通过前端的展现工具对数据仓库中数据进行挖掘、钻取与分析,在数据门户展现;1.系统分析,确定主题确定一下几个因素: 操作出现的频率,即业务部门每隔多长时间做一次查询分析。 在系统中需要储存多久的数据,是一年、两年还是五年、十年。 用户查询数据的要紧方式,

12、如在时间维度上是按照自然年,还是财政年。 用户所能同意的响应时间是多长、是几秒钟,还是几小时。2.选择满足数据仓库系统要求的软件平台选择合适的软件平台,包含数据库、建模工具、分析工具等。有许多因素要考虑,如系统对数据量、响应时间、分析功能的要求等,下列是一些公认的选择标准: 厂商的背景与支持能力,能否提供全方位的技术支持与咨询服务。 数据库对大数据量(TB级)的支持能力。 数据库是否支持并行操作。 能否提供数据仓库的建模工具,是否支持对元数据的管理。 能否提供支持大数据量的数据加载、转换、传输工具(ETT)。 能否提供完整的决策支持工具集,满足数据仓库中各类用户的需要。3 .建立数据仓库的逻辑

13、模型具体步骤如下:(I)确定建立数据仓库逻辑模型的基本方法。(2)基于主题视图,把主题视图中的数据定义转到逻辑数据模型中。(3)识别主题之间的关系。(4)分解多对多的关系。日时总期间讨顾客 InteQer 姓名 Characters (10)住址Charadert (40)电话Characters (15)积分NUmber (6)VPBQOlean主标示符次标识苻主标识符付款Number。S Date Tim Number (10.2)范品:目聚商品商品编号 Long Integer 数量 Short integer支付编号 日期时间 预付款项 找零 后语记录编号8i LOna InteCer

14、 VMDate &Tim。Decimal (6z2)Decimal (6.2)Number (10)主株识符Is期 展 日 述家产价 说描厂生单3 Lona InQeaerTeKLong characters (20)Date & Time Number (6r2)主标识符(5)用范式理论检验逻辑数据模型。(6)由用户审核逻辑数据模型。4 .逻辑数据模型转化为数据仓库数据模型mm*rfm文 4 XDV WwvmoEgloBU三a产品3Efc125 .数据仓库数据模型优化数据仓库设计时,性能是一项要紧考虑因素。在数据仓库建成后,也需要经常对其性能进行监控,并随着需求与数据量的变更进行调整。优化数

15、据仓库设计的要紧方法是: 合并不一致的数据表。 通过增加汇总表避免数据的动态汇总。 通过冗余字段减少表连接的数量,不要超过35个。 用ID代码而不是描述信息作为键值。 对数据表做分区。数据清理数据集成数据支领TlT3-2, 32, 1 00, 59, 48 -0. 02, 0. 32, 1. 00, 0. 59, 0. 48A115T1456数据归妁6 .数据清洗转换与传输7 .开发数据仓库的分析应用建立数据仓库的最终目的是为业务部门提供决策支持能力,务必为业务部门选择合适的工具实现其对数据仓库中的数据进行分析的要求。信息部门所选择的开发工具务必能够:满足用户的全部分析功能要求。数据仓库中的用户包含了企业中各个业务部门,他们的业务不一致,要求的分析

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 办公文档 > 解决方案

copyright@ 2008-2023 yzwku网站版权所有

经营许可证编号:宁ICP备2022001189号-2

本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!