《金融大数据银行项目简介.docx》由会员分享,可在线阅读,更多相关《金融大数据银行项目简介.docx(8页珍藏版)》请在优知文库上搜索。
1、金融大数据银行项目简介XX科技股份有限公司编制目录一、金融大数据银行项目背景3二、客户情况及市场情况41客户情况42市场情况5三、技术选型6四、项目团队构成错误!未定义书签。五、团队成员技能需求错误!未定义书签。一、金融大数据银行项目背景互联网的出现让海量的企业、个人行为数据的获取、存储、管理成为可能。大数据的发展已经在多个层面推进金融机构的业务模式不断发生改变。比如,在金融产品的营销设计、风险控制、扩展服务半径等方面,大数据都深刻改变了金融机构的经营模式,有效降低了成本、提高了效率。从金融领域的视角来看,大数据在金融领域是一枝独秀,加上人工智能的兴起,规模急速地增长。在政策层面,国家多层面推
2、进金融大数据发展提供了政策支持,金融行业经过一二十年的信息化的积累,从数据到技术,人才的储备等方面,都具有非常好的优势。金融机构是大数据天生的合作者,一方面自身有着利用技术红利带来收益冲动,另一方面又有国内较好的信息化基础。因此金融大数据发展也促进了金融行业从多方面实现管理的转型和业务产品的创新,其中包括信用风险、客户服务、智能运营以及金融本身的产品。而金融行业在大数据领域里有着较好的场景应用,例如银行、保险、证券等,同时互联网公司在大数据基础上开展金融业务,这些业务跨过银行传统的信贷领域,开始向转账汇款、现金管理、资产管理、供应链金融、支付等领域蔓延。金融跟互联网的融合是一个大势所趋,金融向
3、互联网发展,互联网向金融转型,已经成为整个科技和互联网金融发展的焦点。中国是全球第二大经济国,金融业向实体经济、创新驱动的转型中,利用大数据技术,必将成为中国金融业的新增长点和新亮点。二、客户情况及市场情况1客户情况1 .数据安全与个人隙私现阶段用户数据的收集、存储、管理和使用缺乏规范,主要依靠商业银行自律,用户无法确定自己隐私信息的用途。此外,鉴于国内商业银行体制机制限制以及尚未健全的金融法律法规体系,许多金融机构担心擅自使用数据会触犯监管和法律底线,同时数据处理不当可能会给自身带来声誉风险和业务风险,因而在驾驭大数据层面难以付诸实际行动。2 .大数据应用推进和落地商业银行大数据应用虽然在风
4、控、反欺诈、征信等领域初见成效,但在其他层面暂时还处于探索阶段。究其原因,一方面只有当数据分析转变为企业业务方式后才产生价值;另一方面商业银行在新建应用系统的过程中缺乏数据思维,没有充分了解大数据分析的价值、战略和流程。同时大数据应用投资效果难以衡量,领域建模未得到充分重视。3 .大数据技术框架大数据技术框架的组成部分包括处理系统、平台基础和计算模型。首先,处理系统必须稳定可靠,同时支持实时处理和离线处理多种应用,支持多源异构数据的统一存储和处理等功能。其次,平台基础要解决硬件资源的抽象和调度管理问题,以提高硬件资源的利用效率,充分发挥设备的性能。最后,计算模型需要解决三个基本问题:模型的三要
5、素(机器参数、执行行为、成本函数)、扩展性与容错性、性能优化。这些要求对构建大数据技术框架提出了非常高的要求。2市场情况数据容量大,涵基范围广在大数据时代,金融业数据迅速膨胀并呈现出几何级数的增长态势。由于行业特性,银行业在长期业务开展过程中积累了海量数据。从数据涵盖范围来看,数据类型包括以工资、公积金、消费贷款等为代表的结构化数据和以文档、图片、音像和地理位置信息等种类繁多的非结构化和半结构化数据。以银行业为例,每创收100万美元,会平均产生820GB的数据,数据强度高踞各行业之首,而在相同创收条件下,电信、保险和能源行业数据强度分别为490GBJ50GB和20GB,由此可知金融业在大数据应
6、用方面具备天然优势。数据处理复杂,充分挖掘困难商业银行数据体量庞大,在数据处理过程中存在很多问题,主要包括:(1)数据治理体系化建设匮乏。现阶段商业银行尚未形成系统的数据治理方法和体系,缺乏有效的数据分类、整理和加工。(2)数据资源管理整合度不高,内部可用信息使用率低下。当前商业银行的数据在组织内部处于割裂状态,缺乏顺畅的共享机制,难以实现数据的有效整合和使用。(3)数据内容复杂多样,难以充分挖掘数据资源潜在价值。造成这一现状的原因在于商业银行非结构化数据占比不断上升,数据构造方法重复率高,且关系史.杂。数据资产化,应用场景丰立国内商业银行现处于数据资产化、产业化的起步阶段,且银行运用大数据技
7、术以描述性数据分析为主,预测性数据叁模为辅,以自身交易和客户数据为主,外部数据为辅。数据费产目前最主要的作用是趋势预测和决策支持,典型的应用场景集中在营销分析、内部运营和风险管控等方面,具体应用案例包括交叉销售、客户群体划分、信用评分及违约监测等。当前我国商业银行大数据应用深度、广度和频度都与国际先进银行存在着巨大差距,迫切需要拓宽数据应用层面,实现数据资产增值。三、技术选型 CDH/F1.umeKafka数据采集,结合数据流技术对接各类应用系统及数据库的数据资源 CDH/HDFS文件类数据整合与存储,HADOOP技术路线 CDHHBSE格式类数据整合与存储,HADOOP技术路线 HADP数据
8、清洗工具 CDH/YARN+CM数据负载及集群管理 HADPYARN针对数据服务及安全类应用的定制开发提供微服务运行环境技术管理工具四、项目团队构成姓名性别学历职称专业工作单位项目中的分工每年工作时间(月)签字成员A男本科高级大数据工程师应用电子技术XX科技股份有限公司项目管理12成员B男本科高级大数据工程师体甯医学技术总Ii12成员C男本科中级软件工程婶计算机科学与技术软件开发12成员D男本科高级大数据讲师计算机科学与技术软件开发12成员E男本科中级软件工程师数学与应用数学软件开发12成员F男本科高级运维工程师信息管理架构设计12五、团队成员技能需求(I)成员A云计算、大数据商级工程师擅长:
9、负责企业级云计算、大数据平台项目,大数据应用开发项目的立项、论证、险收等项目过程管理,云计算和大数据相关通识性培训。项目经历:区域医疗云计算中心、重庆三峡银行大数据平台、电信分析云项目、重庆移动业务支撑大数据平台建设。(2)成员BCIOUdera大数据专家南级软件工程师长期从事技术管理工作,对技术团队的管理和认识有自己独到的见解,善于将人员提升和管理经营有机结合。擅长技术:Windows.1.inux.Exchange,数据库、Hadoop项目管理等系统开发与管理。(3)成员C高级软件工程师擅长技术:网络通信、网络安全、数据库操作、dui1.ib,cc+0(4)成员D商教软件工程师擅长技术:P
10、ythOn爬虫程序开发、Python数据分析、1.inux系统管理、大数据存储与管理、Hadoop大数据开发、Sca1.a函数式编程、数据挖掘、云计算平台架构、Exce1.高级数据分析、图像识别、机器学习、分布式计算、数据可视化分析等。(5)成员E大数据分析师擅长技术:R语言统计分析、EXCe1.数据分析、QIik数据可视化、数据可视化建模、概率论与数理统计。(6)成员FQOudera大数据专家商叙软件测试工程师曾在上海惠普、IBM、MOTORO1.A,北京融信恒通等公司任职,擅长技术:hadoop工台设计、运维,熟悉yamhdfs/HA、mareducev1.v2,f1.ume,SqoOp、pig,impa1.a、hive、zookeeper.等相关组件集群的搭建和维护管理。