《知识图谱平台技术方案.docx》由会员分享,可在线阅读,更多相关《知识图谱平台技术方案.docx(69页珍藏版)》请在优知文库上搜索。
1、目录一、项目概述41. 1项目名称41.2 项目性质41.3 建设依据41.4 项目建设预算41.5 建设的目标41.6 建设内容51.7 建设原则9二、系统功能需求102.1 总体框架设计102.2 业务逻辑示意图122.3 系统功能需求121 .*数据采集及文本智能分析需求132 .*内外部数据融合系统功能需求分析143 .知识图谱构建系统功能需求分析154 .*知识图谱应用系统功能需求分析182.4子系统功能需求201.*信息数据采集子系统功能需求20一、数据采集方式20二、数据来源及需求20三、数据采集需求32四、数据对接需求34五、数据核查需求392. *信息资源处理子系统功能需求3
2、9一、*数据资源库平台建设需求39二、*知识图谱建设需求403. *知识算法及建模子系统功能需求41一、*知识图谱建模需求41二、经营分析建模需求42三、行业对标建模需求42四、风险预警(R值)算法需求42五、*总体情况建模需求42六、企业分布建模需求42七、行业分布建模需求42八、土地分布建模需求43九、物业分布建模需求43十、软实力建模需求434.知识图谱管理服务子系统功能需求43一、知识管理需求43二、知识检索需求43三、知识展示需求44四、*百科需求44五、文档在线浏览需求44六、图谱分析需求44七、各类服务需求445.知识图谱应用服务子系统功能需求44一、*门户需求45二、经济地图需
3、求45三、经营分析需求45四、行业对标需求45五、风险预警需求45六、*画像需求46七、关联挖掘需求46三、非功能性能要求463.1 系统技术路线要求461 .技术框架462 .基础软件473 .部署要求484 .网络环境493.2 系统性能要求503.3 信息系统安全要求513.4 关联系统和接口要求511 .与OA办公系统对接522 .与*监管系统对接523 .与*市政府数据统一开放平台对接534 .与第三方数据对接533.5 其他要求53四、项目本期信息资源采集目录54一、项目概述1.1 项目名称知识图谱辅助决策平台建设项目。1.2 项目性质新建。1.3 建设依据本项目建设主要依据以下文
4、件:根据事件情况编制1.4 项目建设预算1.5 建设的目标建设目标:实现*对其下单位的实时高效的监控。站在*市*全委的高度,利用大数据、人工智能、云计算等新一代信息技术,以应用促发展,紧密围绕*市*中心工作和*监管工作需求,按照模块化、集成化、平台化的建设思路对智慧*知识图谱辅助决策平台进行统筹规划、合理安排。采用大数据、人工智能等最新监管手段,实现数据采集实时化、业务处理自动化、信息利用共享化、业务流程协同化、决策分析智能化。转变传统监管方式,实现数据采集实时化、业务处理自动化、信息利用共享化、业务流程协同化、决策分析智能化。实现数据化监管目的,建立“用数据说话、用数据决策、用数据管理”的工
5、作机制。实现“精细洞察企业、监控内外风险、驱动精准监管”目的。自动探测风险、实时预警,对企业潜在的风险提前预警,事前准备,快速应对,减少损失,确保国有资产保值增值。挖掘事件关系,辅助决策,对监管企业各类错综复杂的事件关系,如产权、经营、风险、担保、涉诉等事件关系,用图谱方式串联起来,呈现幕后的关系,辅助经营决策。各子系统目标如下:1)通过*信息采集子系统建设,采集*内部数据、近5000家控股及参股的监管企业数据和第三方数据,汇聚成数据源,为*数据资源库及知识图谱库提供数据基础;2)通过*信息资源处理子系统建设,对采集的数据进行清洗、分析、整合,形成*数据资源库和专题库;专题库为知识图谱构建提供
6、数据;3)通过知识图谱管理服务子系统建设,向*业务提供*知识图谱管理功能和服务;4)通过*知识图谱应用子系统建设,实现经济地图、经营分析、行业对标、风险预警、关系挖掘等各种应用,为*及企业提供决策支持。1.6 建设内容1) *信息采集子系统开发:开发采集工具采集近5000家控股及参股的监管企业数据,通过接口对接委内系统、*市政府大数据平台、第三方平台、以及互联网等获取相关数据,为*数据资源库和知识图谱库构建提供数据基础。2) *信息资源处理子系统开发:对采集的数据进行清洗整合,形成*数据资源库和专题库;专题库提供数据,通过知识图谱构建模块构建*知识图谱,形成基础知识图谱专题库,并根据*的业务需
7、求,形成产权图谱专题、经营图谱专题、风险图谱专题等面向*业务的知识图谱专题库。3) *知识算法及建模:对*数据专题库进行相关的数据抽取,进行数据知识化处理,通过本体构建、排重、关系运算等知识图谱建模过程,构建*知识图谱库。并结合*实际业务需求,通过算法模型,实现智慧*知识图谱经营决策的应用。4)知识图谱管理服务子系统开发:根据构建的*知识图谱库,面向*业务提供*知识图谱管理功能和服务,包括知识管理、知识检索、知识展示和百科式知识管理等应用分析功能,同时提供图谱服务、检索服务等。5)*知识图谱应用子系统开发:在建立*知识图谱的基础上,将*信息化中松散的、异构的应用和信息资讯进行集成,实现经济地图
8、、经营分析、行业对标、风险预警、关系挖掘等各种应用,为*及企业提供决策支持。6)按项目要求提供包含但不限于下列的征信数据:序号项目/子项目说明1全国企业工商详细信息包括企业工商、股东信息、主要人员、变更记录、经营异常、行业分类、动产抵押信息、股权出质登记信息、行政处罚信息、企业法人对外投资信息等,约9000万条;2全国企业经营信息包括行政许可信息、招投标、商标信息、企业对外投资信息、企业法人其他企业任职信息、董监高对外投资、任职信息、股东对外投资、任职信息、专利信息、企业融资信息、招聘信息等,约5000万条;3全国企业司法涉诉信息包括企业开庭公告信息、企业法院公告信息、企业裁判文书信息、企业被
9、执行人信息、自然人被执行人信息、企业失信人信息、自然人失信人信息、企业立案信息等,约3000万条;4全国企业处罚信息包括企业工商行政处罚信息、企业工商经营异常信息、企业工商严重违法名单、企业工程不良行为信息、企业食品不安全产品信息、企业环保处罚信息等,约300万条;5全国企业纳税信息包括企业欠税信息、企业重大税收违法信息、企业纳税信用评级信息等,约150万条;6国内上市公司信息包括企业概况、企业公告、高管信息、十大股东、十大流通股东、股本结构、十大股东持股变动、高管持股变动、重大事项、财务分析、资产负债表、利润表、现金流量表等,约IoOO万条;7)依照*市工业和信息化委关于*市政府信息化云服务
10、平台资源租赁服务相关事项的通知(*工信函),本项目中的大型虚拟机及数据存储基于*市电子政务云平台设计建设,利用云平台租赁方式进行部署,另外操作系统及数据库等其它涉及的软件需要建设部署,由建设方自行建设(具体清单见下表)O系统开发完成,应在本地完成测试及试用工作,部署到云平台后,再进行环境稳定性试运行。基础及专业软件购买序号类型名称数量(套)年限1操作系统WindowsServer2012R2标准版41中标麒麟高级服务器操作系统V6.03412数据库软件达梦数据库系统(DM7)181MYSQL213中间件软件东方通TOngWeb应用中间件81开源中间件APaChe、Tomcat101硬件基础设施
11、租赁序号设备名称配置性能指标数量租赁年限1数据库服务器高负载数据库专用服务器(2路*8核、2.4GHZCPU、64GB内存、4*300GBSAS)2012应用服务器高负载应用专用服务器(2路*8核、2.核HZCPU、128GB内存、4*300GBSAS)1013数据处理服务器大型虚拟机(8核、2.OGHzvCPU.32GB内存、IoOGB存储空间)811.7建设原则1)标准性原则系统的建设应采用相关技术标准,遵从国标及行业标准,保障最终交付物具备高度的标准化特性。2)易用性原则系统应本着能正确而高效地完成设定功能的原则建设,使系统能充分发挥其作用。应提供通用的配置功能,方便系统管理人员和系统用
12、户的使用。3)稳定性原则系统在稳定性、响应和处理速度方面必须满足使用需求,提供稳定、快捷的系统功能,并尽量减少对资源的占用。4)产品成熟性和可靠性原则项目要求所采用的系统平台具备成熟性,开发后的系统运行时具有高可靠性,具有良好的容错性能,在设计时需考虑提供必须的系统冗灾机制,保证系统运行稳定、可靠、数据安全。5)落地性和持续性原则要求对*监管机制和体系有深度了解,能够提供咨询和优化开发的服务能力,保障对项目的服务质量和对未来的服务深度,以及对应用开发商的技术支持能力,实现可落地性,并持续支持用户单位后续提升。6)保护投资原则项目建设应坚持以保护已有投资为基本原则。在基础架构方面的设施,能够最大
13、程度地利用现有的资源,避免不必要的投资。二、系统功能需求2.1 总体框架设计智慧*知识图谱辅助决策平台的建设,依托*市电子政务云服务中心提供的基础硬件设施和软件资源建设,基于*市政府信息化公共资源体系提供的公共资源支撑,接入并使用*市政府信息化公共资源体系内的相关软件资源和工具平台等Q平台运行管理基于广州市电子政务云服务中心基于广州市政府信息化公共资源体系平台安全保障jii*L1.E”也竺l.空生1湍嚷二F回机厉环电向;:手机/PDA:生成用 日志JK :髓颦驾间图2.1智慧*知识图谱辅助决策平台总体架构数据层:数据源主要来源于*内部数据、近5000家控股及参股的监管企业数据、*监管系统、*市
14、政府大数据平台、第三方数据,以及互联网等其它的相关数据资源。数据结构包括结构化数据、非结构化数据和半结构化数据。数据通过整合、清洗、标准化和质量检测等处理之后,进入*数据资源库并根据上层业务应用形成业务专题库。处理层:包括*数据资源库和知识图谱库。基于数据层,进行数据清洗整合后,形成*数据资源库;利用知识图谱构建模块构建*知识图谱,形成*知识图谱专题库。应用服务层:基于知识图谱提供管理服务和应用服务。面向*业务提供*知识图谱管理功能和服务功能,包括知识管理、知识检索、知识展示和*百科等应用分析功能,同时提供本体服务、检索服务和图谱服务等。面向*业务提供经济地图、风险预警、经营分析、行业对标、*画像、关系挖掘等*业务应用功能。门户系统:实现各种应用系统及功能的集成,对知识图谱抽取出来的指标、模块进行可视化展示等。2.2 业务逻辑示意图图2.2知识图谱业务流程逻辑