《XX市人民检察院大数据法律监督模型数据管理系统建设项目采购需求.docx》由会员分享,可在线阅读,更多相关《XX市人民检察院大数据法律监督模型数据管理系统建设项目采购需求.docx(20页珍藏版)》请在优知文库上搜索。
1、XX市人民检察院大数据法律监督模型数据管理系统建设项目采购需求一、项目概况“xx市人民检察院大数据法律监督模型数据管理系统建设项目”是以大数据为核心解决方案,建立面向业务价值提升的数据架构体系,为XX市人民检察院科学决策提供支掾:建立与完善统一的数据标准与数据管控制度,不断提高数据管控能力,保隔数据质辰持续提升,持续推进数据平台及数据应用系统的建设.围绕“数字检察”、“智慧检务”领域持续开展业务大数据整理与改造,从“有数二“治数”、用数三个方面实现数据汇聚、数据治理、数据资产利用为需求导向,着力解决各行业大数据从“有”到“好”的提升,丰富完善大数据服务范围和能力。XX市人民检察院大数据法律监督
2、模型数据管理系统应该具仃高效率、高可靠性、高安全性的,集数据采集、数据治理、数据整合、数据服务、数据分析等功能为一体的,高度可配置的通用大数据应用平台。可为XX市人民检察院的数据展示、数据应用、数据分析提供坚实的平台基础,为XX市人民检察院的数据分析、情报分析、风险管理、案件管理以及业务创新提供一套自可用的通用数据支持软硬件平台。二、软件开发需求序号内容分项(功能模块/技术参数、配置、服务)数单位11.数据采集子系统数据采集与集成1套2文字识别引孽1套3文书卷宗材料批量识别1套42.数据治理子系统大数据存储计算平台1套5数据治理平台1套63.数据服务子系统数据资源服务管理1套7数据资源共享平台
3、1套8自定义数据交换平台1套9数据检索系统1套10法律监督模型低代码构建平台1套11综合数据展示屏1套124.基础管理子系统子系统管理:多级院账号管理:用户权限、角色权限管理:操作日志管理,使用情况统计1套135.业务运营服务项目验收后,人员按需到场进行数据清洗、录入,以及系统维护等现场技术服务1年具体需求内容如下:1 .数据采集子系统1.1. 数据采集与集成1.1.1.支持采集检察业务应用系统2.0数据。1.12 数据集成系统是一款可视化ET1.开发工具,工具支持结构化数据、文件数据、图片数据、日志数据、音视频等各类型数据采集、数据转换、数据同步等数据处理工作。提供数据同步、数据迁移和数据处
4、理开发模板,可辅助开发人员快速构建数据处理作业开发,同时工具还具备任务调度管理和任务监控功能。1.13 支持与检察院数据资源池进行无缝对接。1.14 结构化数据集成:工具支持包括结构化数据、文件数据、图片数据、日志数据、音视频等在内的各类型数据采集、数据转换、数据同步等数据处理工作支持关系型数据库、NoSQ1.库,XM1.,JSON.Exce1.等格式文件之间的数据蹈库同步、数据迁移:任务调度管理、任务监控等功能,响应文件中提供系统功能截图。1.15 非结构化数据集成:非结构化数据集成系统,针对半结构化或非结构化数据的汇聚抽取等。支持对法律文书半结构化或非结构化数据的采集。1.1.6.数据集成
5、与谢度1)数据集成与调度工具,包括任务开发可视化工具。2)任务监控,包括运行监控、运行任务、历时记录、”划任务等,响应文件中提供系统功能截图。1.17数据采集管理(1)任务管理:同时容纳多个任务的运转,支撑多个数据来源、多条数据管道的运行。在项目配置中可以完成数据管道和具体项目和应用的挂接,以及新增、删除、查看等操作。支持过程的自动化、标准化、潦程化管理。支持数据处理脚本自定义开发,实现灵活的周期调度,并与数据汇聚及各类AP1.接口实现无继衔接。(2)空间管理:根据检察行业的需求及特点,对多种类的海量数据,进行灵活的数据空间管理,便于用户对检察大数据进行统一分类管理,易于数据的维护与检索。通过
6、空间管理可进行数据源的查看、新建、修改、剧除等管理维护。(3)数据建模:通过配汽模型实现数据仓库建模,抽象数据库表。可以通过模型管理完成数据库表创建及字段格式定义,数据处理流程可根据模型定义好的数据结构完成数据从源库到目标库的转换处理。(4)数据源配置:支持多种数据来源,支持不同数据格式,通过对数据接收方式和发送方式的配置,实现多源异构数据的汇聚与潦转。(5)数据作业:实现系统之间数据迁移的处理过程,支持多模型关联,维表关联、多计算规则关联等。通过数据管道功能配置源和目标模型后,将数据按配置规则进行迁移处理.1.2.文字织别引擎文字识别系统基于A1.深度学习算法,利用图像分析,字符识别等技术,
7、对材料文件实现推理分析,提供材料文字识别能力。要求OCR配苴不少于SQPS,具体要求如下:(1)输入格式:支持JPG,JPEG.PNG,BMP.TIF.PDFQFD等多种文件格式输入,进行文字识别。(2)输出格式:支持TXT,WORD.X1.S.PDF,OFD等多种格式输出,其中PDF和OFD支持对图像原版面格式的还原。(3)歪斜校正:支持文字与水平轴小于15夹角偏转,支持90.180.270度的图片帧斜朝转识别,并能自动矫正进行文字识别。(4)表格识别:对表格类材料的分析提取,自动识别并定位表格线及表格内容,结构化辘出表头及每个单元格的文字内容,生成可以使用的数据,并可输出X1.S格式文件(
8、5)图像压缩:默认支持10M图像的识别,文件过大时,通过图像压缩将分辨率控制在300dpi以内.(6)识别语言:支持中文简体、繁体、手写字体、英文数字的混合识别,并能输出手写和印刷字体类型标识。(7)识别字体:支持包括但不限于宋、仿宋、黑体、楷体等字体的识别。(8)标点符号:识别内容包括常见标点符号、数学符号的识别。(9)行字定位:支持返回文字的行字自动定位,有利TOCR识别结果的深度应用;(10)里字定位:精确返回单个文字的坐标位置.有利于OCR识别结果的深度应用:(11)批量识别:支持批量图片或Pdf格式文件上传,系统识别后可.选择输出文件格式,并支持文件批量下载,响应文件中提供搽作过程详
9、细截图。(12)提供Web前端使用界面,具有文件上传和OCR识别后文件下载功能,响应文件中提供系统功能截图。13文书卷宗材料批量识别对导入系统的文书进行分类分析,针对图片、PDF、等类里材料自动进行自动识别入库,用户可定义材料数据模板,系统根据材料数据模板对导入材料和OCR识别材料进行数据要素提取,提取内容自动入库保存,提供检索和分析。131 .对表格类图形图片文件进行表格化识别分析,形成电子表格,并可导出EXCE1.类电子表格,响应文件中提供详细方案、系统技图.132 .支持电子卷宗、文出卷宗批量提取识别的功能,能锅批量处理通过扫描为图片或PDF的电子卷宗、流式文件(WOrd、wps)或转版
10、后用印的版式文件(pdfxOfd)O133支持图片数据集管理,可收集和存储电了卷宗图片数据,并可查阅图片内容。还需包括数据来源管理和数据清理功能。134 .提供图像标题识别功能,可利用图像识别结果获取图片标题区域,同时对图片进行文件组份.135 .提供材料分类功能,可利用OCR和图像识别的结果,对常见材料进行识别和分类。136 .提供文本段落化能力,可利用OCR识别结果后的卷宗文件还原为原始的流式文件,并重组文书的自然段落。2.数据治理子系统2.1. 大数据存储计算平台1.1 .1,大数据存储计算平台应支持丰宫的数据存储类型,采用先进数据存:储计算架构,可以满足结构化、半结构化和非结构化数据的
11、存储计算需求,具备海员数据存储能力。同时,大数据存储计算平台应提供实时数据采集计道、历史数据拉链计算以及数据缓存计算能力。2.12 大数据存储计算平台的运维管理模块支持大数据平台集群键式部署和相关服务的统一管理,支持大数据组件的全生命周期管理.2.2. 数据治理平台(1)数据加工为检察行业各业务条线数据提供标签化的加工处理。支持数据的标准化、自动化、流程化处理,同时支持数据的清洗、过滤、加工及数据碰撞加工处理,提供系统功能截图。(2)数据质量管理对数据质fit问题进行识别、度量、监控和预警,通过问题追溯机制发现海端或数据流转过程中数据质量产生原因,帮助改进数据质量问题,为数据流转构建完整的数据
12、质量保障体系。(3)具有数据查重功能。通过关堆字、索引对数据进行省重,删除或不展现重纪数据,数据导入时进行比对校验,不导入重笈数据,提供系统功能截图。(4)数据资产类目管理数据资产类目管理是对数据资产目录结构的管理,例如将数据资产按照职能、业务、环境要素等多种维度进行分类管理。数据资产类目管理是对数据资产进行盘点、管理和监控的基础。新建目录、资产编码管理、新建标签:1)新建目录,包括业务类、职能部门类等:2)资产编码管理,包括一级类目规则、编号位数、范围、资产编码规则、编码预览:3)新建标签,包括标卷集绑定、主胭标卷、基础数据、行业标卷等。(5)数据安全管理系统1)支持设置极感数据、敏感级别设
13、置,并对敏感数据进行监控,对数据的不当防问进行监控,了解敝感数据的分布情况。可以通过杳询对应的表,了解到敏感数据生效的对象。2)提供对于黑名单内的用户禁止有敏感等级的数据访问功能.3)支持不同粒度的权限模式,包括但不限于数据连接级、数据库表级。3.数据服务子系统3.1. 数据资源服务管理(1)资源口录分组:支持按资源目录分组进行筛选,支持多级资源目录分组,提供系统功能截图。(2)资源目录展示:展示的信息包括资源目录名称、资源目录摘要等,支持分页,支持展示授权状态。(3)数据资源申请审批:用户对资源发起申请,填写申请相关信息,提交给数据管理员进行审批。(4)数据资源查询:校权用户可查询相应的数据
14、。支持多条件筛选,支持查询预览、下载、导出EXCeI、导出TeXt等,支持分页展示,提供系统功能翻图.(5)数据资源统计分析:实现数据报表、数据报告的制作和生成,以及数据填报和指标定义功能。支持定义报表模板。定义时可选择报表列指标、设置列名称,支持应用常用的指标函数:支持定义多级表头。分析类型支持:单位分析、同比分析、环比分析、季度分析。支持设置报表属性,提供系统功能截图。3.2. 数据资源共享平台(1)可实现内部跨层级各应用系统之间以及与外部网各单位应用系统之间的信息资源共享与交换。本项目需提供数据API共享接口。(2)API数据共享系统作为大数据管理平台的数据出口,提供快速将大数据平台中的
15、数据库表生成数据AP1.的能力。支持AP1.接口定义、AP1.接口发布、API接口管理和日志审计等功能.3.3. 自定义数据交换平台实现自定义数据交换平台,支持用户通过配置方式进行双向数据交换,包括从外部系统采集数据以及提供标准数据规范的数据对外交换,其主要功能包括:数据导入与导出:支持各种数据格式的导入和导出,包括CSV、Exce1.、JSON等,方便用户快速将数据集成到平台中或导出到其他系统.数据转换与映射:提供数据转换和映射功能,帮助用户招不同格式或结构的数据进行转换和匹配,以实现数据的互操作性和致性。数据清洗与验证:提供数据清洗和险证功能,检测和修更数据中的错误、缺失或理亚项,确保数据质量和准确性。数据共享与权限控制:支持数据共享功能,用户可以设定不同的权限级别和访问控制规则,保护数据安全并实现合规要求。任务谢度与自动化:提供任务调度和自动化功能,用户可以设置定时任务或事件触发任务,实现数据交换和处理的自动化潦程.实时监控与报警:提供实时监控和报警功能,用户可以实时查看数据交换状态和性能指标,及时发现问题并进行处理。数据分析与报表:集成数据分析和报表