《XXXX医院呼吸健康大数据平台建设(二期)项目建设要求.docx》由会员分享,可在线阅读,更多相关《XXXX医院呼吸健康大数据平台建设(二期)项目建设要求.docx(13页珍藏版)》请在优知文库上搜索。
1、XXXX医院呼吸健康大数据平台建设(二期)项目建设要求1、项目概述XXXX医院呼吸健康大数据平台建设项目,建立了XXXX医院呼吸健康大数据中心,汇集XXXX医院,以及XX省老年医院、XX省级机关医院呼吸科以及全院相关病种的临床诊疗数据,建设了慢阻肺专病数据库和肺结节主题数据库。通过重点病种专病数据库以及配套的科研数据精准筛选,科研分析、科研随访管理等科研一体化应用的建设,提高对科研数据的筛选、分析、应用能力和科研效率。并建立了呼吸健康大数据标准体系,支持对XX省内不同医院的“异源异构”数据的采集、数据整合、数据治理和数据规范化工作,实现呼吸健康大数据平台建设中的数据互联互通,更好的支持科研和临
2、床应用。本期项目基于一期项目基础进行扩展建设,在一期呼吸健康大数据平台上横向扩展XX市立医院和XX市第一医院两个分中心,纵向扩展成人肺炎专病库、肺癌专病库、间质性肺炎专病库3个专病数据库建设,应用方面通过建立科研主题库系统进行科研临床应用能力扩展。2、项目建设需求2.1 项目建设内容类别名称数量功能类别功能子功能功能描述及说明软件部分呼吸健康大数据平台二期建设1套呼吸健康大数据多中心扩展扩展2个分中心XX市立医院对接院内各信息系统/集成平台的接口专病库处理、计算和治理(慢阻肺、肺癌)XX市第一医院对接院内各信息系统/集成平台的接口专病库处理、计算和治理(慢阻肺、肺癌)呼吸健康大数据中心专病库扩
3、展成人肺炎专病库数据标准化标准术语体系、多中心标准适配数据规范化处理数据规范化处理指标定义和计算指标定义和计算数据校验和治理数据校验和治理肺癌专病库数据标准化标准术语体系、多中心标准适配数据规范化处理数据规范化处理指标定义和计算指标定义和计算数据校验数据校验和治理间质性肺炎专病库数据标准化标准术语体系、多中心标准适配数据规范化处理数据规范化处理指标定义和计算指标定义和计算数据校验数据校验和治理科研和临床应用系统扩展科研主题库系统科研主题库需求分析研究队列主题库数据需求管理科研主题库管理科研主题库建立和管理科研主题库指标管理指标自定义、指标计算逻辑和指标管理科研队列报告研究队列定义、生产和管理硬
4、件部分设备名称数量配置要求服务器2台见具体技术参数要求算力卡(GPU卡)1张见具体技术参数要求无线终端接入设备与服务1项见具体技术参数要求硬盘10块见具体技术参数要求2.2 呼吸健康大数据多中心扩展本期扩展建设XX市立医院、XX市第一医院2个呼吸健康大数据分中心。建设慢阻肺、肺癌专病数据库。2.2.1 XX市立医院D对接院内各信息系统/集成平台的接口。2)支持慢阻肺、肺癌专病数据处理、计算和治理服务;见数据采集与治理部分内容描述。2.2.2 XX市第一医院1)对接院内各信息系统/集成平台的接口。2)支持慢阻肺、肺癌专病数据处理、计算和治理服务;见数据采集与治理部分内容描述。本次项目建设需要建立
5、成人肺炎专病库、肺癌专病库及间质性肺炎专病库,每个专病库具备的功能均包含数据标准化、数据规范化处理、指标定义和计算、数据校验和治理;2.2.3 数据标准化2.2.3.1 多源异构数据采集通过与XX医院、XX市立医院、XX市第一医院的医院信息系统数据库进行对接,采取推送中间库和视图等方式在医院指定的非业务繁忙时间段定时执行数据对接工作,同时具备扩展接入其他更多医院。1)技术提供方进行多源异构数据采集,范围包括呼吸与危重症医学科临床数据以及全院呼吸与危重症医学科相关数据;2)支持针对相关信息系统的历史数据及增量数据进行采集。数据采集包括但不限于下列系统及系统中的信息:病案管理系统;医疗信息系统(H
6、IS):患者、挂号、入出转、就诊、处方/医嘱、检验、检查、护理三测单等信息;电子病历系统(EMR):患者主诉、现病史、体格检查、入院记录等入院患者信息;出院记录、病程记录、手术记录等住院患者信息;实验室系统(LIS):标本、检验结果等信息;影像系统(PACS):影像归档信息等;医嘱系统;护理系统;病理信息系统:病理检查、病理标本、病理报告等信息;心电信息系统:心电检查、心电报告等信息;超声管理系统:超声检查、超声报告等信息;肺功能管理系统:肺功能检查、报告等信息;以上数据采集范围包括但不限于集成平台、集成平台备份库以及相关医院业务系统数据库中的数据。2.2.3.2 多源异构数据处理与存储多源异
7、构数据处理,支持对冗余数据和无效数据的判断及清除,支持纠正不一致数据。1)支持将不同表述经过数据治理后纳入通用数据模型框架。2)支持对应不同病种的个性化需求,进一步在专病范围内建立标准化模型。3)支持为专病数据管理提供一套术语规范、定义明确、语义语境无歧义并支持扩展的标准。4)支持整合患者个人信息、电子病历、检查、化验、治疗等信息全结构化数据。针对临床应用场景,支持基于人工智能技术将医院的海量临床数据进行结构化、标准化、归一化处理,供临床科研直接利用与进行数据分析。需要满足以下功能需求:1)支持基于自然语言处理技术的医疗文书类非结构化数据治理。2)支持非标准化概念与标准化概念间的映射转换,实现
8、数据标准化应用。3)支持患者隐私信息脱敏技术,包括患者个人信息、病历信息等,并通过前置机实现。4)支持处理多种病历类型的自然语言处理模型。1.1.1.3 患者主索引采用患者EMPl等技术,利用病人基本病历信息,自定义规则权重跟计算规则,进行相似度计算。将确定为同一病人的病人信息进行合并,建立患者维度的数据集。患者信息来自医院不同的业务系统,建立唯一的患者标识,将多个医疗信息系统的数据有效地关联在一起,支持主索引查询和近似患者合并。提供患者主索引管理工具,能够对主索引进行管理,计算,合并、查询等功能,支持主索引分级管理。1.1.1.4 标准规范化和归一处理标准数据库对于已结构化基础数据或指标与国
9、家标准、国际标准或行业标准分别进行映射,从而实现已结构化变量的标准化。需要满足以下功能需求:1)支持对国家、国际标准编码映射,如诊断名称、症状名称、检验名称、药品名称、检查名称等。2)支持国际标准临床术语SNOMED-CT、LOINCICDTO编码的对照映射。3)支持术语一体化管理:可进行术语管理、规则核查等。要求20大类,10万个以上的标准术语和500万条以上的同义词。4)支持基于人工智能模型进行后结构化处理。2.2.4 数据规范化处理2.2.4.1 临床数据后结构化系统具备基于人工智能技术进行临床数据后结构化处理的能力,展示后结构化命名实体识别的算法和模型,展示模型、训练样本、算法、数据后
10、结构化结果。2.2.4.2 数据脱敏系统需要支持对敏感数据脱敏,脱敏信息可配置,可依据需要设定脱敏范围,按字段颗粒度实现数据脱敏配置。脱敏支持可逆脱敏,不可逆脱敏等技术。2.2.5 指标定义和计算2.2.5.1 支持指标计算模板,实现同类数据的合并计算指标实例的计算考虑知识定义的零散性与海量数据计算环境对数据要求统一整齐的差异,指标计算模板需要将零散的定义进行统一,在物理执行时实现同类数据的合并计算,提升计算的速度,提升数据的处理效率。支持在指标计算逻辑生产过程中,同时产生数据校验规则,包括非空校验、值域校验等。支持指标数据的溯源关系的生成和管理。支持查看专病指标的所依据规范化数据的ICD编码
11、及同义词库。备注:需要支持多于500个计算模板。2.2.5.2 专病数据库管理专病库子系统提供对专病库进行指标扩展、数据管理、数据展示和数据溯源等功能。2.2.5.2.1 专病指标定义平台提供指标定义的管理工具,可以对指标定义进行查看、编辑和计算管理。D支持指标的基本属性的定义,包括分类、名称、描述、数据类型、物理存储等。2)支持指标的计算逻辑(计算模板)定义,在规范化数据的基础上,形成指标逻辑。3)支持指标的校验规则定义。4)支持建立数据溯源关系逻辑配置,从计算脚本中抽取关系。5)支持在发布时,通过平台对大规模的源数据进行计算,产生出大量的指标数据。2.2.5.2.2 专病指标实例专病指标数
12、据完成计算后,形成指标实例数据。1)针对某一个专病指标,可以查看该指标的实例数据;2)可以对实例数据进行过滤,支持根据患者ID,流水号,以及实例数据值进行过滤;3)支持对实例数据进行统计分析;4)支持对实例数据进行溯源。22523专病指标溯源专病数据库需支持对数据的溯源管理,对数据节点之间数据转换关联关系的展示,包括:D血缘关系:数据溯源工具支持对数据血缘关系的展示,包括源数据、规范化数据(后结构化和归一)、指标数据以及应用层数据节点之间的映射关系。血缘关系不涉及到具体的数值,只表示逻辑关系。2)实例溯源关系:获得指标实例后,可以对实例进行实例溯源。实例溯源是在血缘关系的基础上,展示具体数据转
13、换或者计算的关系。实例溯源中的每个节点(数据值)都带有索引。3)利用溯源工具,查看指标计算所依据的数据节点之间的血缘关系,并可以从指标的实例上进行溯源和索引关联。2.2.6 数据校验和治理2.2.6.1 数据校验技术提供方支持数据在不同阶段的数据校验:1)支持针对数据采集、数据规范化处理和指标计算阶段的数据校验。2)支持对数据校验规则管理,包括添加数据校验规则和修改数据校验规则。3)支持数据校验执行的规则引擎。4)支持数据完整性校验,包括数据缺失校验。通过对数据数量进行统计,计算缺失比例,形成缺失数据校验报告。5)支持数据关联性校验,包括针对数据索引的校验。6)支持数据合理性校验,包括数据值域
14、范围校验。通过判断数据是否超出值域范围,确定数据是否合理。7)支持数据构成异常校验,定义数据的占比指标和逻辑关联指标,包括门诊住院占比、性别占比、年龄占比、检验占比、检查占比等。在数据处理前对原始数据构成情况进行初查,统计的结果形成数据构成异常校验报告,进而分析数据构成异常的程度,评估是否需要重新采集或者进行数据再处理。8)支持校验结果报告以及报告的可视化。2.2.6.2数据治理对基于数据目录体系的数据进行数据治理,包括:1)支持现场的数据处理和计算。2)支持数据校验规则的管理和执行。3)支持对数据的修复,根据数据治理的目标,实现数据的处理逻辑和执行。4)支持阶段性出具数据质量报告和数据影响分
15、析报告。2.3 呼吸健康大数据中心专病库扩展本期扩展建设成人肺炎、肺癌、间质性肺炎3个专病数据库。2.4 科研主题库系统2.4.1 科研主题库需求分析科研主题库提供规范的需求分析模型,需求分析模型引导用户加深对数据的认知,约束用户提供所需数据以指标的颗粒度进行整理,明确数据的含义,按类别进行分类,提供数据的维度信息,并明确指标数据的来源。2.4.2 科研主题库管理2.4.2.1 科研主题库管理科研主题库管理包括以下的功能:1)主题库定义:查看主题库列表和相关信息。支持创建科研主题库,科研主题库可关联到主题库指标列表,按科研主题库为单位管理科研数据需求。2)科研主题库指标需求分析和管理。3)科研主题库提供的需求指标管理规范,定义了用户补充需求所需字段,用户可以按指标颗粒度进行需求,通过类别分类明确数据的含义并提供数据的维度信息,并指明指标数据