《第一章项目概述.docx》由会员分享,可在线阅读,更多相关《第一章项目概述.docx(9页珍藏版)》请在优知文库上搜索。
1、第一章项目概述医院信息互联互通标准化成熟度测评,是根据深化医改和国家卫生计生委关于加快推进人口健康信息化建设的指导意见的要求,在国家卫计委规划与信息司的领导下组织开展。从数据资源标准化建设、互联互通标准化建设、基础设施建设和互联互通应用效果等四个方面对医院信息平台进行综合测试和评估。要求使医院建立整个信息化建设的标准,包括数据集标准,术语标准,值域标准,特别是系统之间数据交换的标准。同时重新梳理医院的业务流程,达到优化业务流程的目的。为区域医疗信息平台的对接打下基础,实现数据的共享和业务的协作。第二章建设内容2.1 总体要求医院数据中心方案是以医疗业务、数据仓库及相关的工具软件为核心基础,为医
2、院提供一个完整的、多用途的智能分析平台环境。医院的数据中心建设包括了临床数据中心CDR和运营数据中心ODR;临床数据中心应能整合医院医疗服务信息系统LIS、PACS、HIS、EMR、心电、病理、超声、体检等各类临床业务数据;ODR则整合医院HIS、HRP、患者服务等各类医院运营业务数据。它允许用户访问、分析和操作任何类型的信息(包括结构化数据和非结构化数据)。数据中心能实现存储患者的临床结果数据,并把数据标准化,为患者门户、患者全息视图、商业智能分析等其他应用提供好数据准备。通过对医疗业务、临床信息、医院管理信息进行整合,为医院信息二次利用、为患者提供公众服务、与外部互联奠定数据基础。本期的建
3、设主要任务是搭建数据采集平台,采集患者的各类临床医疗信息,进行数据的标准化,构建符合国家相关标准的临床数据中心CDRo临床数据中心要求构建针对病人信息、病历文书、医嘱、诊断、处方、检查/检验报告信息、手术信息、机构信息等临床信息集合的数据仓库平台,同时提供基于CDR的统一信息服务,需实现实时的数据交互、历史业务数据的当前调用,以及对各业务系统历史数据的重构与处理,从而为数据挖掘做准备。临床数据中心汇集整合全院现有系统的所有数据,参照CDR数据模型进行梳理、存储和重构,供跨系统、跨部门的数据分析利用。1.1 供临床数据中心架构图,并说明构建方法。1.2 标准体系要求临床数据中心应根据相关国际、国
4、家、行业相关的医疗标准、规范建立一套标准的、有效的、可扩展的就诊病人档案模型(架构),提供能够按照一定规则以病人为中心自动获取各业务系统相关数据的系统服务,并按临床业务数据标准规范进行整合形成完整的临床数据中心。临床数据中心符合以下标准:符合HL7卫生信息交换标准符合卫生部发布的电子病历基本架构与数据标准可根据国内不同实际应用进行扩展1.3 技术体系要求临床数据中心具体实现流程如下:(1)数据抽取:要求通过ETL过程从多个数据源中提取业务数据、并对这些业务数据进行清洗、转换、集成,最终将散乱在各业务系统中的数据统一装载到临床数据中心CDR,供跨系统、跨部门的数据分析利用。抽取方式:实时数据抽取
5、和定时数据抽取。针对业务需要实时分析的数据进行实时抽取,对业务需要历史查询分析的数据进行定时抽取。抽取步骤:数据抽取、数据验证、数据清洗、数据集成、数据聚集和数据装载。(2)数据存储:D关系数据存储由于临床数据中心是各个业务系统数据的整合,数据量相当大,数据中心根据不同情况提供以下几种数据存储方式:序号功能列表技术指标1分表当表的数据量非常大时,可以采用分表存储,比如处方明细,可以根据处方号分表,存储为PatientDetai201301,PatientDetai201302,当要查询某一张处方的明细的时候,通过处方号判断该处方的明细具体存在哪张表。2分库分库可以以业务来划分,把不同业务的表划
6、分到不同的库中。3分区分区是一个数据表,物理上把表分为多个物理文件。分区有两种方式:1 .对于数据量非常大的,可以采用水平分区,比如每一年的数据放一个分区。2 .对于字段多的表,采用垂直分区,可以把经常访问的字段做为一个分区,不常访问的字段存储到另一个分IXo2)文档存储数据中心采用分布式key/value存储系统mongoDBo使用高效的二进制数据存储,包括大型对象(如视频等),文件存储格式为BSON,因此其具有很高的读写速度,通常性能是普通关系型数据库的5倍。由于是分布式的具有很高的扩展性,可轻松达到PB级存储。同时在mongoDB的基础上引入APaCheLucene作为数据中心的数据检索
7、引擎。可以通过文档名、文档相关属性、文档内容做快速精确的检索定位。1.4 实施技术要求1)要求实时数据和历史数据统一整合到临床数据中心CDR医院业务系统多,数据分散,通过建立临床数据中心,将分散在各个业务系统中的实时数据和历史数据整合在一起,从而实现跨系统、跨部门的数据分析利用。2)要求能对外开放数据利用实时数据交互:如LIS系统通过平台从CDR数据中心中获取病人的缴费信息以及检验项目,以及HIS系统实时查询LIS系统某位患者的检验结果等A历史数据调用:如医生想查询患者两年前的医嘱记录,HlS系统查询LIS系统某位患者的历史检验结果,患者想查看前几年收费记录情况等A数据挖掘:通过对业务系统数据
8、进行重构和处理,从大量数据中寻找规律,挖掘出潜在价值的信息。3)要求能进行CDR业务划分临床数据业务划分模块:A患者管理:主要包括患者基本信息、挂号预约信息、急诊登记信息、患者挂号信息、病人就诊信息、住院登记信息、患者转科信息等A医嘱管理:主要包含门诊处方信息、门诊处方明细、住院医嘱信息、住院医嘱明细、检查申请单、检验申请单、病理检查申请单等A观察报告:主要包括检查报告、检查危急值、病理检查报告、检验样本信息、检验报告、检验危急值、微生物检验报告等A手术管理:主要包括手术申请明细、手术执行信息、手术排台信息、麻醉记录等A护理管理:主要包括医嘱执行记录、一般护理记录、病危(重)护理记录、生命体征
9、测量记录、出入院评估、首次护理记录单等A档案管理:主要包括病案首页、入院记录、首次病程记录、日常病程记录、日常查房记录等1.5 功能要求251数据采集工具数据采集工具要求能将医院各业务系统的数据取出,经过ETL过程建立标准结构的数据仓库。ETL过程用于从多个数据源提取业务数据,清理数据,然后集成这些数据,并将它们装入数据仓库中,为数据分析做准备。具体技术要求如下:序号功能列表技术要求1数据获取数据抽取工具,采用数据库动态日志捕获同步技术,对生产系统的资源消耗控制在10%或以内,数据实时性延迟不超过30秒。最终可实现所获取的数据与业务系统的实时数据相差不超过30分钟。全量抽取:对中间数据库进行完
10、全复制,对仓库中已有记录进行替换,在新的时间戳添加完整的副本,或者比较目标库记录修改日志记录。增量抽取:只抽取自上次抽取以来数据库中要抽取的表中新增或修改的数据。对增量抽取数据接入引擎提供以下方法:功能列表功能介绍触发器(快昭)在要抽取的表上建立需要的触发器,一般要建立插入、修改、删除三个触发器,每当源表中的数据发生变化,就被相应的触发器将变化的数据写入一个临时表,抽取线程从临时表中抽取数据,临时表中抽取过的数据被标记或删除时间戳方式它是一种基于快照比较的变化数据捕获方式,在源表上增加一个时间戳字段,系统中更新修改表数据的时候,同时修改时间戳字段的值。当进行数据抽取时,通过比较上次抽取时间与时
11、间戳字段的值来决定抽取哪些数据。有的数据库的时间戳支持自动更新,即表的其它字段的数据发生改变时,自动更新时间戳字段的值。有的数据库不支持时间戳的自动更新,这就要求业务系统在更新业务数据时,手工更新时间戳字段。全表删除插入每次ETL操作均删除目标表数据,由ETL全新加载数据。全表比对全表比对的方式是ETL工具事先为要抽取的表建立一个结构类似的临时表,该临时表记录源表主键以及根据所有字段的数据计算出来,每次进行数据抽取时,对源表和临时表进行的比对,如有不同,进行UPdate操作,如目标表没有存在该主键值,表示该记录还没有,即进行Insert操作。0志表在业务系统中添加系统日志表,当业务数据发生变化
12、时,更新维护日志表内容,当作ETL加载时,通过读日志表数据决定加载那些数据及如何加载。基于日志同步基于数据库日志的数据复制方式,它从数据库的日志解析数据的变化,直接通过TCP/IP网络传输到目标端,在目标端通过交易重组,分批加载等技术手段进行数据的快速投递,可以在秒级实现大量数据的复制。2数据清洗过滤那些不符合要求的数据,将过滤的结果交给业务主管部门确认是否过滤掉,还是由业务单位修正之后再进行抽取。不符合要求的数据主要是有不完整的数据、错误的数据和重复的数据三大类。3转换从业务系统中提取元数据,通过预定义的数据标准和逻辑进行数据转换,规范化数据格式,对不同业务系统的元数据进行统一的数据维度转换
13、,存储到CDR中。采用PL/SQL编程方式转换。ETL转换的过程。体现为以下几个方面:1、空值处理:可捕获字段空值,进行加载或替换为其他含义数据,并可根据字段空值实现分流加载到不同目标库。2、规范化数据格式:可实现字段格式约束定义,对于数据源中时间、数值、字符等数据,可自定义加载格式。3、拆分数据:依据业务需求对字段可进行分解。例如:主叫号-8148,可进行区域码和电话号码分解。4、验证数据正确性:可利用Lookup及拆分功能进行数据验证。例如:主叫号-8148,进行区域码和电话号码分解后,可利用LOOkUP返回主叫网关或交换机记载的主叫地区,进行数据验证。5、数据替换:对于因业务因素,可实现
14、无效数据、缺失数据的替换。6、Lookup:查获丢失数据LookUP实现子查询,并返回用其他手段获取的缺失字段,保证字段完整性。7、建立ETL过程的主外键约束:对无依赖性的非法数据,可替换或导出到错误数据文件中,保证主键唯一记录的加载。4装载加载经转换和汇总的数据到目标数据仓库中,可实现SQL或批量加载5任务调度对采集的任务进行定义,并对定义的任务进行按时运行和监控。6ETL日志记录日志的目的是随时可以知道ETL运行情况,以便于在错误发生的情况下,快速定位错误原因和位置。7警告发送向系统管理员发送警告,发送警告的方式有多种,常用的就是给系统管理员发送邮件,并附上出错的信息,方便管理员排查错误。
15、2.5.2临床数据的采集和转换通过ETL过程从多个数据源中提取业务数据、并对这些业务数据进行清洗、转换、集成,最终将散乱在各业务系统中的数据统一装载到临床数据中心CDR,供跨系统、跨部门的数据分析利用。针对病人信息、病历文书、医嘱、诊断、处方、检查/检验报告信息、手术信息、机构信息、值域代码(数据字典)等临床信息集合的数据仓库平台,并根据业务需求的不同主体构建针对不同应用的数据集市。所用数据库为SQLSerVer或者Oracle等主流数据库。采集和转换的数据范围至少包括:患者管理:主要包括患者基本信息、挂号预约信息、急诊登记信息、患者挂号信息、病人就诊信息、住院登记信息、患者转科信息等A.医嘱管理:主要包含门诊处方信息、门诊处方明细、住院医嘱信息、住院医嘱明细、检查申请单、检验申请单、病理检查申请单等B.观察报告:主要包括检查报告、检查危急值、病理检查报告、检验样本信息、检验报告、检验危急值、微生物检验报告等C.手术管理:主要包括手术申请明细、手术执行信息、手术排台信息、麻醉记录等D.护理管理:主要包括医嘱执行记录、一般护理记录、病危(重)护理记录、生命体征测量记录、出入院评估、首次护理记录单等E.档案管理:主要包括病案首页、入院记录、首次病