《大数据在医疗行业的应用.pptx》由会员分享,可在线阅读,更多相关《大数据在医疗行业的应用.pptx(37页珍藏版)》请在优知文库上搜索。
1、大数据 医疗&工程建设 PART 1 大数据在 医疗领域 的应用outline一、 医疗与大数据的趋势二 、什么是医疗大数据三 、大数据面临的挑战四、 如何管理和利用大数据五、 案例分析六、 总结与展望一、 医疗与大数据的趋势二 、什么是医疗大数据三 、大数据面临的挑战四、 如何管理和利用大数据五、 案例分析六、 总结与展望医疗费用在不断上升GDP的占比非常高10-19%0-9%趋势分析: 我们正处在医疗行业的一个重要转折点% of population over age 6030+ %25-29%20-24%2050WW Average Age 60+: 21%Source: United
2、Nations “Population Aging 2002”全球老龄化平均年龄60 +: 目前的10%, 到2050年将达到20%Source: McKinsey Global Institute AnalysisESG Research Report 2011 North American Health Care Provider Market Size and Forecast以美国为例: 医疗大数据的价值3千亿美元/年, 相当于每年生成总值增长0.7%0150001000050002010 2011 2012 2013 2014 2015趋势分析:我们正处在医疗行业的一个重要转折点存储
3、的增长医疗服务产生的数据总量(PB)AdminImagingEMREmailFileNon Clin ImgResearch医疗影像归档一个医疗系统案例的数据到2020年, 医疗数据将急剧增长到35 Zetabytes, 相当于2009年数据量的44倍增长Source: McKinsey Global Institute AnalysisESG Research Report 2011 North American Health Care Provider Market Size and Forecast一、 医疗与大数据的趋势二 、什么是医疗大数据三 、大数据面临的挑战四、 如何管理和利用大
4、数据五、 案例分析六、 总结与展望大数据对于“大数据”(Big data)研究机构Gartner给出了这样的定义:“大数据”是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。4V:Volume(大量)Velocity(高速)Variety(多样)veracity(真实性)/Value(价值性)1. 制药企业/生命科学3. 费用报销, 利用率 和 欺诈监管2. 临床决策支持 & 其他临床应用 (包括诊断相关的影像信息)4. 患者行为/社交网络医疗大数据简介数据来源包括哪些?我们如何利用大数据创造价值? (示例)2. 临床决策支持4. 由生活方式和行
5、为引发的疾病分析1. 个体化医疗3. 欺诈监测得以加强McKinsey Global Institute Analysis医疗大数据相关解决方案健康信息服务新兴的医疗服务应用数据分析及视觉化处理数据处理/管理分布式平台老龄社会肿瘤基因组学医疗影像分析医疗影像影像数据处理加速基础医疗服务临床决策支持类SQL的检索医疗记录存储优化个人健康管理个体化医疗机器学习基因数据安全和隐私一、 医疗与大数据的趋势二 、什么是医疗大数据三 、大数据面临的挑战四、 如何管理和利用大数据五、 案例分析六、 总结与展望大数据的挑战不仅来自于数据量的增长.需要新技术的支持检验结果, 费用数据, 影像, 设备产生的感应数
6、据, 基因数据等数据量结构化数据, 遵循标准的数据标准(如,HL7)非结构化数据, 如口述、手写、照片、影像等类型实时有效的商业价值基于现有数据库中的数据进行分析,来支持不同种类的业务:如费用及报销、患者病史、归档影像分析、实时临床决策支持(数据分析) 实时数据分析,而非传统的批量处理分析 数据以流的方式进入系统,进行抽取和分析 对于实时运行中的每个时间节点产生影响,而不是事后处理在传统的解决方案之上,引入新的数据及分析模型和技术,价值速度一、 医疗与大数据的趋势二 、什么是医疗大数据三 、大数据面临的挑战四、 如何管理和利用大数据五、 案例分析六、 总结与展望传统解决方案环境ERP, CRM
7、, Batch,OLTP-DBData Center ProvisioningDiscreteVirtualCloud As A ServiceHPC关注数据的价值大数据存储的考虑传统存储方式大规模分析 Hadoop*海量数据库 Hive*大规模备份 Lustre*数据源文本-语音-视频-传感器Requesting Or M2M通讯批量 商业应用丰富的视觉化效果 安全的数据分析和缓存边缘服务器(Edge)分析同步端到端Machine-to-MachineSource-to-Source可行的解决方案体系(示例)Applications & ServicesVisualization File
8、Structure & AnalyticalToolsData Delivery, Operational & GraphicalAnalyticsData Management & ComputationalAnalyticsCompute Storage & InfrastructurePlatforms高效的大数据访问途径 (客户端)“Know Me”“Free Me”“Express Me”智能手机移动医疗助理平板电脑笔记本,Ultrabook其他设备台式机数字标牌自助终端MobilityVital sign,I & O entryMedicationadministrationTem
9、platedata entryFree-format textdata entryLarge diagnosticimagesData inquiryManageability“Link Me”大数据在中国医疗行业中的应用模式1.制药企业/生命科学3.费用报销, 利用率 和 欺诈监管2.临床决策支持 &其他临床应用 (包括诊断相关的影像信息)4.患者行为/社交网络药品研发对药品实际 作用进行分析;实施药品市场预测基因测序分布式计算加快基因测序计算效率公共卫生实时统计分析发现公共卫生疫情及公民健康状况新农合基金数据分析及时了解基金状况,预测风险辅助制定农合基金的起付线,赔付病种等基本药物临床应用
10、分析分析基本药物在处方中的比例临床数据比对匹配同类型的病人,用药临床决策支持利用规则和数据实时分析给出智能提示远程监控采集并分析病人随身携带仪器数据,给出智能建议人口统计学分析对不同群体人群的就医,健康数据实施人口统计分析了解病人就诊行为发现病人的特定就诊行为,分配医疗资源一、 医疗与大数据的趋势二 、什么是医疗大数据三 、大数据面临的挑战四、 如何管理和利用大数据五、 案例分析六、 总结与展望案例分享: Regional Health Info Network ChinaReal-time Clinical Decision Support 实时的医疗数据处理(电子健康档案,医疗影像数据),
11、支持医疗协同、临床决策支持和公共卫生管理 采用 Hadoop* (HBase*/Hive*)来实现医疗数据分析和处理 未来将扩展到不同领域、不同区域/地区(包括数据交换、处理和分析) 与本地的软件厂商及OEM厂商进行了广泛合作 技术挑战 Hadoop (HBase/Hive)与传统关系型数据库如何有效结合大数据在区域卫生信息平台中的切实可行应用场景PublicHealthHospitalPrimary care(Grassroots)HealthInformationDWEHRData &ServicesRegistriesData &ServicesLongitudinal Record S
12、ervicesHealth Information Access LayerCare CoordinationClinical decision supportData AnalyticR&DRHINAncillaryData &Services分布式数据服务系统展现层(报告, 视图)区域医疗及基层医疗信息系统大数据解决方案(Hadoop*)集成的用户应用界面(居民、医生、卫生行政管理人员)数据挖掘(Mahout)分布式批量处理框架(Map/Reduce)区域卫生信息访问层区域卫生信息访问层(HIAL)医院信息系统医院信息系统语言和编译(Hive)实时数据库(Hbase)基层医疗信息系统医疗服
13、务药品管理新农合医疗保险服务器虚拟化基础设施虚拟化基础设施虚拟化网络虚拟化 存储虚拟化基于云的区域基层医疗服务系统多租户应用多租户应用分布式文件系统 协作 服务(HDFS) (Zookeeper)结构化数据采集器 日志数据采集器(Sqoop) (Flume)健康档案数据存储公共卫生运营管理Sequencing3 BillionBase PairsDataProcessingCloud StorageVisualizationMillions ofVariantsInterpretation &AnalyticsMillions of VariantsMillions of PatientsCo
14、mmercializingTargetedTherapeuticsCompanionDiagnosticsActionable Biomarkers案例分享: NEXTBIO基因数据分析Cost to sequence a genome has fallen by800 x in the last 4 yearsEach genome has 4 million variantsGrowth in the genomics data in the publicand private domainData available in variety of sourcesStructured, se
15、mi-structured, unstructuredNew aggregated data growingexponentially案例分享: NEXTBIO病人相关性数据Novel DiscoveriesBiomarkersDisease MechanismDrug IndicationsClinical Trial ParametersPatient Care OptionsLarge content repository of public and private genomic datacombined with proprietary and patented correlatio
16、n engine案例分享: NEXTBIONextbio & Intel 合作方向技术挑战:Immutable Data write once,never change, read many timesTraditional Bloom Filters worksHadoop* & HBase* well suited1 genome 10 million rows100 genomes 1billion rows1M genomes 10 trillion rows100M genomes 1 quadrillion1,000,000,000,000,000 rowsApp can dynamically partitions HBaseas data size grows英特尔对于Hadoop提供的优化:Optimized Hadoop stack in opensourceStabilize HBase to provide reliablescalable deploymentOptimize and support scale-out asdata size dramatic