《临床研究资料常用统计分析方法.ppt》由会员分享,可在线阅读,更多相关《临床研究资料常用统计分析方法.ppt(90页珍藏版)》请在优知文库上搜索。
1、1临床研究资料常用统计分析方法临床研究资料常用统计分析方法2n医学专业知识医学专业知识n医学统计学理论知识医学统计学理论知识 n计算机统计软件技术计算机统计软件技术3q学习了统计学理论知识,并不代表已经有学习了统计学理论知识,并不代表已经有 能力进行统计数据分析。要不断进行实践。能力进行统计数据分析。要不断进行实践。q实际科研工作中的实际科研工作中的“原型原型”资料与教科书上资料与教科书上的的 “标准型标准型”例子有一定差距。例子有一定差距。q应用统计软件进行计算分析应用统计软件进行计算分析一定要有正确的一定要有正确的 综合的统计理论方法的后台背景指导。综合的统计理论方法的后台背景指导。q不但
2、要注重对统计方法的选择,而且要注重不但要注重对统计方法的选择,而且要注重 对分析结果的解释。对分析结果的解释。4二、原始数据的录入二、原始数据的录入三、数据处理的几个基本问题三、数据处理的几个基本问题四、统计方法选择的基本思路四、统计方法选择的基本思路五、统计分析结果的表述五、统计分析结果的表述5研究研究设计设计数据数据处理处理观察性研究观察性研究实验性研究实验性研究统计描述统计描述统计推断统计推断假设检验假设检验参数估计参数估计(调查调查)6系统系统 分层随机分层随机 整群整群调查方法调查方法调查对象调查对象 调查指标调查指标研究目的研究目的按范围按范围按时间按时间抽样抽样普查普查横向横向(
3、现况调查现况调查)非概率非概率概概 率率简单随机简单随机纵向纵向 病例对照研究病例对照研究队列研究队列研究 调查工具调查工具 调查员调查员nested case control study7动物实验动物实验临床试验临床试验社区干预试验社区干预试验处理因素处理因素受试对象受试对象实验效应实验效应诊断试验诊断试验疾病防治疾病防治病因病因疾病预后疾病预后8随机化、盲法随机化、盲法对对 照照重重 复复(样本含量样本含量)形式形式原则:原则:专设、同步、均衡专设、同步、均衡 1-1-、自身处理前后自身处理前后平行:平行:9数学数学 连续型连续型(计量计量)离散型:计数离散型:计数 计量:脉搏次数计量:脉
4、搏次数/分分统计统计(有序分类有序分类)(无序分类无序分类)定比定比(0表示无,如体重表示无,如体重kg)定距定距(0不表示无,如温度不表示无,如温度0C)10制表原则制表原则制表要求制表要求 简单明了简单明了主辞在左、宾辞在右主辞在左、宾辞在右一张表表达一个中心内容一张表表达一个中心内容备注备注数字数字 线条线条 标目标目标题标题11制图原则制图原则制图要求制图要求 连续型资料连续型资料(计量计量)离散型资料离散型资料(计数、计量计数、计量)图例图例刻度刻度 纵轴、横轴纵轴、横轴 标目标目标题标题 条图、圆图、百分比条图条图、圆图、百分比条图 线图、直方图、散点图线图、直方图、散点图12 S
5、QR计量资料计量资料(单变量单变量)中心中心位置位置 正态:正态:MX、非正态:非正态:GXM对数正态:对数正态:离散离散 程度程度 个体值个体值 样本均数:样本均数:正态正态非正态非正态:XS 量纲相同量纲相同:CV量纲不同量纲不同:计量资料计量资料(双变量双变量)偏度:偏度:g1 峰度:峰度:g213 计量资料计量资料(单变量单变量)计量资料计量资料(双变量双变量)离散程度:离散程度:r、brbSS、14 中心位置:均数向量中心位置:均数向量离散程度:离均差平方离散程度:离均差平方 和矩阵和矩阵 协方差矩阵协方差矩阵相互关系:相关矩阵相互关系:相关矩阵计量资料计量资料(多变量多变量)15等
6、级等级资料资料计数资料计数资料率、构成比、相对比率、构成比、相对比 RR(OR)离散程度:离散程度:标准误标准误离散程度:离散程度:秩号、秩和秩号、秩和秩和的标准误秩和的标准误单变量单变量双变量:双变量:rs16正态正态偏态偏态或或SuX 双侧:双侧:单侧:单侧:SuX2/SuX 双侧:双侧:单侧:单侧:x100 xpp xp或或x100p 17区间区间估计估计点估计点估计2211ppXX22ggSSSSbrpX 、双侧:双侧:单侧:单侧:X,2/StX X,StX 或或X,StX 双侧:双侧:单侧:单侧:p2/Sup pSup 或或pSup RR(OR):2MH2/u1)OR(RR 181.
7、进行检验假设进行检验假设 假设样本来自某一特定总体假设样本来自某一特定总体2.确定检验水准确定检验水准 确定最大允许误差确定最大允许误差3.选定检验方法计算检验统计量选定检验方法计算检验统计量 计算样本与总体的偏离程度计算样本与总体的偏离程度4.根据某一特定分布计算与检验统根据某一特定分布计算与检验统 计量对应的计量对应的P值值5.作出结论作出结论 根据小概率反证法思想作出推断根据小概率反证法思想作出推断19比较比较差别:差别:2、t、F、q、log-rank、秩和检验等秩和检验等联系:相关、回归分析联系:相关、回归分析分类:回归分析、判别分析分类:回归分析、判别分析推测:回归分析推测:回归分
8、析筛选影响因素:回归分析筛选影响因素:回归分析综合变量信息:主成分分析综合变量信息:主成分分析寻找潜在支配因素:因子分析寻找潜在支配因素:因子分析20(有人称有人称“鼠标软件鼠标软件”)q (Statistical Analysis System)q q (方法新、提供源程序、免费方法新、提供源程序、免费)21 Statistical Package for Social Science (社会科学统计软件包社会科学统计软件包)后改名为后改名为:Statistical Product and Service Solutions (统计产品与服务解决方案统计产品与服务解决方案)Predictiv
9、e Analytics Software 预测分析软件预测分析软件22一、概述一、概述三、数据处理的几个基本问题三、数据处理的几个基本问题四、统计方法选择的基本思路四、统计方法选择的基本思路五、统计分析结果的表述五、统计分析结果的表述23原始数据的记录形式原始数据的记录形式肾衰病人预后研究的临床资料记录肾衰病人预后研究的临床资料记录 病人编病人编号号 病案号病案号 性性别别 年年龄龄 生理评生理评分分 肾毒肾毒性性 黄黄疸疸 昏昏迷迷 肌酐肌酐 胆固胆固醇醇 肾功能预肾功能预后后 1 004757 男男 26 14 无无 有有 无无 520 治愈治愈 2 007950 女女 31 13 无无
10、无无 无无 523 4.5 治愈治愈 3 011093 男男 55 17 无无 无无 无无 209 3.3 治愈治愈 4 017555 男男 25 9 无无 无无 无无 1303 4.1 治愈治愈 274 279183 女女 88 15 有有 无无 无无 331 6.1 丧失丧失 24肾衰病人预后研究的临床资料记录肾衰病人预后研究的临床资料记录 病人病人编号编号 病案号病案号 性别性别 年龄年龄 生理生理评分评分 肾毒肾毒性性 黄疸黄疸 昏迷昏迷 肌酐肌酐 胆固胆固醇醇 肾功能肾功能预后预后 1 004757 男男 26 14 无无 有有 无无 520 治愈治愈 2 007950 女女 31
11、13 无无 无无 无无 523 4.5 治愈治愈 3 011093 男男 55 17 无无 无无 无无 209 3.3 治愈治愈 4 017555 男男 25 9 无无 无无 无无 1303 4.1 治愈治愈 274 279183 女女 88 15 有有 无无 无无 331 6.1 丧失丧失 25肾衰病人预后研究的临床资料记录肾衰病人预后研究的临床资料记录 病人病人编号编号 病案号病案号 性别性别 年龄年龄 生理生理评分评分 肾毒肾毒性性 黄疸黄疸 昏迷昏迷 肌酐肌酐 胆固胆固醇醇 肾功能肾功能预后预后 1 004757 男男 26 14 无无 有有 无无 520 治愈治愈 2 007950
12、女女 31 13 无无 无无 无无 523 4.5 治愈治愈 3 011093 男男 55 17 无无 无无 无无 209 3.3 治愈治愈 4 017555 男男 25 9 无无 无无 无无 1303 4.1 治愈治愈 274 279183 女女 88 15 有有 无无 无无 331 6.1 丧失丧失 自变量自变量(解释变量解释变量)26原始数据的录入原始数据的录入数据库文件:数据库文件:EpiDataExcel文件:文件:Excel统计软件数据文件:统计软件数据文件:SPSS(PASW)、SAS、Stata 有序、无序分类资料有序、无序分类资料27高血压患者治疗前后的舒张压高血压患者治疗前
13、后的舒张压(mmHg)处理组处理组 对照组对照组 顺序号顺序号 治疗前治疗前 治疗后治疗后 顺序号顺序号 治疗前治疗前 治疗后治疗后 1 130 114 11 118 124 2 124 110 12 132 122 3 136 126 13 134 132 4 128 116 14 114 96 5 122 102 15 118 124 6 118 100 16 128 118 7 116 98 17 118 116 8 138 122 18 132 122 9 126 108 19 120 124 10 124 106 20 134 128 28数据编辑窗口数据编辑窗口数据窗数据窗标题栏标
14、题栏菜单栏菜单栏工具按钮栏工具按钮栏数据单元格显示数据单元格显示数据文件建立原则数据文件建立原则一个观测占一行一个观测占一行一个变量占一列一个变量占一列 2729变变量量度度量量类类型型变变量量名名变变量量类类型型变变量量宽宽度度保保留留小小数数位位数数变变量量名名标标签签变变量量值值标标签签缺缺失失值值显显示示数数据据列列宽宽数数据据对对齐齐方方式式数据编辑窗口数据编辑窗口变量窗变量窗2830定量变量定量变量 Scale 等级变量等级变量 Ordinal 名义变量名义变量 Nominal2931标准数值型标准数值型科学记数法科学记数法圆点数值型圆点数值型逗号数值型逗号数值型日日 期期 型型带
15、美元符号数值型带美元符号数值型自自 定定 义义字字 符符 型型3032名义变量的哑变量化名义变量的哑变量化原资料原资料姓名姓名性别性别X1年年龄龄X2 疗法疗法 X3张三张三150中西医中西医李四李四120西医西医王五王五018中医中医刘六刘六070中医中医赵七赵七135中西医中西医孙八孙八029西医西医哑变量化哑变量化姓名姓名X1X2X31X32张三张三15001李四李四12010王五王五01800刘六刘六07000赵七赵七13501孙八孙八0291000 1001 XX 3231医医中中中西医中西医医医西西法法疗疗33一、概述一、概述二、原始数据的录入二、原始数据的录入四、统计方法选择的基
16、本思路四、统计方法选择的基本思路五、统计分析结果的表述五、统计分析结果的表述34 逻辑检查逻辑检查 计算检查计算检查 与与P25或或P75的距离为的距离为“四分位数间距四分位数间距”的的1.53.0倍。倍。与与P25或或P75的距离的距离为为“四分位数间距四分位数间距”的的3.0倍以上。倍以上。剔除离群或极端值要予以合理解释。剔除离群或极端值要予以合理解释。3536一、概述一、概述二、原始数据的录入二、原始数据的录入三、数据处理的几个基本问题三、数据处理的几个基本问题五、统计分析结果的表述五、统计分析结果的表述37完全随机、随机区组、拉丁方、完全随机、随机区组、拉丁方、交叉、析因、正交、嵌套、裂区设计交叉、析因、正交、嵌套、裂区设计单因素、双因素、多因素单因素、双因素、多因素单水平、两水平、多水平单水平、两水平、多水平单变量、双变量、多变量单变量、双变量、多变量计量、无序分类、有序分类计量、无序分类、有序分类完全数据、不完全数据、完全数据、不完全数据、重复测量数据、层次结构数据重复测量数据、层次结构数据 独立、方差齐性、正态分布独立、方差齐性、正态分布重要重要38A 与与 B 药联用产