《临床科研数据分析的注意事项.ppt》由会员分享,可在线阅读,更多相关《临床科研数据分析的注意事项.ppt(45页珍藏版)》请在优知文库上搜索。
1、 统计方法选择不当选择t检验时未考虑数据的分布类型将方差分析拆分成多个t检验用单因素方差分析解决重复测量资料使用四格表卡方检验时未考虑N和T的大小使用卡方检验解决等级资料问题使用线性回归解决非线性问题使用Logistic回归解决队列研究的资料使用普通方差分析解决协方差/多元方差分析问题多元统计时未考虑自变量的共线性主成分分析与因子分析误用其它0.00.20.40.60.81.050100150200Fig.1 The Scatterplot of Rate and ConcentrationConcentration,ppmRateRate 11exRate constant concRate
2、constantconcconc2Rate constant conc conc2 conc3InterventionControltpexample121.12.2(10)22.12.3(10)0.990.05example221.12.2(50)22.12.3(50)2.220.05example421.12.2(320)21.52.3(320)2.250.05example521.12.2(3200)21.32.3(3200)3.550.01组别T0T1T2T3A10020951660109318B9818941785159517C9921951495179719时点(周)某指标(度量衡
3、单位)基线时点1时点2时点3时点4时点522242628303234363840干预组对照组图1. 不同组别某指标历时性变化情况比较样本必须为进行多次重复测量的数据。可以是对同一条件下同一因变量的重复测量目的在于研究各种处理间差异是否有统计学意义的同时,研究受试着间的差异;也可以是不同条件下同一因变量的重复测量目的在于研究各处理间差异是否有统计学意义的同时,研究形成重复测量条件间的差异以及这些条件与处理间的交互效应。GLM:重复测量资料方差分析的主要手段数据结构:若干次重复测量结果作为不同因变量出现在数据文件中。重复测量设计与随机区组设计(时间为区组因素)相同点数据结构极为相似,甚至完全一样不
4、同点重复测量设计:的处理因素在区组(受试者)间是随机分配的,区组内的各时间点是固定的,不能随机分配;区组内的数据来自于同一受试者;随机区组设计:区组内的受试者彼此独立,处理只能在区组内随机分配,每个受试者接受不同的处理,即区组内的数据来自于不同的受试者。使用随机区组设计方差分析处理重复测量设计资料,会增大犯类错误的风险。将不同时点的测量值作为不同的变量data ex12_3;input t0-t4 g;cards;120 108 112 120 117 1 118 109 115 126 123 1119 112 119 124 118 1 121 112 119 126 120 1127 1
5、21 127 133 126 1 121 120 118 131 137 2122 121 119 129 133 2 128 129 126 135 142 2117 115 111 123 131 2 118 114 116 123 133 2131 119 118 135 129 3 129 128 121 148 132 3123 123 120 143 136 3 123 121 116 145 126 3125 124 118 142 130 3;proc glm; class g; model t0-t4=g; repeated time 5 contrast(1);run;重复
6、进行各时间点不同组别间的t(或F)检验忽略个体曲线变化特征重复测量数据不满足常规曲线拟合方法所要求的独立性假设差值比较缺乏信度用差值做组间比较须慎重须与协方差分析区别开来处理T1T2T3T4Axa11,xa12,xa13,xa1ixa21,xa12,xa23,xa2ixa31,xa32,xa33,xa3ixa41,xa42,xa43,xa4iBxb11,xb12,xb13,xb1ixb21,xb12,xb23,xb2ixb31,xb32,xb33,xb3ixb41,xb42,xb43,xb4i 研究设计 重复测量设计? 两因素两水平的析因设计? 随机区组设计? 三者的异同点是什么? 单因素分析
7、 多因素分析 线性模型方法:研究自变量与因变量间关系 多元方差分析、多元回归分析和协方差分析 判别函数分析和聚类分析:事物的合理分类; 主成分分析、典型相关等:如何用较少的综合因素代替为数较多的原始变量,类似于人大代表的选举。 定义 把总变异按照其来源(或实验设计)分为多个部分,从而检验各个因素对因变量的影响以及各因素间交互作用的统计方法。 析因设计、正交设计、嵌套设计、裂区设计等 优点:效率较高 可以在一次研究中同时检验具有多个水平的多个因素各自对因变量的影响以及各因素间的交互作用 要求 各个因素每一水平的样本必须是独立的随机样本 重复观测的数据服从正态分布,且各总体方差相等。单独效应(少有
8、人关注)A其它因素水平固定时,同一因素不同水平间的差异。主效应A某一因素各水平间的平均差别即单独效应均数A主效应间相互独立可视为多个单因素方差分析交互作用A当影响因子不唯一时,必要注意因子间的相互影响。F如果因子间存在相互影响,称为具有交互作用;如果因子间是相互独立的,则称为“无交互影响”共同点A都具有两个研究因素不同点A区组设计中两个因素的地位不同,研究区组因素是为了消除区组因素对处理因素的干扰;A两因素析因设计中两个因素的地位相等,既要研究两个因素的主效应和单独效应,同时还要研究两者的交互效应 定义:利用线性回归方法消除混杂因素影响后的方差分析是单因素方差分析的扩展 基本思想将研究因素以外
9、的其它因素作为协变量,建立线性回归方程,并利用这种回归关系把协变量的影响扣除后再进行各组Y的修正均数间判别的假设检验; 实质从Y的总变异中扣除协变量对Y的回归平方和,对残差平方和作进一步分解后再进行方差分析,以更好的评价各种处理的效应。 相同点 协方差分析的本质就是多元线性回归 不同点(侧重点不同): 协侧重于分析离散变量的影响,而多侧重于连线变量的影响 协方差分析兼具单因素方差分析和多元回归分析的优点 在考虑连续变量影响的条件下检验离散变量对因变量的影响,有助于排除非实验因素的干扰作用。 要求:各样本都来自方差齐的正态总体,各组的总体直线回归系数相等且都不为0 (什么意思?) 此处的对应于协变量。 分析前应先进行方差齐性检验和回归系数的假设检验,若符合或经变量变换后符合上述条件,方可作协方差分析。 原则应该入选的一个不能少,不该入选的一个不要注意避免自变量的共线性原因: 自变量过多或过少会大幅度降低回归模型的精度 自变量过少就一定程度上失去了多元分析的意义 自变量共线性的存在会歪曲自变量与因变量的关系应将回归效果显著的自变量纳入方程,将不显著的自变量从方程中剔除 专业人员和统计学家根据专业知识和经验确定 文献提示单因素分析全局择优法逐步选择法