《第 五 章 方差分析.ppt》由会员分享,可在线阅读,更多相关《第 五 章 方差分析.ppt(72页珍藏版)》请在优知文库上搜索。
1、医学统计学及其软件包医学统计学及其软件包第第 五五 章章 方差分析方差分析第一节 概论 方差分析(Analysis of Variance,简记为:ANOVA)的应用范围很广,本章的方差分析主要用于检验计量资料中两个或两个以上均数间差别显著性的方法。以一个实例说明方差分析的基本思想和原理。第二节 单因素方差分析(one-way ANOVA,completely random design ANOVA)例5.1 小白鼠给药前后发生咳嗽的推迟时间(秒)复方 复方 可待因 40 50 60 15 -10 30 -5 105 77 。例数 15 15 10 均值 31.67 44 60.7 常见的错误
2、是进行三组之间的两两t检验。这将增加第一类误差的概率。如两组比较作一次t检验取=0.05;三组之间的两两t检验作三次t检验,至少有一次拒绝H0的概率为0.14。五组之间的两两t检验作十次t检验,至少有一次拒绝H0的概率为0.40。两组以上均数的比较不能用两两t检验,而必须用方差分析。要比较三种药物的平均推迟咳嗽时间有否差异?总体1N(1,12)样本1(n1,S1)总体2N(2,22)样本2(n2,S2)总体3N(3,32)样本3(n3,S3)已知:12=22=32 ,不相等 问:1=2=3??1,2,3不相等 1x2x3x1x2x3x方差分析法的模型方差分析法的基本思想 组间变异(不同药物引起
3、,包含误差)总变异 组内变异(误差引起)如不同药物的作用相同,并且无抽样误差,则:F=组间变异/组内变异=1 由于抽样误差,F不等于1,但和1相差不大,F越大概率越小,如概率P0.05,则可认为不同药物的作用是不相同的。即样本均数之间的差异有统计学意义。方差分析法的基本思想为:根据效应的可加性,将总的离均差平方和分解成若干部分,每一部分都与某一种效应相对应,总自由度也被分为相应的各个部分,各部分的离均差平方和除以相应自由度得出各个均方,然后列出方差分析表算出F值,作出统计推断。方差分析法的基本思想方差分析法的基本思想H0:1=2=3H1:至少有一个等式不成立或:H0:三种药物对小白鼠镇咳作用相
4、同H1:三种药物镇咳作用不完全相同方差分析法的基本思想离均差平方和用SS表示,自由度用DF表示,均方(MEAN SQUARE)用MS表示 MS=SS/DF 即方差。SS总=SS组间+SS组内 DF总=DF组间+DF组内 F=MS组间/MS组内 =(SS组间/DF组间)/(SS组内/DF组内)根据F和DF组间,DF组内查方差分析用F界值表,得P值。如P0.05,拒绝H0。方差分析法的基本思想 以上分解和检验可列成方差分析表的形式:方差分析表 变异来源 平方和 自由度 均方 F值 P值 Source SS DF MS F P 总变异 组间 误差 方差分析法的基本思想 如果影响数据变异的因素不止一个
5、,则可作二因素或三因素等的方差分析,总变异可分解成和各因素相对应的各个变异;这样,分解越细,误差越小,检验的效率就越高。方差分析的基本要求 1.各组样本来自正态分布的总体。2.各总体的方差相等。3.各效应的可加性。如不符合基本要求时,可进行变量变换,变换成正态分布后再进行检验或用非参数检验的方法。变 量 变 换1.服从对数正态分布的资料可用对数变换 y=log(x)2.服从泊松分布的资料可用平方根变换 y=3.表达成百分数的资料可用平方根反正弦变换 y=arcsinxxNxC2)(校正数总平方和Cx2组间平方和Cnxnxnx323222121)()()(方差分析基本步骤组内平方和=总平方和组间
6、平方和DF总=N-1DF组间=组数-1DF组内=DF总-DF组间 方差分析表变异来源 SS df MS F P 总变异 31939.9 39药物间变异 5062.4667 2 2531.2333 3.4845 F0.05故知P3.46,故P0.05,而其余二个Q皆小于q0.05;因此复方与可待因两药对小白鼠平均推迟咳嗽时间,在=0.05水平上有显著差异,其余任两药间差异皆不显著。均数间两两比较进行均数间两两比较的方法很多:SNK(Student-Newman-Keuls)检验,DUNCAN检验,Tukey检验,LSD(最小显著差)检验,Scheffe检验,等。如只须几个实验组和一个对照组比较,
7、实验组之间不比较:DUNNETT检验,DUNCAN新法,等第四节 方差齐性检验H0:各个正态总体方差相等,即12=22=K2H1:至少存在一对i,j,有i2 j 2 本书中介绍一种稳健的(Robust)方差齐性检验方法-Levene检验,它可以用于两个或两个以上方差的齐性检验。(1)对于K组的样本资料,求得各组的均数后计算观察值距各自组均数的绝对离差。(2)以绝对离差作为主要变量,使用前述的方差分析法。当拒绝H0时,认为各组方差不齐;当不拒绝H0时,认为方差齐性。算得三个药物组:=31.6667,=44,=60.7,得绝对离差如下:复方 复方 可待因 8.3333 6 0.7 21.6667
8、24 30.7 .18.3333 14 再用上表中绝对离差值进行方差分析。1x2x3x第四节 方差齐性检验第四节 方差齐性检验变异来源 SS DF MS F P 总变异 9108.39 39 药物间 679.56 2 339.78 1.49 0.2382 误差 8428.83 37 227.80 由于P=0.2382,因此不拒绝H0,而认为三组方差齐性,因此符合均数间比较的方差分析法的基本要求。第五节第五节 随机单位组设计方差分析随机单位组设计方差分析 (randomized block design ANOVA)randomized block design ANOVA)随机单位组设计又称随
9、机区组设计,随机配伍组设计,它是两样本配对试验的扩大。单位组 处理1 处理2 .处理k 1 X11 X12 X1k 2 X21 X22 X2k 。b Xb1 Xb2 Xbk 随机单位组设计方差分析随机单位组设计方差分析 大白鼠注射不同剂量雌激素后的子宫重量(g)雌激素剂量(g/100g)大白鼠种系 0.2 0.4 0.8 A 106 116 145 B 42 68 115 C 70 111 133 D 42 63 87 随机单位组设计方差分析随机单位组设计方差分析 欲比较因素的K个水平的各变量均值,同时控制另一个因素的作用。试验设计时,先将受试对象按其它控制因素性质相同或相近者组成单位组,每个
10、单位组有K个受试对象,分别随机分配至因素的K个水平上。这时每个水平的受试对象不仅数量相同,而且性质亦相同或相近,就能缩小误差,提高实验效率。这样的设计可将单位组亦看作一个因素,就成为二个因素的设计随机单位组设计方差分析 处理间变异 组间 总变异 单位组间变异 组内 误差 (误差)和单因素方差分析相比,误差减少了,检验效率提高了。随机单位组设计方差分析 可作二个假设检验:(1)H0:因素各水平x的均值相同 H1:因素中至少有二个水平的x均值不相同 F1=MS因素/MS误差 DF因素=K-1,DF误差=(bk-1)-(k-1)-(b-1)=bk-k-b+1(2)H0:各个单位组的x均值相同 H1:
11、至少有二个单位组的x均值不相同 F2=MS单位组/MS误差 DF单位组=b-1,DF误差=bk-k-b+1当欲进一步比较因素中任二个的水平x均值是否相同。可用本章第三节中均数间两两比较的检验。大白鼠注射不同剂量雌激素后子宫重量处理组:雌激素剂量,三水平(0.2,0.4,0.8)单位组:大白鼠种系,四水平(A,B,C,D)变异来源 SS DF MS F P 总 13075 11剂量间 6074 2 3037 33.54 0.01种系间 6457.67 3 2152.56 23.77 0.05受试者间 2853.67 4 713.41 16.27 0.05 误差 526.14 12 43.84 F
12、0.05(4,12)=3.26,F0.01(4,12)=5.41处理因素为药物复方1复方2可待因处理因素为药物不同浓度控制因素为动物种系单因素方差分析单位组设计方差分析拉丁方设计方差分析拉丁方设计方差分析防护服A、B、C、D、E受试者甲、乙、丙、丁、戊试验日期1、2、3、4、5第七节第七节 析因设计的方差分析析因设计的方差分析 (factorial design ANOVA)(factorial design ANOVA)析因设计是一种多因素的交叉分组试验设计。例如:提取某蛋白质成分的研究中,蛋白质的提取量和温度,试剂浓度及PH值有关。温度分高,中,低三个水平;试剂浓度分0.1,0.2,0.3
13、,0.4 四个水平;PH值分6和8二个水平。这三个因素的各水平相结合,共形成342=24种处理组;各种处理组各有数例,这样的试验叫析因设计。由于进行了交叉设计,同时每组又有重复,因此可检验各因素间的交互作用(interaction)。上述试验也可称为342析因试验设计。重复数可以相等也可以不相等,一般地说,重复数相等时,效率最高。第七节第七节 析因设计的方差分析析因设计的方差分析最简单的析因设计是22析因设计。有二个因素,每个因素分二个水平。因素A:分A1和A2二个水平;因素B:分B1和B2二个水平;分四个处理组:A1B1,A1B2,A2B1和A2B2。每个处理组做若干次试验。第七节第七节 析
14、因设计的方差分析析因设计的方差分析例例5.45.4 某研究所对甲、乙两药的降胆固醇作用进行研究,将甲药视作为因素,下有二个水平,水平1为不加甲药,水平2为加甲药。乙药为因素,水平1为不加乙药,水平2为加乙药。构成了22=4个水平组合,试验中将12个高胆固醇病人随机分为四组,每组3例,进行治疗,观察胆固醇的下降值。本试验为22析因试验设计,重复数为3。22析因设计试验结果 因素(乙药)因素 (甲药)水平1(不加)水平2(加)水平1 0.416 0.728(不加)0.650 0.806 0.468 0.598 水平2 1.456 1.664(加)1.144 2.028 1.092 2.080 第七
15、节第七节 析因设计的方差分析析因设计的方差分析交互作用 当二个因素的作用相互独立时,称这二个因素无交互影响;当二个因素的作用不独立,而相互有影响时,称这二个因素有交互影响。当存在交互影响时表示一个因素各水平间的差异随着另一个因素的水平改变而不同;当不存在交互影响时,则各个因素独立,即一个因素水平改变时不影响另一个因素的各水平之效应。因素A和因素B的交互作用记为AB。交互作用:几个因素联合作用不等于这几个因素单独作用的累加(有的情况是相乘),称这几个因素间存在交互作用,否则称为不存在交互作用或称为这几个因素相互独立。第七节第七节 析因设计的方差分析析因设计的方差分析 因素1引起的变异(甲药)因素
16、2引起的变异(乙药)总变异 因素1和因素2的交互作用引起的变异 误差 可作三个假设检验。第七节第七节 析因设计的方差分析析因设计的方差分析(1)H0:因素的各水平的胆固醇的平均降低值相同;H1:因素的各水平的胆固醇的平均降低值不相同;(2)H0:因素的各水平的胆固醇平均降低值相同;H1:因素的各水平的胆固醇平均降低值不相同;(3)H0:因素的各水平的胆固醇平均下降值的差异,独立于因素,或者因素的各水平的胆固醇平均下降值的差异独立于因素;H1:两者不独立。第(3)个假设就是检验两个因素的交互影响。第七节第七节 析因设计的方差分析析因设计的方差分析 例5.4的方差分析表变异来源 SS DF MS F P 总变异 3.8146 11 因素 2.8014 1 2.8014 96.2680 0.01 因素 0.5976 1 0.5976 20.5361 0.01 0.1813 1 0.1831 6.2921 累加:有协同作用联合作用累加:有桔抗作用联合作用=累加:无交互作用 本例有协同作用。第八节 方差分析的SAS程序 可用于各种方差分析的SAS过程较多,常用的有二个过程:ANOVA过程:只用于