《石大医学统计学讲义10不等数的方差分析.docx》由会员分享,可在线阅读,更多相关《石大医学统计学讲义10不等数的方差分析.docx(5页珍藏版)》请在优知文库上搜索。
1、第十讲不等数的方差分析除单因素的方差分析外,方差分析要求各组的例数相同。这是各因素的类别间是否具有可比性的条件之一。现场调查很难满足这个条件,临床或实验室研究,在研究计划和安排上各组数目相同,有时在实验的过程中由于动物的偶然死亡或数据的偶然短缺,使得最终结果的各组数目不同。随机区组和拉丁方设计对少数缺数可进行插补和矫正的方法解决。析因设计下缺数不能插补。统计上除发现在实验过程中有影响实验结果的问题外,不主张把已经得到结果的数据去掉。现场调查和实验中由于缺数而形成的不等数资料,可用不等数方差分析得到结果,这里介绍两种简单的方法。1、约略计算:当实验中组数较多而各组观测数相差很小时,可用约略法,其
2、步骤是:(1)原资料中各因素组间交叉,作为单因素处理组,然后按单因素方差分析求出组内平方和及均方。这个均方是观测资料的综合标准差的方差。由于单因素各组的数目可以不同,因此组内平方和及均方都是正确的。(2)把各因素交叉组的数学均数做成附表计算各主因素平方和和交互影响,并计算均方。这个均方是数学均数间的方差,即是均数标准误的方差。(3)标准差性质的方差和均数标准误性质的方差,两者之间差n的倍数。由于各组的n是不相等的,求其平均数。萝芙木总碱对吉田肉瘤的抑制作用24小时48小时对照5ml50ml500ml对照5ml5Oyml500ml523736374439261246392726454929194
3、4333732-4017n33332233X1421091009589889548X47.3336.3333.3331.6744.5044.0031.6716.00C=26670.727322SST=28992-26670.7273=2321.2727=22-1=2114221092482SSzi=+26670.7273=1961.43949333f=8-1=7SSzn=2321.2727-1961.4394=359.8333或=21-7=14SSwc=25.704附表(OyZmI)(5ml)对照(50ml)(500yml)计24小时47.3336.3333.3331.67148.6648小时
4、44.5044.0031.6716.00136.17计91.8380.3365.0047.67284.83Z2=10849.1145C=28483-=1015L01618SS=10849.1145-10141.0161=708.0984f=8-l=7SSsj=148662+136J72-10141.0161=19,500sj44# =2-1=1Co91.83280.33265.00247.672S“SSjj=10141.0161=550.52722222# =4-1=3SSjh=708.0984-19.5000-550.5272=138.0771# =13=30=86+2=2.6667SSwc
5、=25.7024/2.6667=9.6384方差分析表方差来源自由度平方和均方FP附表总7708.0984时间间118.500019.50002.02320.10剂量间3550.5272183.509119.0940.001交互影响3138.077146.02374.77500.05误差9.63842、差数法差数法要求二个因素中有一个因素分为两类,另一个因素不受限制。这两种方法只能对两因素的析因实验不等数作分析。下面用例子说明分析步骤。表17酮类胆固醇排量在正常人不同年龄、性别之间差别XnXx2A1C男0.5,0.8,0.8,0.5,1.5,0.9,0.55.570.78575.09U-ID女
6、1.1,0.4,0.4,2.6,0.55.051.0008.45男3.2,1.7,2.2,6.0,1,7,4.2,9.3,45.295.0233384.926-15女3.7,13.21.6,0.9,3.8,6.3,2.8,4.8,361.7,25.783.2125105.71男9.1,4.7,5.5,6.7,18.4,14.7,10.8,19.1,13.3,16.7,10.0,1.4,205.51811.41672669.4116-25女15.26.8,5.9,13.2,7.0,15.7,11.5,10.4,12.7,4.8,8.1,13.3,5.9,6.2,5.4181.0218.61901
7、746.18男15.6,12.3,13.1,13.4,12.69,11.6,18.4,14.7,13.5,12.3,7.9,11.7429.93711.61895272.7726-35女9.5,9.0,10.L10.7,9.6,5.2,6.1,7.6,17.9,10.9,7.2,7.3,13.4199.6248.31671870.58男12.6,158.9,11.1,8.0,13.9,8.6,11.2,8.2,13.5,14.0,10.1,10.6,181.41512.09332300.6436-45女16.5,15.5,11.714.5,7.0,7.6,6.4,8.9,3.9,3.8,13.
8、3,9.1,74.598.2778726.53男9.3,12.8,18.8,13.2,11.0,13.5,10.8,11.7,9.9,18.9,12.1,12.2,202.01711.88242569.5846-55女9.1,6.4,3.8,3.4,6.7,6.2,6.3,10.2,8.8,6.558.396.4778413.71男11.1,5.8,9.6,11.6,6.1,13.5,106.11010.611191.0911.7,13.3,11.2,12.2DO/D女8.5,4.0,6.9,5.8,5.2,8.0,4.6,6.9,6.4,8.5,8.573.3116.6636514.77合计
9、男女男X=1175.60n=113X2=19779.43女X=617.40n=87计=1793.00=200把原始资料作方差分析求出误差和两个主因素各自的平方和,这是具有偏性的主平方和,不能作交互影响,因为由于不等数的偏性交互影响可能出现负值。根据资料作方差分析如下:(1793)2200=16072450SS7-=1977943-16072450=37051850=199(5.(5) (5.0)2(45.2)2(25.7)2j(73.3)2,759811-16074.2450=18082.5198-16.74.2450=2008.2748# =13SSW=(W+174L-16074.2450=
10、16611.8134-16074.2450=537.5674SeX11387# =2-1=1”(10.5)2(70.9)2(386.5)2(179.4)2WSSage=Al-+L-+L-+L-16074.245012173921=17498.5558-16074.2450=1424.3108=7-1=6SSErrOr=3705.1850-2008.2748=1696.9102=199-13=186均方=9.1232上面计算的结果,误差是正确的,而性别间和年龄间都具有偏性。用每个年龄组不同性别的数学均数作为基础计算性别间的差别及平方和,这是性别间的无偏平方和,比较性别间有偏和无偏的平方和,可以得
11、到由于不等数所造成的偏倚。用它来年龄间的平方和。并用性别间差数的平方和求这差数在年龄间的平方和,也就是年龄和性别的交互影响。无偏校正计算表年龄组男女R+%向一元2(D)WDWD2n(W)NiMNiM0-570.785751.0002.9167-0.2143-0.62500.13396-1595.022383.21254.23531.80987.665013.872216-251811.4167218.61909.69232.797727.116175.862826-353711.6189248.316714.55743.302248.0714158.3741436-451512.093398.
12、27785.62503.815621.462281.889046-551711.882496.47785.88465.404631.8040171.887456-751010.6100116.66365.23813.946420.671681.5786计性别间无偏平方和:48.1494156.1653583.9653156.1653248.1494=506.4985,df= 1MS= 506.4985, F =型蟠=55.51769.1232df=l186P0.10附:方差分析的优缺点,1、分析是多因素综合影响下进行分析的有效方法。任何试验全受很多因素影响,为了明确各因素的影响程度,常常要孤立
13、某一个因素来研究,而把其它因素使之相同,然后再孤立第二因素来研究。这样要大量的试验,才能确定二、三个因素的影响结果。例如在研究高温作业的影响时,车间工作地点的温度、风速、辐射热、劳动强度和人的某些生理指标(如体温、脉搏等)全有很大关系。如果研究需要固定风速、固定辐射热、固定温度、固定劳动强度之下,不同车间湿度和生理指标的关系。2、方差分析可以在每种因素分类下,只有一个观测值就能确定各因素单独的或交互的对生理指标的影响,一般情况下因素越多,则方差分析的方法越比较好。3、方差分析进行的过程中,可以了解具体观察值所受到的误差的影响。误差影响可分为两大类;即随机误差和条件误差。4、一个因素下方差分析并不比t检验省事。F检验下差别显著时,表明各组间至少有两组间差别