《第九章方差分析与实验设计.ppt》由会员分享,可在线阅读,更多相关《第九章方差分析与实验设计.ppt(52页珍藏版)》请在优知文库上搜索。
1、第九章第九章 方差分析与实验设计方差分析与实验设计9.4 实验设计初步实验设计初步 9.2 单因素方差分析单因素方差分析9.3 双因素方差分析双因素方差分析 9.1 方差分析引论方差分析引论 9.1 方差分析引论方差分析引论 一、方差分析及其有关术语一、方差分析及其有关术语 方差分析(方差分析(analysis of variance ,ANOVA)analysis of variance ,ANOVA);通过检验各总体均值是否相等来判断分类型自通过检验各总体均值是否相等来判断分类型自 变量对数值型因变量是否有显著影响。变量对数值型因变量是否有显著影响。【例】:【例】:为了对几个行业的服务质量
2、进行评价,消费者协会在零为了对几个行业的服务质量进行评价,消费者协会在零售业、旅游业、航空公司、家电制造业分别抽取了不同售业、旅游业、航空公司、家电制造业分别抽取了不同的企业作为样本,每个行业中抽取的这些企业,假定他的企业作为样本,每个行业中抽取的这些企业,假定他们在服务对象、服务内容、企业规模等方面基本上是相们在服务对象、服务内容、企业规模等方面基本上是相同的。然后统计处最近一年消费者对总共同的。然后统计处最近一年消费者对总共2323家企业投诉家企业投诉的次数,结果如表的次数,结果如表10-110-1表表9-1 消费者对四个行业的投诉次数消费者对四个行业的投诉次数问题:四个行业之间服务质量是
3、否有显著性差异问题:四个行业之间服务质量是否有显著性差异因素因素(或因子或因子factor):检验对象检验对象水平(或处理水平(或处理treatment):因素的不同表现。):因素的不同表现。单因素方差分析:一个因素即一个分类型变量,单因素方差分析:一个因素即一个分类型变量,一个数值型因变量一个数值型因变量。二、方差分析的基本思想和原理二、方差分析的基本思想和原理1、图形描述、图形描述2、误差分解、误差分解总误差总误差(SST)组内误差组内误差(SSE)组间误差组间误差(SSA)3、误差分析、误差分析三、方差分析中的基本假定三、方差分析中的基本假定1、每个总体都服从正态分布;、每个总体都服从正
4、态分布;2、各个总体的方差必须相同;、各个总体的方差必须相同;3、观测值是独立的。、观测值是独立的。n n9.2 单因素方差分析单因素方差分析 (one-way analysis of variance)一、数据结构一、数据结构表表9-2单因素方差分析的数据结构单因素方差分析的数据结构二、分析步骤二、分析步骤1、提出假设、提出假设012kH:自变量对因变量没有显著性影响自变量对因变量没有显著性影响112kH:,不全相等,自变量对因变量有显著影响不全相等,自变量对因变量有显著影响2、构造检验的统计量、构造检验的统计量(1)计算各样本均值)计算各样本均值 1(1,2,)inijiiixxikn对表
5、对表9-1中数据计算各行业均值中数据计算各行业均值(2)、计算全部观测值的总均值)、计算全部观测值的总均值111inkkijiiijixn xxnn(3)计算各误差平方和计算各误差平方和总平方和:总平方和:21122()(5747.869565)(5847.869565)4164.608 696inkijijSSTxx组组间间间间平平方方和和k2i 122A()7(4947.869565)5(5947.869565)1456.608 696iiSSn xx 组内平方和组内平方和零售业:零售业:72111()700iixx旅游业:旅游业:62221()924iixx航空公司:航空公司:52331
6、()434iixx家电制造业:家电制造业:52441()650iixxSSE=700+924 +434+650 =2708于是:于是:ST=SSE+SSA(4)计算统计量)计算统计量SSTSST的自由度为的自由度为n-1n-1;SSASSA的自由度为的自由度为k-1k-1;SSESSE的自由度为的自由度为n-kn-k。各平方和自由度的比值称为均方(各平方和自由度的比值称为均方(mean square):1456.608 696485.536 232141SSAMSAk2708142.526 316234SSEMSSnk(1,)MSAFF knkMSE485.536 2323.406 60314
7、2.526 316MSAFMSE3、统计决策、统计决策 拒绝域拒绝域F FF 拒绝原假设,表明确有显著性差异;拒绝原假设,表明确有显著性差异;FF 接受原假设,表明差异不显著。接受原假设,表明差异不显著。4、方差分析表、方差分析表表表9-4方差分析表的一般形式方差分析表的一般形式表表9-5 四个行业被投诉次数的方差分析表四个行业被投诉次数的方差分析表5、用、用Excel进行方差分析进行方差分析第第1步:选择【工具】下拉菜单,并选择【数据分析】选项,步:选择【工具】下拉菜单,并选择【数据分析】选项,第第2步:在分析工具中选择【单因素方差分析】,然后单击步:在分析工具中选择【单因素方差分析】,然后
8、单击 【确定】【确定】,第第3步:当对话框出现时,步:当对话框出现时,在【输入区域】方框内输入数据单元格区域在【输入区域】方框内输入数据单元格区域A3:D9。在【在【a】方框内输入】方框内输入0.05(可根据需要确定。(可根据需要确定。在【输出选项】中选择优输出区域。在【输出选项】中选择优输出区域。结果如图结果如图9-6图图9-6 用用XExcel 进行方差分析的步骤进行方差分析的步骤表表9-6 Excel输出的方差分析结果输出的方差分析结果三、关系强度的测量三、关系强度的测量当组间方差不为当组间方差不为0时就意味着变量之间有关系,特别的当时就意味着变量之间有关系,特别的当SSA大于大于SSe
9、时,而且达到一定程度,就意味着两个变量时,而且达到一定程度,就意味着两个变量之间的关系显著,大得越多他们之间的关系就越强。之间的关系显著,大得越多他们之间的关系就越强。关系强度(判定系数):关系强度(判定系数):2SSARSST前例中的数据:前例中的数据:21456.608 6960.349 75934.975 9%4146.608 696SSARSST四、方差分析中的多重比较四、方差分析中的多重比较 (multiple comparison procedures)费希尔最小显著差异方法费希尔最小显著差异方法(least significant difference):第第1步:提出假设:步:
10、提出假设:0111:,:.jjHH第第2步:计算检验统计量:步:计算检验统计量:ijxx第第3步:计算步:计算LSD:/211()ijLSDtMSEnn 第第4步:根据显著性水平做出决策,如果步:根据显著性水平做出决策,如果ijxxLSD则拒绝原假设,否则接受原假设。则拒绝原假设,否则接受原假设。例例10.2。根据表。根据表9-6种输出结果,对四个行业均值多重种输出结果,对四个行业均值多重 比较(比较(a=0.05)解:解:第第1步,提出如下假设:步,提出如下假设:检验检验1:013113:,:.HH检验检验4:检验检验3:检验检验6:检验检验5:检验检验2:012112:,:.HH01411
11、4:,:.HH023123:,:.HH024124:,:.HH034134:,:.HH第第2步步 计算检验统计量计算检验统计量1249481xx13493514xx14495910 xx23483513xx24485911xx34355924xx第第3步步 计算计算LSD检验检验1:1112.093142.526 316()13.9076LSD 检验检验2:2112.093142.526 316()14.6375LSD 检验检验3:3214.63LSDLSD检验检验4:1112.093142.526 316()15.1365LSD 检验检验5:5415.13LSDLSD检验检验6:6112.0
12、93142.526 316()15.8055LSD 第第4步:作出决策步:作出决策12113.90,xx接受原假设,不能认为零售业与旅游接受原假设,不能认为零售业与旅游业的投诉次数之间有显著性差异;业的投诉次数之间有显著性差异;131414.63,xx接受原假设,不能认为零售业与航空公司接受原假设,不能认为零售业与航空公司的投诉次数之间有显著性差异;的投诉次数之间有显著性差异;141014.63xx接受原假设,不能认为零售业与家电制接受原假设,不能认为零售业与家电制造业的投诉次数之间有显著性差异;造业的投诉次数之间有显著性差异;231315.13xx接受原假设,不能认为旅游业与航空公接受原假设
13、,不能认为旅游业与航空公司的投诉次数之间有显著性差异;司的投诉次数之间有显著性差异;241115.13xx接受原假设,不能认为旅游业与家电制造接受原假设,不能认为旅游业与家电制造业的投诉次数之间有显著性差异;业的投诉次数之间有显著性差异;342415.80,xx拒绝原假设,航空公司与家电制造业的拒绝原假设,航空公司与家电制造业的投诉次数之间有显著性差异。投诉次数之间有显著性差异。9.3 双因素方差分析双因素方差分析(two-wayanalysis of variance)一、双因素方差分析及其类型一、双因素方差分析及其类型例例9.3 9.3 有四个品牌的彩电在有四个品牌的彩电在5 5个地区销售
14、,为分析彩个地区销售,为分析彩电的品牌(电的品牌(“品牌品牌”因素)和销售地区(因素)和销售地区(“地区地区”因素)因素)对销售的影响,组队每个品牌在各地区的销售量取得对销售的影响,组队每个品牌在各地区的销售量取得以下数据以下数据9 9(单位:台)如表(单位:台)如表10-710-7所示。试分析品牌所示。试分析品牌和销售地区对彩电销售量是否有显著性影响(和销售地区对彩电销售量是否有显著性影响(a=0.05a=0.05)表表9-7 4个品牌的彩电在个品牌的彩电在5个地区的销售数据个地区的销售数据无重复双因素方差分析无重复双因素方差分析(two-factor without replication
15、),无交互作用无交互作用(interaction)的双因素方差分析:的双因素方差分析:两个因素相互独立,如本例中的两个因素相互独立,如本例中的“地区地区”和和“品品牌牌”可重复双因素方差分析可重复双因素方差分析(two-factor witht replication),两个因素之间相互作用可对数值变量产生影响。两个因素之间相互作用可对数值变量产生影响。二、无交互作用的双因素方差分析二、无交互作用的双因素方差分析1、数据结构、数据结构表表9-8 双因素方差分析的数据结构双因素方差分析的数据结构二、分析步骤二、分析步骤1、提出假设、提出假设行因素提出假设:行因素提出假设:012kH:行因素对因变
16、量没有显著性影响行因素对因变量没有显著性影响112kH:,不全相等,行因素对因变量有显著影响不全相等,行因素对因变量有显著影响列因素提出假设:列因素提出假设:012rH:列因素对因变量没有显著性影响列因素对因变量没有显著性影响112rH:,不全相等,列因素对因变量有显著影响不全相等,列因素对因变量有显著影响2、构造检验统计量、构造检验统计量211222111111()()()()krijijkrkrkrijijijijijijSSTxxxxxxxxxx211()kriijSSRxx行因素产生误差平方和:行因素产生误差平方和:列因素产生误差平方和:列因素产生误差平方和:211()krjijSSCxx随机误差平方和:随机误差平方和:211()krijijijSSExxxx计算均方计算均方1SSRMSRk行因素均方:行因素均方:列因素均方:列因素均方:1SSCMSCr随机误差均方:随机误差均方:(1)(1)SSEMSSkr行因素检验统计量:行因素检验统计量:(1,(1)(1)RMSRFF kkrMSE列因素检验统计量:列因素检验统计量:(1,(1)(1)CMSCFF rkrMSE(3)统计决