《第5章假设检验名师编辑PPT课件.ppt》由会员分享,可在线阅读,更多相关《第5章假设检验名师编辑PPT课件.ppt(82页珍藏版)》请在优知文库上搜索。
1、第5章 假设检验本章内容 5.1 假设检验的基本思想 5.2 总体标准差已知条件下均值双侧检验 5.3 案例研究:运输天数单侧检验 5.4 标准差未知时总体均值的假设检验 5.5 案例研究:顾客满意度假设检验 5.6 总体方差的假设检验下一页返回目录上一页下一页返回本章首页5.1.1 假设检验的基本思想5.1.2 假设检验的基本内容5.1.1 假设检验的基本思想 1假设检验命题 例 某粮食加工厂的包装部门欲对其包装进行检测。如果包装过程操作正确,每袋粮食重量服从均值为 16公斤,标准差为0.50公斤的正态分布。现随机抽 取10袋作为样本,样本的平均重量是15.43 公斤。问样本平均重量与总体平
2、均重量是否具有显著差异,以上数据能否证明包装工作过程正常。上一页下一页返回本节首页 在统计学中,把需要通过样本去推断其正确与否的命题称为原假设,用Ho表示。与原假设相对立的假设便是备择假设,用Ha表示。假设检验的目的是判断原假设是否正确,所以这里首先假定原假设正确,即每袋的平均重量是16公斤;然后,通过Excel模拟抽样,从原假设的总体中获得样本;最后,判断样本均值15.43公斤是否符合条件。如果符合,说明样本与原假设是一致的,如果不符合,则说明样本与原假设不一致,即原假设不正确。上一页下一页返回本节首页2模拟抽样 样本重量均值是15.43公斤,与总体均值16公斤相差0.57公斤。那么判断0.
3、57公斤的差异是由于随机因素造成的,还是由于包装过程中出现的质量问题,可以通过模拟抽样来进行分析。已知粮袋的平均重量服从均值为16公斤和标准差为0.50公斤的正态分布,据此可用随机数生成工具模拟一个粮袋的填装重量,以检查0.57公斤的差异是否正常。打开“第5章 假设检验.XLS”工作簿,选择“模拟”工作表。上一页下一页返回本节首页在“工具”菜单选择“数据分析”选项,打开“数据分析”对话框。在“分析工具”列表中选择“随机数发生器”,单击“确定”按钮,打开“随机数发生器”对话框如图所示。上一页下一页返回本节首页在“变量个数”选项中输入10,“随机数个数”选项中键入1。单击“分布”框,选择“正态分布
4、”。在“参数”选项中输入均值16,标准偏差0.5。在“输出区域”中输入单元格A2,单击“确定”按钮。10个袋重量的数值将分别显示在单元格A2:J2中。在单元格K1中输入“样本均值”。在单元格K2中输入计算A2:J2中数值均值的公式“=AVERAGE(A2:J2)”,注意需要使用相对引用。上一页下一页返回本节首页在单元格N1 中输入“总体均值”,在单元格O1处输入16。在单元格L1中输入“离差”。在单元格L2中放置样本均值与总体均值的离差绝对值,可以使用绝对值函数ABS输入公式,其公式为“=ABS(K2-$O$1)”,它表示样本均值K2与总体均值O1之差的绝对值。返回随机数发成器对话框,再抽取一
5、个容量为10的样本。不改变其他内容单击“确定”。将两次抽样的样本均值与总体均值进行比较。上一页下一页返回本节首页 上面两个样本只是说明样本均值不可能完全等于16,如果观察大量样本,结果会更有说服力。下面利用Excel模拟1000个样本。打开随机数发生器对话框 由于重复前面的操作,只需将随机变量个数从1改为1000,单击“确定”按钮。将单元格K2和L2中的公式复制到K3:L1001区域中的各个单元格中。K列中显示的是本行中的样本均值,L列显示的是样本均值与16的离差绝对值。上一页下一页返回本节首页 3.判断是否存在显著差异 在1000个样本中,如果样本均值与总体均值的离差绝对值小于0.57的样本
6、非常少,那么上例中出现的0.57离差便可能是质量问题。反之,如果在1000个样本中,离差绝对值大于0.57的样本有许多,则上例中的离差则可能是出于偶然,不一定是质量问题。如何确定有多少样本均值与总体均值的离差小于0.57呢?一个简单的办法是:根据离差进行排序,以便样本均值与16相差最大的样本出现在最顶端。上一页下一页返回本节首页选择单元格A1到L1001。打开“数据”菜单中的“排序”选项,打开“排序”对话框如图所示。上一页下一页返回本节首页在“当前数据清单”框中选择“有标题行”。单击“主要关键字”框中的下拉箭头,从列表中选择“离差”。选择“递减”排序方式。单击“确定”按钮,Excel将根据样本
7、均值与16的离差值对模拟样本进行降序排列如图所示。上一页下一页返回本节首页 从图中可以看出,在1000个样本中,样本均值与16的离差等于或大于0.57的样本是非常有限的。这说明如果随机抽取均值为16,标准差为0.5,样本容量为10的1000个样本,其离差大于或等于0.57的可能性是很小的。随机抽取到离差为0.57公斤的样本的可能性是很小。换言之,包装过程中可能出现了某些问题,使总体均值不再是16公斤。因而拒绝接受总体均值等于16的原假设,而认为备择假设是正确的。上一页下一页返回本节首页 如果样本平均重量为15.89公斤,将做如何解释呢?此时样本均值与16相差为0.11,在1000个样本中离差超
8、过0.11的样本所占比重约为0.40。这表明离差0.11(或更多)出现的可能性很大,它可能是由于随机原因引起,所以不能判断包装过程是否出错,无法拒绝原假设。假设检验的基本思想是应用小概率的原理。所谓小概率原理是指发生概率很小的随机数在一次试验中是几乎不可能发生的,根据这一原理,可以作出是否拒绝原假设的决定。上一页下一页返回本节首页5.1.2 假设检验的基本内容 假设检验的规则就是把随机变量取值区间划分为两个互不相交的部分,即拒绝区域与接受区域。当样本的某个统计量属于拒绝区域时,将拒绝原假设。落入拒绝区域的概率,就是小概率,一般用显著性水平表示。上一页下一页返回本节首页假设检验操作步骤:1构造假
9、设 根据研究问题的需要提出原假设和备择假设。在统计的假设检验中,总是原假设Ho(或)估计值,相应的备择假设用Ha,“”估计值。2确定检验的统计量及其分布假设确定以后,决定是否拒绝原假设需根据某一统计量出现的数值,从概率意义上来判断,这取决于样本观察值。对于均值检验来说,当总体方差已知时,或大样本条件下,现象服从正态分布,可选用z统计量;如果在总体标准差未知,且小样本情况下,现象服从t分布,则选择 t 统计量。上一页下一页返回本节首页3确定显著性水平 确定显著性水平以后,拒绝区域也就随之而定。如果拒绝区域放在两侧,则称为双侧检验或双尾检验,两边各为a/2。如果拒绝区域放在曲线一侧,称为单侧检验或
10、单尾检验。显著性水平性的大小可根据研究问题所需要的精确程度和可靠程度而定。上一页下一页返回本节首页4确定决策规则 决策规则通常有两种方法。一种是临界值法,即统计量与临界值z或 t进行比较,通常对于双侧检验,统计量绝对值大于临界值便拒绝原假设,小于临界值便不能拒绝原假设。另一种是P值法,它是将统计量所计算的z值或t值转换成概率P,然后与显著性水平进行比较。Pa,不能拒绝Ho,说明所采用的检验方法不能证明样本所描述的总体与原假设所描述的总体具有显著差异。上一页下一页返回本节首页5判断决策在确定决策规则之后,就根据抽样观察结果,计算检验统计量的具体数值,按照决策规则作出统计决策。上一页下一页返回本节
11、首页5.2 总体标准差已知条件下均值双侧检验 5.2.1 构造检验统计量 5.2.2 P值法 5.2.3 临界值法上一页下一页返回本章首页 5.2.1 构造检验统计量 例 某企业购买金属板 供应商声称金属板的厚度渐近服从正态分布,其总体均值为15毫米,总体标准差为0.1毫米。该企业随机抽取了50张金属板作为样本,测得样本均值为14.982毫米。以0.05显著性水平,能否证明供应商提供的总体均值是正确的。上一页下一页返回本节首页提出假设:原假设:Ho:=15;备择假设:Ha:15。统计量:由于总体服从正态分布且总体标准差已知,选z作为统计量。又因为如果样本均值显著大于或小于15,都拒绝原假设,故
12、该检验是双侧检验。确定显著性水平:根据题意可知显著性水平为a=0.05。上一页下一页返回本节首页决策规则 根据显著性水平可得下图。从图可以看出,临界值为1.96,所以,统计量绝对值如果大于1.96,则落入拒绝区域,拒绝原假设。同样,如果统计量的P值小于,则落入拒绝区域,拒绝原假设。上一页下一页返回本节首页进行假设检验:打开“第5章 假设检验.xls”工作簿,选择“z双侧检验”工作表如图所示。上一页下一页返回本节首页在单元格B4中输入总体均值15,单元格B5输入标准差0.1,在单元格E4中输入14.982,在单元格E6输入样本容量50。在单元格B6输入公式“=B3/SQRT(E3)”,计算标准误
13、差,显示的值将是0.014142。在单元格B9中输入显著性水平0.05。在单元格E10中,输入计算统计量z值的公式“=(E2-B2)/B4”,显示值为-1.27279。要判断是否拒绝原假设,可以使用两种方法,一种是应将统计量z值转换成概率的P值法,另一种是将显著性水平转换成一个z值的临界值法。上一页下一页返回本节首页5.2.2 P值法 P值法是将统计量z值转换成概率,即大于统计量z的绝对值的概率。下图中阴影区域的面积和即为该概率。上一页下一页返回本节首页 Excel的标准正态分布函数NORMSDIST可被用来计算这个面积,返回小于已知标准正态变量的概率。如果变量值是负1.2729,则标准正态分
14、布函数NORMSDIST返回密度函数图中左侧阴影区域的面积;如果变量值为正1.27279,则NORMSDIST中将返回这个值左边区域的面积。它等于1减去密度函数图中右侧阴影部分的概率。此题所要求的是双侧阴影区域的面积,可以把由-1.27279所计算的概率加倍,即可得到该值。上一页下一页返回本节首页 在单元格E9中输入公式“=2*NORMSDIST(-ABS(E10)”,回车后得0.203092。如果P值小于显著性水平,则拒绝原假设;否则,不能拒绝原假设。本例中P值是0.203092,大于显著性水平0.05,所以不能拒绝原假设。选择单元格B13,打开“插入”菜单中“函数”选项,打开“粘贴函数”对
15、话框如图所示。上一页下一页返回本节首页在“函数分类”列表中选择“逻辑”类,在“函数名”列表中选择条件函数IF,单击“确定”按钮,打开条件函数IF对话框如图所示。上一页下一页返回本节首页在“logical-test”区域中输入“E9B9”在“Value-if-true”区域中输入“拒绝”。在“Value-if-false”区域内,输入“不能拒绝”,单击“确定”键。在单元格B13中显示“不能拒绝”。在这个检验中,“不能拒绝”原假设是因为样本均值与假设总体均值(15)非常接近,它的离差可以通过概率(P值)大于显著性水平来解释。当样本均值为14.982时,它很接近供应商提供的总体金属板的均值,所以经过
16、检验得出的结论是:没有证据证明供应商提供的总体均值是不正确的。上一页下一页返回本节首页 如果样本均值远离15时会怎样解释呢?选择单元格E4并输入14.95,我们会看到统计量z值(用绝对值表示)增加到3.53553,P值减少到0.000407,P值小于显著性水平,此时便可以拒绝原假设。上一页下一页返回本节首页5.2.3 临界值法 临界值法是将显著性水平转换成临界值,定义“拒绝区域”。落入拒绝区域中的z值的概率等于显著性水平所对应的阴影面积。对于双侧检验来说每个单侧的面积是显著性水平的一半。计算临界值需要使用函数NORMSINV。上一页下一页返回本节首页选定单元格10,选择“插入”菜单中“函数”选项,打开“粘贴函数”对话框。在“函数分类”列表中选择“统计”类,在“函数名”列表中选择函数“NORMSINV”。单击“确定”按钮,打开函数对话框如图所示。上一页下一页返回本节首页 函数NORMSINV的对话窗口中只有一个参数“Probability”,即小于z值的标准正态分布函数的概率。对于上页图中的下限临界值z来说,这个概率就是左侧区域的面积。因为显著性水平给出的是双侧区域的面积,那么下限临界值