《第7章统计假设检验.ppt》由会员分享,可在线阅读,更多相关《第7章统计假设检验.ppt(77页珍藏版)》请在优知文库上搜索。
1、第第 七七 章章统统 计计 假假 设设 检检 验验n 统计推断统计推断 是指根据样本以及问题的条件和假定模型对未知事物(即总体)作出的以概以概率形式表述的率形式表述的推断,它主要包括统计假设统计假设检验检验和参数估计参数估计两个内容。n统计假设检验统计假设检验又叫显著性检验显著性检验主要内容:主要内容:第一节第一节 显著性检验的基本原理显著性检验的基本原理第二节第二节 样本均数与总体均数的差异显著样本均数与总体均数的差异显著 性检验性检验第三节第三节 两样本平均数的差异显著性检验两样本平均数的差异显著性检验第四节第四节 显著性检验中应注意的问题显著性检验中应注意的问题第一节 显著性检验的基本原
2、理一、显著性检验的意义二、两种假设三、显著水平与两类错误四、双侧检验与单侧检验五、显著性检验的基本步骤一、显著性检验的意义n(一一)为什么要进行显著性检验?为什么要进行显著性检验?n例例1 某实验要求实验动物平均体重某实验要求实验动物平均体重=10.00g,现有现有实验动物实验动物10只,平均体重只,平均体重 =10.23g,已知总体已知总体标准差标准差=0.4g,问这些动物在该实验中能否使,问这些动物在该实验中能否使用?用?x例例2 2 在某种猪场随机抽测了甲、乙两品种经产母猪各10头的产仔初生窝重:甲品种10头母猪产仔平均初生窝重 乙品种10头母猪产仔平均初生窝重 问两品种经产母猪的产仔初
3、生窝重差异是否显著?1113.50,1.18xkg skg2211.63,2.37xkg skg(二二)检验目的与对象检验目的与对象n设抽取该10只动物的总体体重平均数为,实验要求的实验动物体重平均数为0.n目的总体平均数(=0)n对象 样本平均数x例例2 2 设甲品种猪产仔初生窝重的平均数为1,乙品种猪产仔初生窝重的平均数为2.v目的总体平均数(1=2)v对象 样本平均数)(21xx(三三)基本思路基本思路观察值由两部分组成即:若 样 本 含 量 为 n,则 可 得 到 n 个 观 察 值,样本平均数 。说明样本均数并非总体均数,它还包含试验样本均数并非总体均数,它还包含试验误差的成分误差的
4、成分。iixnxxx,21x试验误差试验误差对于接受不同处理的两个样本来说,则有:11x22x)()(212121 xx两样本均数之差两样本均数之差为试验表面效应为试验表面效应试验的处理效应试验的处理效应试验误差试验误差处理效应 未知,但试验表面效应dggggggg是可以计算的,借助于统计方法,试验误差 也是可以估计的因此可从试验的表面效应与试验误差的权衡比较中间接地推断处理效应是否存在,这就是显著性检验的基本思想。)(21)(21)(21xx(四四)基本前提基本前提收集到正确、完整而又足够的资料是通过显著性检验获得可靠结论的基本前提。二二、两种假设两种假设首先对试验样本所在的作假设。(一)零
5、假设(一)零假设(Null hypothesis)总体平均数是未知的,为了得到对总体平均数的推断,可以假设总体平均数0或00,其意义是试验的表面效应系试验误差,处理无效,故称为无效假设无效假设,也称为零假设,记作H0,H0:0或H0:00无效假设是被检验的假设,通过检验可能被接受,也可能被否定。(二)备择假设(二)备择假设(alternative hypothesisalternative hypothesis):记为HA,是在无效假设被否定,拒绝H0的情况下的所有可供选择的假设 若H0:0,则备择假设包括以下三种:HA:0HA:0HA:0 三、显著水平与两类错误三、显著水平与两类错误(一)小
6、概率原理 在显著性检验中,否定或接受无效假设的依据是“小概率事件实际不可能性原理”。小概率事件在一次试验中,几乎是不会发生的。若根据一定的假设条件计算出来该事件发生的概率很小,而在一次试验中竟然发生了,则可以认为假设的条件不正确,因此,否定假设。(二)显著水平(二)显著水平(Significance level)n 用来确定否定或接受无效假设的概率标准叫显著水平显著水平,记作。n 越小,显著性水平越高,越小,显著性水平越高,在生物学研究中常取=0.05 或或=0.01。n =0.05称为5%显著水平;=0.01称为1%显著水平或极显著水平。(三三)两类错误两类错误 型错误型错误(type er
7、ror)第一类错误是真实情况为H0成立,却否定了它,犯了“弃真弃真”错误错误。犯犯型错误的概率不会超过型错误的概率不会超过,型错误也叫错误错误。型错误型错误(type error)第二类错误是H0实际不成立,却接受了它,犯了“纳伪”错误。犯犯型错误的概率记为型错误的概率记为。型型错误又叫错误又叫错误。错误。两类错误间的关系:如图所示,图中左边曲线是H0为真时,的分布密度曲线;右边曲线是HA为真时,的分布密度曲线分布密度曲线()()犯型错误可能性的大小与取值的大小、两均数差异大小等因素有关:当当 值变小时,值变小时,值变大;反之亦然,也就是说值变大;反之亦然,也就是说型型错误错误 的降低必然伴随
8、着的降低必然伴随着型错误型错误的升高的升高 ;两均数差异越大,两均数差异越大,值越小。值越小。21xx 21xx 21两类错误示意两类错误示意图图否定域接受域否定域若一个试验耗费大,可靠性要求高,不允许反复,那么值应取小些;当一个试验结论的使用事关重大,容易产生严重后果,如药物的毒性试验,值亦应取小些。对于一些试验条件不易控制,试验误差较大的试验,可将值放宽到0.1,甚至放宽到0.25。在提高显著水平,即减小值时,为了减小犯型错误的概率,可适当增大样本含量。增大样本含量可以同时降低犯两类错误的可能性。如何选择合适的值小结:小结:因为显著性检验是根据“小概率事件实际不可能性原理”来否定或接受无效
9、假设的,所以不论是接受还是否定无效假设,都没有100的把握。若经检验“差异显著”,对此结论有95%的把握,同时要冒5%下错结论的风险;“差异极显著”,对此结论有99%的把握,同时要冒1%下错结论的风险;“差异不显著”,是指在本次试验条件下,无效假设未被否定。“差异不显著”并一定是“没有差异”。有两种可能:两个样本所在的总体确实没有显著差异;两个样本所在总体平均数有差异而因为试验误差大被掩盖了。因而不能仅凭统计推断就作出绝对肯定或绝对否定的结论。“有很大的可靠性,但有一定的错误率”,这是统计推断的基本特点。Ho:1=2;HA:12 或 Ho:=0;HA:0目的在于判断有无差异,不考虑谁大谁小四、
10、双侧检验与单侧检验(一)双侧检验(一)双侧检验(two-sided test)此时,在水平上否定域否定域为(-,-)和 ,+,对称地分配在u分布曲线的两侧尾部,每侧的概率为/2,如图所示。这种利用两尾概率进行的检验叫双侧检验双侧检验,也叫双尾检双尾检验验,为双侧检验的临界值。2u2u2u若无效假设为 H0:1=2,备择假设为 HA:12,为左尾概率,称为左尾检验,也称下尾检验,如下图所示。这种利用一尾概率进行的检验叫单单侧检验侧检验也叫单尾检验单尾检验。(二)单侧检验二)单侧检验 (one-sided test)若无效假设为H0:1=2,备择假设为HA:12,为右尾概率,称右侧检验,也称上尾检
11、验,如上图所示。(三三)单侧检验与双侧检验的关系单侧检验与双侧检验的关系 单侧检验的单侧检验的u u=双侧检验的双侧检验的u u22双侧检验显著,单侧检验一定显著;反之,单侧检验显著,双侧检验未必显著。n(四四)应用应用n选用单侧检验还是双侧检验应根据专业知识及问题的要求(分析的目的)在试验设计时就确定。n一般若事先不知道所比较的两个处理效果谁好谁坏,分析的目的在于推断两个处理效果有无差别,则选用双侧检验;n 若根据理论知识或实践经验判断甲处理的效果不会比乙处理的效果差(或相反),分析的目的在于推断甲处理是否比乙处理好(或差),则用单侧检验。n 一般情况下,如不作特殊说明均指双侧检验。五、显著
12、性检验的基本步骤(一)首先对试验样本所在的首先对试验样本所在的作假设作假设。零假设零假设(Null hypothesis)H0:0或H0:00.无效假设是假设检验的基础,是将被检验的假设,它有以下三种可能来源:v凭以往经验或某些试验结果来设定0;v根据某种理论计算出0应等于多少;v实际问题要求0等于多少备择假设(备择假设(alternative hypothesisalternative hypothesis):相应于H0:0,则HA有三种:HA:0 HA:0HA:0Notice:在有专业知识可依据的情况下,应优先选用单侧检验,因为单侧检验建立在另一侧实际不可能的基础上,可提高检验精度(二)(
13、二)选择合适的显著水平选择合适的显著水平。根据不同的试验要求选取不同的值,一般常用的为0.05和0.01 计算出的概率大于0.05,称之为“没有显著差异”;计算出的概率小于0.05,称之为“差异显著”;(再作进一步比较)计算出的概率小于0.01,称之为“差异极显著”(三)选择合适的统计量,并研究试验所得统(三)选择合适的统计量,并研究试验所得统计量的抽样分布。计量的抽样分布。根据不同的目的采用不同的检验方法:对平均数做检验,u检验(已知)或t检验(未知),单个样本方差检验用检验,两个样本方差用F检验u,t,,F称为检验统计量2222(四)建立(四)建立H H0 0的拒绝域,查表确定临界值。的拒
14、绝域,查表确定临界值。根据备择假设,建立相应的根据备择假设,建立相应的H H0 0的拒绝域的拒绝域(五)做出推断及生物学解释。(五)做出推断及生物学解释。P0.05不认为是小概率事件,接受H0 P0.01或Pu0.025时拒绝H0n 查正态分布表查正态分布表得,u0.025=1.96。n 5.做出推断及生物学解释:做出推断及生物学解释:n u 0.05,n 接受H0:=0,即可以认为这10只动物抽自总体平均数为10g的总体,本次实验可以利用。010.23 10.01.820.410 xun【例3】已知豌豆籽粒重量服从,在改善栽培条件后,随机抽取9粒,其籽粒平均重量,若标准差仍为3.3,问改善栽
15、培条件是否显著提高豌豆籽粒重量?【解析】已知豌豆籽粒重量服从正态分布,而且标准差已知,可用u检验。1.1.建立假设建立假设 H0:=0,HA:0(进行上侧单尾检验)2 2选择显著水平:选择显著水平:=0.05=0.05)3.3,2.377(2N2.379x3 3计算计算u u值值:4 4 HA:0,当uu0.05时拒绝H0 查正态分布表查正态分布表得,u0.05=1.645。5.5.做出推断及生物学解释:做出推断及生物学解释:uu0.05,P0,即栽培条件的改善显著提高了豌豆籽粒的重量.82.193.32.3772.3790nxu 未知未知 t-testt-testnSxttttttttt(双
16、侧)或2【例4】将例将例1修改:某实验要求实验动物平均体重修改:某实验要求实验动物平均体重=10.00g,现有实验动物现有实验动物10只,平均体重只,平均体重 =10.23g,总体标准差总体标准差未知,可计算得出未知,可计算得出S=0.4g,问这些动物在该实验中能否使用?问这些动物在该实验中能否使用?【解析】n已知动物体重服从正态分布,标准差未知,可用t检验。n设抽取该10只动物的总体体重平均数为,实验要求的实验动物体重平均数为0 xn1.建立假设建立假设 H0:=0,HA:0(双尾检验)n2选择显著水平:选择显著水平:=0.05n3计算计算t值值:n n n4 HA:0,当 t t0.025时拒绝H0n 查查t分布表分布表得,t0.025,(9)=2.262。n5.做出推断及生物学解释:做出推断及生物学解释:n t 0.05,n 接受H0:=0,即可以认为这10只动物抽自总体平均数为10g的总体,本次实验可以利用。010.23 10.01.820.410 xtsn【例5】在鱼塘中10个点取水样,测定水中含氧量,得数据:4.33,4.62,3.89,4.14,4.78,4.64,4.5