《第七章2检验名师编辑PPT课件.ppt》由会员分享,可在线阅读,更多相关《第七章2检验名师编辑PPT课件.ppt(52页珍藏版)》请在优知文库上搜索。
1、第七章 2检验检验 2检验用途 单个频数分布的拟合优度检验 完全随机设计两组频数分布2检验 多组频数分布的2检验 配对设计下两组频数分布2检验*四格表的确切概率法四格表的确切概率法 2分布和拟合优度检验分布和拟合优度检验 2分布分布 2分布是一种连续型随机变量的概率分分布是一种连续型随机变量的概率分布。如果布。如果Z服从标准正态分布,那么服从标准正态分布,那么Z2服从服从自由度为自由度为1的的 2分布分布,其概率密度在(其概率密度在(0,)区间上表现)区间上表现为为L型型,如图,如图7-1对应于自由对应于自由度度=1的曲线,取较小值的可能性较大,取的曲线,取较小值的可能性较大,取较大值的可能性
2、较小。较大值的可能性较小。v=1v=4v=6v=9 2分布和拟合优度检验分布和拟合优度检验 图图7-1,2分布的形状依赖于自由度分布的形状依赖于自由度的大小,的大小,当自由度当自由度2时,随着时,随着的增加,曲线逐渐的增加,曲线逐渐趋于对称,当自由度趋于对称,当自由度趋于趋于时,时,2分布逼分布逼近正态分布。各种自由度的近正态分布。各种自由度的 2分布右侧尾分布右侧尾部面积为部面积为时的临界值记为时的临界值记为 列于附表列于附表8。2,2分布和拟合优度检验分布和拟合优度检验 拟合优度检验拟合优度检验拟合优度检验是根据样本的频率分布检验其拟合优度检验是根据样本的频率分布检验其总体分布是否等于某给
3、定的理论分布。总体分布是否等于某给定的理论分布。拟合优度检验步骤:拟合优度检验步骤:1建立检验假设建立检验假设H0:总体分布等于给定的理论分布:总体分布等于给定的理论分布H1:总体分布不等于给定的理论分布:总体分布不等于给定的理论分布 2分布和拟合优度检验分布和拟合优度检验2计算检验统计量计算检验统计量 实际观察到的频数用实际观察到的频数用A表示,根据表示,根据H0确定的理论频数用确定的理论频数用T表示,则大样本时统计表示,则大样本时统计量,自由度量,自由度=K-1-(利用的参数个数)(利用的参数个数)kiiiiTTA122)(TTA22)(2分布和拟合优度检验分布和拟合优度检验 以上两个公式
4、以上两个公式 2检验的基本公式,所检验的基本公式,所有其它形式的有其它形式的 2检验公式都来源于此。检验公式都来源于此。2值反映了样本实际频数分布与理论总体分值反映了样本实际频数分布与理论总体分布的符合程度。如果原假设成立,布的符合程度。如果原假设成立,2值不值不会太大;反之,会太大;反之,A若与若与T差距大,差距大,2值也大;值也大;当当 2值超出一定范围时,就有理由认为原值超出一定范围时,就有理由认为原假设不成立。假设不成立。3确定相应的概率确定相应的概率P,作出推断结论,作出推断结论 2分布和拟合优度检验分布和拟合优度检验例例7-1 对表对表7-1所示数据作正态分布拟合优度所示数据作正态
5、分布拟合优度检验。检验。136例体模骨密度测量值的均数例体模骨密度测量值的均数=1.260;标准差标准差=0.010 检验的假设检验的假设:H0:总体分布等于均数为:总体分布等于均数为1.260,标准差为,标准差为0.010的正态分布的正态分布H1:总体分布不等于该正态分布:总体分布不等于该正态分布 表表7-1 136例体模骨密度测量值频数分布表及拟合优度检验统计量的计算例体模骨密度测量值频数分布表及拟合优度检验统计量的计算组段组段(1)1.2281.2341.2401.2461.2521.2581.2641.2701.2761.282合计合计实际频数实际频数A(2)2271725372516
6、41(X1 1)(3)0.000690.004660.022750.080760.211860.420740.655420.841340.945200.98610(X2 2)(4)0.004660.022750.080760.211860.420740.655420.841340.945200.986100.99744P(X)(5)0.003970.018090.058010.131100.208880.234680.185920.103860.040900.01135T=nP(X)(6)0.5405 2.4601 7.888917.829428.408331.916725.285514.12
7、44 5.5618 1.5434(AT)2/T(7)3.941430.086050.100160.038590.408920.809610.003220.249060.438580.191306.26692 2分布和拟合优度检验分布和拟合优度检验 表表7-1 中第中第3列、第列、第4列正态分布函数列正态分布函数值可通过对作标准正态变换后查正态分值可通过对作标准正态变换后查正态分布表或利用相应的布表或利用相应的SAS程序得到,第程序得到,第5列为第列为第4列与第列与第3列的差值,第列的差值,第6列理论列理论频数频数T等于总例数等于总例数136与各组段概率的乘与各组段概率的乘积,第列各数之和即检验
8、统计量积,第列各数之和即检验统计量 2值。值。2分布和拟合优度检验分布和拟合优度检验 计算统计量计算统计量:推断结论推断结论:自由度自由度=10-1-2=7,查附表查附表8,得到得到P0.50,可以认为该样本服从正态分布。可以认为该样本服从正态分布。35.627,50.022()6.27A TT计算T I 时的参数有2个(均数和标准差)完全随机设计两组频数分布完全随机设计两组频数分布 2检验检验 二分类情形二分类情形22列联表表 例例7-2 某医师研究用兰芩口服液与银黄口服某医师研究用兰芩口服液与银黄口服液治疗慢性咽炎疗效有无差别,将病情相液治疗慢性咽炎疗效有无差别,将病情相似的似的80名患者
9、随机分成两组,分别用两种名患者随机分成两组,分别用两种药物治疗,结果见表药物治疗,结果见表7-2。表7-2慢性咽炎两种药物疗效资料药物药物兰芩口服液兰芩口服液银黄口服液银黄口服液合计合计 疗效疗效有效有效41(36.56)24(28.44)65无效无效 4(8.44)11(6.56)15合计合计45(固定值)(固定值)35(固定值)(固定值)80完全随机设计两组频数分布完全随机设计两组频数分布 2检验检验 问题:这两个频数分布的总体分布是否相问题:这两个频数分布的总体分布是否相等?或者这两份样本是否来自同一个总体。等?或者这两份样本是否来自同一个总体。因为这里是二分类变量,问两个总体分布因为这
10、里是二分类变量,问两个总体分布是否相等就相当于问两个有效概率是否相是否相等就相当于问两个有效概率是否相等。等。完全随机设计两组频数分布完全随机设计两组频数分布 2检验检验(1)建立检验假设)建立检验假设H0:1=2 两药的有效概率相同两药的有效概率相同H1:12 两药有效概率不同两药有效概率不同 检验水准检验水准=0.05(2)计算检验统计量)计算检验统计量TTA22)(完全随机设计两组频数分布完全随机设计两组频数分布 2检验检验自由度自由度=(2-1)(2-1)=1(3)确定)确定p值值查附表查附表8,=1对应的临界值对应的临界值,P0.025。(4)结论)结论:拒绝拒绝H0,两样本频率的差
11、别具有统计学,两样本频率的差别具有统计学意义。可以认为,兰芩口服液和银黄口服液的总意义。可以认为,兰芩口服液和银黄口服液的总体有效概率不同,前者(体有效概率不同,前者(91.1%)高于后者)高于后者(68.6%)。)。565.656.6)56.611(44.28)44.2824(44.8)44.84(56.36)56.3641(2222完全随机设计两组频数分布完全随机设计两组频数分布 2检验检验对于四格表资料,四格表专用公式对于四格表资料,四格表专用公式)()()()(22dbcadcbanbcad22(41 11 24 4)806.56545 35 65 15 完全随机设计两组频数分布完全随
12、机设计两组频数分布 2检验检验 当当n40时,如果有某个格子出现时,如果有某个格子出现1T0.1,高于检验水准,高于检验水准,不能拒,不能拒绝绝H0,差别无统计学意义,尚不能认为两,差别无统计学意义,尚不能认为两种治疗方案的总体缓解概率不同。种治疗方案的总体缓解概率不同。624.28.16)5.0|8.1614(|2.11)5.0|2.1114(|2.7)5.0|2.710(|8.4)5.0|8.42(|22222完全随机设计两组频数分布完全随机设计两组频数分布 2检验检验 特别注意特别注意:当四格表出现当四格表出现T1或或n40时,校正时,校正 2值也值也不恰当,这时必须用四格表的确切概率计
13、不恰当,这时必须用四格表的确切概率计算法(见本章第算法(见本章第6节)。节)。完全随机设计两组频数分布2检验 多分类的情形多分类的情形2C列联表列联表 定性变量具有多分类时定性变量具有多分类时,两个频数分布两个频数分布的数据可表示为一个的数据可表示为一个2C列联表。列联表。例例7-4 北京市北京市1986年城市和农村年城市和农村20至至40岁已婚妇女避孕方法情况如表岁已婚妇女避孕方法情况如表7-5所示(据所示(据王绍贤等调查资料),试分析北京城市和王绍贤等调查资料),试分析北京城市和农村采用不同避孕方法的总体分布是否有农村采用不同避孕方法的总体分布是否有差别。差别。表7-5 北京城市和农村已婚
14、妇女避孕方法情况 地区地区城市城市农村农村合计合计避孕方法避孕方法节育器节育器153320473服避孕药服避孕药3375108避孕套避孕套16543208节育器节育器153320473其他其他401858合计合计431518949完全随机设计两组频数分布完全随机设计两组频数分布 2检验检验(1)建立检验假设)建立检验假设H0:北京城市和农村已婚妇女避孕方法的总:北京城市和农村已婚妇女避孕方法的总体概率分布相同体概率分布相同H1:北京城市和农村已婚妇女避孕方法的总:北京城市和农村已婚妇女避孕方法的总体概率分布不同体概率分布不同检验水准检验水准 =0.05。完全随机设计两组频数分布完全随机设计两组
15、频数分布 2检验检验(2)计算检验统计量)计算检验统计量H0成立时,两组概率分布相同,均近似地等成立时,两组概率分布相同,均近似地等于合并计算的频率分布。于合并计算的频率分布。)1(21122iCjjiijmnAn完全随机设计两组频数分布完全随机设计两组频数分布 2检验检验=(2-1)(4-1)=3,查附表查附表8P0.001,按,按=0.05水准拒绝水准拒绝H0。可以认为。可以认为,北京北京城市和农村已婚妇女避孕方法的总体概率分布不城市和农村已婚妇女避孕方法的总体概率分布不同。据调查数据,城市使用男用避孕套的频率高同。据调查数据,城市使用男用避孕套的频率高于农村;宫内节育器是城市和农村的主要
16、避孕方于农村;宫内节育器是城市和农村的主要避孕方式,但农村使用宫内节育器的频率比城市高。式,但农村使用宫内节育器的频率比城市高。22221533318847(.1)151.099431 473391 108456 58 完全随机设计多组频数分布完全随机设计多组频数分布 2检验检验 设有一个定性变量,具有设有一个定性变量,具有个可能的个可能的“取取值值”;现有;现有R组独立样本的频数分布,其数组独立样本的频数分布,其数据以表据以表7-7的形式表示。这样的数据形式称的形式表示。这样的数据形式称为为RC列联表。列联表。)1(1122RiCjjiijmnAn完全随机设计多组频数分布完全随机设计多组频数分布 2检验检验 例例7-5 为研究某镇痛药的不同剂量镇为研究某镇痛药的不同剂量镇痛效果是否有差别,研究人员在自愿的痛效果是否有差别,研究人员在自愿的原则下,将条件相似的原则下,将条件相似的53名产妇随机分名产妇随机分成三组成三组,分别按三种不同剂量服用该药,分别按三种不同剂量服用该药,镇痛效果如表镇痛效果如表7-8。表7-8某药不同剂量的镇痛效果剂量剂量1.0mg2.5mg5.0mg合计合计镇痛