计数资料的统计推断.ppt

上传人:王** 文档编号:479970 上传时间:2023-09-14 格式:PPT 页数:38 大小:543.50KB
下载 相关 举报
计数资料的统计推断.ppt_第1页
第1页 / 共38页
计数资料的统计推断.ppt_第2页
第2页 / 共38页
计数资料的统计推断.ppt_第3页
第3页 / 共38页
计数资料的统计推断.ppt_第4页
第4页 / 共38页
计数资料的统计推断.ppt_第5页
第5页 / 共38页
计数资料的统计推断.ppt_第6页
第6页 / 共38页
计数资料的统计推断.ppt_第7页
第7页 / 共38页
计数资料的统计推断.ppt_第8页
第8页 / 共38页
计数资料的统计推断.ppt_第9页
第9页 / 共38页
计数资料的统计推断.ppt_第10页
第10页 / 共38页
亲,该文档总共38页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《计数资料的统计推断.ppt》由会员分享,可在线阅读,更多相关《计数资料的统计推断.ppt(38页珍藏版)》请在优知文库上搜索。

1、分类变量资料的统计推断分类变量资料的统计推断第二节第二节 分类变量资料的统计推断分类变量资料的统计推断一一.率的抽样误差和标准误率的抽样误差和标准误l率的抽样误差:由于随机抽样造成的样本率和总体率之间以及各样本率之间存在的差异。l率的抽样误差用率的标准误来表示:nppsnpp)()(11二二.总体率的估计:总体率的估计:一、点值估计:一、点值估计:p二、区间估计:二、区间估计:按照一定的概率(可信度)估计总体率()所在的范围(区间)。1、近似正态分布法:、近似正态分布法:条件:np且n(1p)均大于5,此时样本率p近似正态分布,可用正态分布曲线下的区间面积规律来估计。公式:(,)pppu sp

2、u s例例1:某医院用复方当归注射液静脉滴注治疗脑动脉硬化症188例,其中显效83例,试估计复方当归注射液显效率的95%和99的可信区间。n=188,p=83/188=0.4415 95CI为:99CI为:(1)0.4415(1 0.4415)0.036188pppsn(0.4415 1.96 0.036)(37.09%,51.21%)(0.4415 2.58 0.036)(34.86%,53.44%)2、查表法:、查表法:n50,p或1-p接近于0或1,np或n(1-p)5时,可用查表法。例:例:从某校随机抽取26名学生,发现有4名感染沙眼,试 求该校沙眼感染率的95可信区间。本例n26 x

3、4,查附表得其95CI为(0.04,0.35)。三三.样本率与总体率比较的样本率与总体率比较的u检验:检验:应用条件:样本含量足够大;样本率p或者1-p均不太小时,此时样本率的分布近似正态分布 样本率与总体率的比较 两样本率的比较:nppup)1(nnXXpnnppppuccc1212121)11)(1((一)样本率和总体率的比较(一)样本率和总体率的比较nppup)1(例例2:根据以往经验,一般胃溃疡患:根据以往经验,一般胃溃疡患者有者有20%发生胃出血症状。现某医院观发生胃出血症状。现某医院观察察65岁以上溃疡病人岁以上溃疡病人304例,有例,有31.6%发发生胃出血症状,问老年胃溃疡患者

4、是否生胃出血症状,问老年胃溃疡患者是否较容易胃出血?较容易胃出血?:=0.2 :0.2 单侧 ,拒绝 ,接受 ,差别有统计学意义。可认为老年人胃溃疡出血率较一般胃溃疡患者更易出血。0H0H1H05.006.5304)2.01(2.02.0316.0u0005.0P1H(二)两个率的比较的(二)两个率的比较的u检验检验nnXXpnnppppuccc1212121)11)(1(例例3:某医院观察:某医院观察65岁以上溃疡病人岁以上溃疡病人100例,有例,有20例发生胃出血症状,观察例发生胃出血症状,观察20-65岁的胃溃疡患者岁的胃溃疡患者100例有例有12例发生胃出血症状。问老胃溃疡患者是例发生

5、胃出血症状。问老胃溃疡患者是否较中年患者容易胃出血?否较中年患者容易胃出血?H0:12H1:12 单单=0.0554.1)10011001(84.016.012.02.0)11)(1(2121nnppppucc16.01001002012cp本例:n1=100,x1=12,p1=0.12;n2=100,x2=20,p2=0.2合并率 查u界值表,得P0.05,按双侧=0.05水平不拒绝H0,差别无统计学意义,尚不能认为老年患者和中年患者的胃溃疡出血率有差别。第三节 卡方检验 2检验检验(Chi-square test),英国人,英国人K.Pearson(1857-1936)是现代统计学的创始人

6、之一,于)是现代统计学的创始人之一,于1900年年提出的一种具有广泛用途的统计方法,可用于提出的一种具有广泛用途的统计方法,可用于两个或多个率间的比较两个或多个率间的比较构成比的比较构成比的比较计数资料的关联度分析计数资料的关联度分析拟合优度检验等等。拟合优度检验等等。本章仅限于介绍本章仅限于介绍两个和多个率或构成比两个和多个率或构成比比较的比较的2检验。检验。一、卡方检验的基本思想(1)疗法疗法死亡死亡生存生存 合计合计病死率病死率(%)盐酸苯乙双胍盐酸苯乙双胍26(a)178(b)204(a+b)12.75(p1)安慰剂安慰剂 2(c)62(d)64(c+d)3.13(p2)合合 计计 2

7、8(a+c.)240(b+d.)268(a+b+c+d=n)10.45(pc)例例1 1 两种疗法的心血管病病死率的比较两种疗法的心血管病病死率的比较2 22 2表或四格表表或四格表(fourfold table)(fourfold table)(a+b)pc=(a+b)(a+c.)/n=nRnC/n=21.3(a+b)(1-pc)=(a+b)(b+d.)/n=nRnC/n=182.7(c+d)pc=(c+d)(a+c)/n=nRnC/n=6.7(c+d)(1-pc)=(c+d)(b+d.)/n=nRnC/n=57.3nnnnnnrowcolumnTCRRC合计行总例数合计列)()(疗法疗法死

8、亡死亡生存生存合计合计盐酸苯乙双胍盐酸苯乙双胍26(21.3)178(182.7)204安慰剂安慰剂2(6.7)62(57.3)64合合 计计28 240268四格表资料的卡方检验的自由度为四格表资料的卡方检验的自由度为1卡方检验的自由度的计算公式:卡方检验的自由度的计算公式:)1)(1(CR一、卡方检验的基本思想(2)各种情形下,理论与实际偏离的总和即为卡方值(chi-square value),它服从自由度为的卡方分布。卡方检验的基本思想:卡方检验的基本思想:检验检验A与与T之间的差异,如果之间的差异,如果A与与T之间之间差异越大,则计算出来的差异越大,则计算出来的2值就越大,查值就越大,

9、查2界值表得出的界值表得出的P值就越小值就越小,如果小于了,如果小于了0.05,则拒绝,则拒绝H0假设。假设。)1)(1(,1)()(222CRTTATTA1)12)(12(82.4)3.5717.617.18213.211(7.423.57)3.5762(27.6)7.62(27.182)7.182178(23.21)3.2126(22v2/)12/(2222)2/(21)(ef3.847.8112.59P P0.050.05的临界值的临界值2分布(chi-square distribution)2检验的基本公式)1)(1(1)()(222CRTTATTA 上述上述基本公式基本公式由由Pea

10、rson提出,因此软件上常称这种检验为Peareson卡方检验,下面将要介绍的其他卡方检验公式都是在此基础上发展起来的。它不仅适用于四格表资料,也适用于其它的“行列表”。二、四格表专用公式(1)为了不计算理论频数为了不计算理论频数T,可由可由基本公式基本公式推导出,推导出,直接由直接由各格子的实际频数(各格子的实际频数(a、b、c、d)计算卡方值)计算卡方值的公式:的公式:(四格表专用公式)基本公式:;1)()()()()()()()()()()(222222dbcadcbanbcaddcbadbdcdcbadbdcddcbadbbadcbadbbabdcbacabadcbacabaaTTA二

11、、四格表专用公式(2)021,05.0221021,05.0221,05.0205.0;84.3,05.0;84.305.0;84.31,82.46424028204268)21786226(22HPHPP,即不拒绝则如果即拒绝如果下结论:2(1)u2 2.194924.82(n40,所有T5时)疗法疗法死亡死亡生存生存 合计合计病死率病死率(%)盐酸苯乙双胍盐酸苯乙双胍26(a)178(b)204(a+b)12.75(p1)安慰剂安慰剂 2(c)62(d)64(c+d)3.13(p2)合合 计计 28(a+c.)240(b+d.)268(a+b+c+d=n)10.45(pc)三、连续性校正公

12、式(1)2分布是一连续型分布,而行分布是一连续型分布,而行列表资料属离散型分布列表资料属离散型分布,对其进行校正称为连续性校正,对其进行校正称为连续性校正(correction for(correction for continuity),continuity),又称又称YatesYates校正(校正(Yates correctionYates correction)。)。当当n40,而,而1T5时,用时,用连续性校正连续性校正公式公式当当n40或或T1时,用时,用Fisher精确精确检验检验(Fisher exact test)校正公式校正公式:列表资料),(也适合其它行TTAc22)5.0

13、()()()()2/(22dbcadcbannbcadc三、连续性校正公式(2)例 2 两零售点猪肉表层沙门氏菌带菌情况检查结果 沙门氏菌 零售点 阳性 阴性 合计 带菌率(%)甲 2(4.17)26(23.33)28 7.14 乙 5(2.33)9(11.67)14 35.71 合计 7 35 42 16.67 1,62.3357142842)24262592(22c1,49.5357142842)26592(22因为因为1 1T T5 5,且,且n n4040时,所以应用连续性校正时,所以应用连续性校正2检验检验四、配对四格表资料的2检验例5.某研究室用甲、乙两种血清学方法检查410例确诊

14、的鼻咽癌患者,得结果如下表,问两种方法的检出率有无差别?两种血清学检验结果 乙法 合 计 甲法 261(a)110(b)371 8(c)31(d)39 合计 269 141 410配对四格表资料的2检验也称McNemar检验(McNemars test)1,)1(2402cbcbcb时,需作连续性校正,1,)(2240ccbcbb时,当05.0;84.321,05.02PH0:两种方法的总体检查率相同:两种方法的总体检查率相同,即即BCH1:两种方法的总体检查率不同:两种方法的总体检查率不同,即即BC=0.05 1,17.888110)8110(22,401188110不需要连续性校正本例cb

15、配对四格表资料的2检验公式推导b 和 c 两个格子中的理论频数均为 2cb 一、40 cb时 2)2(2)2()(2222cbcbccbcbbTTA cbcb2)(二、40cb时 cbcbTTA222)1|(|)5.0|(|五、行五、行列(列(R RC C)表资料的)表资料的2 2检验检验 前述四格表,即前述四格表,即22表,是最简单的一表,是最简单的一种种RC表形式。因为其基本数据有表形式。因为其基本数据有R行行C列,列,故通称行故通称行列表或列表或RC列联表列联表(contingency table),简称),简称RC表。表。R RC C表的计算举例表的计算举例例3.将133名尿路感染患者

16、随机分为3组,分别接受甲乙丙三种疗法,一个疗程后观察其疗效,结果如下,问3种疗法的尿培养阴转率有无差别。疗法 阴转人数 阳性人数 合计 阴转率()甲 30 14 44 68.2乙 9 36 45 20.0丙 32 12 44 72.7合计 71 62 133 53.4 基本公式 通用公式R RC C表的表的2 2检验通用公式检验通用公式nnnTCR总例数列合计行合计理论频数)1()(2222CRnnAnTTA代入基本公式可推导出:自由度=(行数1)(列数1)R RC C表的计算举例表的计算举例例3.将133名尿路感染患者随机分为3组,分别接受甲乙丙三种疗法,一个疗程后观察其疗效,结果如下,问3种疗法的尿培养阴转率有无差别。疗法 阴转人数 阳性人数 合计 阴转率()甲 30 14 44 68.2乙 9 36 45 20.0丙 32 12 44 72.7合计 71 62 133 53.41、建立假设,确定检验水准、建立假设,确定检验水准H0:3种疗法的阴转率相同,即种疗法的阴转率相同,即123H1:3种疗法的阴转率不全相同,即种疗法的阴转率不全相同,即1,2,3不同或不全相同不同或不全相同

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 高等教育 > 大学课件

copyright@ 2008-2023 yzwku网站版权所有

经营许可证编号:宁ICP备2022001189号-2

本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!