《分类资料SPSS.ppt》由会员分享,可在线阅读,更多相关《分类资料SPSS.ppt(27页珍藏版)》请在优知文库上搜索。
1、 2检验检验与分类资料的统计分析与分类资料的统计分析分类计数资料分类计数资料 例例1 某医生用两种疗法治疗前列腺癌,某医生用两种疗法治疗前列腺癌,出院后随访出院后随访3年。甲疗法治疗年。甲疗法治疗86例,乙疗例,乙疗法治疗法治疗95例,结果见表例,结果见表1。问两种疗法治。问两种疗法治疗前列腺癌病人的疗前列腺癌病人的3年生存率是否相同?年生存率是否相同?表表1 甲乙两种疗法治疗前列腺癌的甲乙两种疗法治疗前列腺癌的3年生存率比较年生存率比较处理处理 生存生存 死亡死亡 合计合计 甲疗法甲疗法 乙疗法乙疗法 52 45 34 50 86 95 合计合计 97 84 181 例例2 某研究室用两种不
2、同国产试剂检测某研究室用两种不同国产试剂检测132份份HBsAg阳性血清,结果见表阳性血清,结果见表2。问:。问:两种试剂的检出率有无差别?两种试剂的检出率有无差别?表表2 两种血清学检验结果比较两种血清学检验结果比较 乙乙 法法 甲甲 法法 合计合计 80 10 90 31 11 42 合合 计计 111 21 132 例例3 一批一批108名病人构成的样本中,男性名病人构成的样本中,男性63人,其中高度近视者人,其中高度近视者7人,中度近视者人,中度近视者13人,低度或无近视者人,低度或无近视者43人;女性人;女性45人,人,其中高度近视者其中高度近视者3人,中度近视者人,中度近视者7人,
3、低人,低度或无近视者度或无近视者35人,问男女不同近视程度人,问男女不同近视程度的病人构成有无不同。的病人构成有无不同。性别性别 高度高度 近视近视 中度近中度近视视 低度或低度或无近视无近视 合计合计 男男 女女 7 3 13 7 43 35 63 45 合计合计 10 20 78 108 表表3 男女不同程度近视病人构成比较男女不同程度近视病人构成比较例例4 为研究心肌梗塞与近期使用口服避孕为研究心肌梗塞与近期使用口服避孕药之间的关系药之间的关系,采用成组比较设计的病例对采用成组比较设计的病例对照研究方法照研究方法,调查了调查了234名心肌梗塞病人与名心肌梗塞病人与1742名对照者使用口服
4、避孕药情况。试计名对照者使用口服避孕药情况。试计算优势比的估计值算优势比的估计值。表表4 心肌梗塞与近期使用口服避孕药的关系心肌梗塞与近期使用口服避孕药的关系 近期使用口服避孕药近期使用口服避孕药 组别组别 合计合计 有有 无无 病例组病例组 2929 205205 234234 对照组对照组 135135 16071607 17421742 合计合计 164164 18121812 19761976 表表5 按年龄分层的心肌梗塞与近期使按年龄分层的心肌梗塞与近期使用口服避孕药的资料表用口服避孕药的资料表 年年 龄龄 组组 2529 3034 3539 4044 4549 病病 对对 合合 病
5、病 对对 合合 病病 对对 合合 病病 对对 合合 病病 对对 合合 例例 照照 例例 照照 例例 照照 例例 照照 例例 照照 口口 服服 避避 孕孕 药药 数数 数数 计计 数数 数数 计计 数数 数数 计计 数数 数数 计计 数数 数数 计计 使使 用用 4 62 66 9 33 42 4 26 30 6 9 15 6 5 11 未未使使用用 2 224 226 12 390 402 33 330 363 65 362 427 93 301 394 合合 计计 6 286 292 21 423 444 37 356 393 71 371 442 99 306 405 分类资料的统计分析分
6、类资料的统计分析1.两组或多组率(或构成比)的比较。两组或多组率(或构成比)的比较。2.配对设计分类资料相关性检验与差异的比配对设计分类资料相关性检验与差异的比较。较。3.分层分类资料的比较。分层分类资料的比较。以上情形,用以上情形,用crosstabs过程实现。过程实现。一一.pearson 2检验检验 适用适用于完全随机设计资料于完全随机设计资料(如例如例1)率或率或构成比的比较以及配对设计资料相关性构成比的比较以及配对设计资料相关性的检验(如例的检验(如例10.1)。)。SPSS中用中用crosstabs过程的过程的Chi-Square选项实现。选项实现。检验统计量检验统计量pearso
7、n 2值值,基本公式为:基本公式为:T)TA(22 式中式中A为实际频数为实际频数,即四格表中的数据;即四格表中的数据;T为理论频数为理论频数,是根据零假设推算出来的。是根据零假设推算出来的。2值的大小反映了实际数与理论数的相差值的大小反映了实际数与理论数的相差情况情况.若若H0成立,则理论数和实际数相差成立,则理论数和实际数相差不应该太大不应该太大.若若 2值很大,就有理由推翻值很大,就有理由推翻H0。校正校正 2与确切概率法与确切概率法 对四格表,若有:对四格表,若有:(1)1 T 5,且且n 40时,需计算校正的时,需计算校正的 2值。值。(2)T 1或或n 40时,需用确切概率法。时,
8、需用确切概率法。对对RC表表,若有若有1/5以上的格子中的理论以上的格子中的理论频数小于频数小于5,或者有一个格子的理论频数,或者有一个格子的理论频数小于小于1,需用确切概率法。,需用确切概率法。P229/例例10.1(按定量变量的记录格式)(按定量变量的记录格式)某项课题需要研究教育对提高工作能力某项课题需要研究教育对提高工作能力的作用,为此做实证研究,抽样调查的作用,为此做实证研究,抽样调查636名职工各自的学历和工作业绩情况,名职工各自的学历和工作业绩情况,如表如表10.2所示,问学历与工作业绩的关所示,问学历与工作业绩的关系是否有显著差异?系是否有显著差异?表表10.2 职工各自的学历
9、和工作业绩情况职工各自的学历和工作业绩情况 职工编号职工编号 学历学历 工作业绩工作业绩 1 大学及以上大学及以上 一般一般 2 大学及以上大学及以上 好好 3 大学及以上大学及以上 很好很好 4 中学中学 一般一般 5 中学中学 好好 6 中学中学 很好很好 7 小学及以下小学及以下 一般一般 8 小学及以下小学及以下 好好 9 小学及以下小学及以下 好好 建立数据文件,取名建立数据文件,取名“EG10-1.SAV”EG10-1.SAV”操作步骤:操作步骤:菜单:菜单:Analyze Descriptive statistics Crosstabs把行变量把行变量“文化程度文化程度”选入选入
10、Row(s)框,框,列变量列变量“工作业绩工作业绩”选入选入Column(s)框框点击点击Statistics进入子对话框进入子对话框 Chi-Square Continue返回主对话框,点击返回主对话框,点击 OK。例例10.2(按频数的记录格式)同例(按频数的记录格式)同例10.1,调查,调查记录按表记录按表10.6形式所示。形式所示。表表10.6 分层统计结果(单位:人)分层统计结果(单位:人)工作业绩工作业绩 一般一般 较好较好 很好很好 合计合计 大学及以上大学及以上 43 203 199 445 中学中学 57 68 30 155 文化文化程度程度 小学及以下小学及以下 13 13
11、 10 36 合计合计 113 284 239 636 建立数据文件,取名建立数据文件,取名“EG10-2.SAV”频数表数据:频数表数据:菜单菜单Data weight cases 选择选择weight cases by把变量把变量 Count 选选入入frequency variable框框 OK二二.McNemer 2检验检验 适用适用于配对资料于配对资料(如例如例10.3)率或构成比的率或构成比的比较。比较。SPSS中用中用crosstabs过程过程McNemer选项选项实实现。现。配对设计包括配对设计包括:(1)同一批样品用两种不同的处理方法;同一批样品用两种不同的处理方法;(2)观
12、察对象根据配对条件配成对子,同一观察对象根据配对条件配成对子,同一对子内不同的个体分别接受不同的处理。对子内不同的个体分别接受不同的处理。例例10.3 两位专家对一批大学独立做出了分两位专家对一批大学独立做出了分级判断,如表级判断,如表10.7所示,请问他们的判断所示,请问他们的判断结果是否基本一致,判断水平有无差别?结果是否基本一致,判断水平有无差别?表表10.7 两位专家等级判断(单位:所)两位专家等级判断(单位:所)专家乙判断结果专家乙判断结果 级级 级级 级级 合计合计 32 15 0 47 1 54 12 67 级级 级级 级级 0 7 45 52 专家甲判专家甲判断结果断结果 合计
13、合计 33 76 57 166 建立数据文件,取名建立数据文件,取名“EG10-3.SAV”操作步骤操作步骤 菜单菜单Data weight cases 选择选择weight cases by把变量把变量 Count 选入选入frequency variable框框 OK 菜单菜单Analyze Descriptive statistics Crosstabs把行变量把行变量“专家甲专家甲”选入选入Row(s)框,框,列变量列变量“专家乙专家乙”选入选入Column(s)框。框。点击点击Statistics进入子对话框进入子对话框 Chi-square,Kappa,McNemer Contin
14、ue返回主对话框,点击返回主对话框,点击OK三三.分层分层四格表资料的分析四格表资料的分析例例10.4 某高校计算机课试行多媒体教学某高校计算机课试行多媒体教学A与正与正常上课常上课B的两种授课方法,观察成绩提高效率,的两种授课方法,观察成绩提高效率,考虑到专业是一个可能的混杂因素,将其也纳考虑到专业是一个可能的混杂因素,将其也纳入调查,请分析授课方法与成绩提高效率(减入调查,请分析授课方法与成绩提高效率(减少不合格人数)有无关系。少不合格人数)有无关系。统计数据如表统计数据如表10.11所示。所示。表表10.11 两种授课方式的成绩提高效率比较(单位:人)两种授课方式的成绩提高效率比较(单位
15、:人)理工专业理工专业 文科专业文科专业 方法方法 A 方法方法 B 方法方法 A 方法方法 B 有效有效 21 26 18 88 无效无效 17 59 7 95 合计合计 38 85 25 183 建立数据文件,取名建立数据文件,取名“EG10-4.SAV”crosstabs过程:过程:Risk与与Cochran and Mantel Haenszel Statistics选项选项实现。实现。练练 习习1.某医生用两种疗法治疗前列腺癌,出院某医生用两种疗法治疗前列腺癌,出院后随访后随访3年。甲疗法治疗年。甲疗法治疗86例,乙疗法治例,乙疗法治疗疗95例,结果见表。问两种疗法治疗前例,结果见表
16、。问两种疗法治疗前列腺癌病人的列腺癌病人的3年生存率是否相同?年生存率是否相同?处 理 生存 死亡 合计 生存率(%)甲疗法 52 34 86 60.47 乙疗法 45 50 95 47.37 合计 97 84 181 53.59 2.某次病例对照调查了心肌梗塞与使用口某次病例对照调查了心肌梗塞与使用口服避孕药之间的情况,考虑到年龄是一服避孕药之间的情况,考虑到年龄是一个可能的混杂因素,将其也纳入调查。个可能的混杂因素,将其也纳入调查。资料如下。资料如下。年龄年龄40 口服避孕药口服避孕药 病例病例 对照对照 病例病例 对照对照 使使 用用 21 17 18 7 未使用未使用 26 59 88 95 合合 计计 47 76 106 102