卫生统计学资料(精心整理).docx

上传人:王** 文档编号:934749 上传时间:2024-03-01 格式:DOCX 页数:65 大小:168.82KB
下载 相关 举报
卫生统计学资料(精心整理).docx_第1页
第1页 / 共65页
卫生统计学资料(精心整理).docx_第2页
第2页 / 共65页
卫生统计学资料(精心整理).docx_第3页
第3页 / 共65页
卫生统计学资料(精心整理).docx_第4页
第4页 / 共65页
卫生统计学资料(精心整理).docx_第5页
第5页 / 共65页
卫生统计学资料(精心整理).docx_第6页
第6页 / 共65页
卫生统计学资料(精心整理).docx_第7页
第7页 / 共65页
卫生统计学资料(精心整理).docx_第8页
第8页 / 共65页
卫生统计学资料(精心整理).docx_第9页
第9页 / 共65页
卫生统计学资料(精心整理).docx_第10页
第10页 / 共65页
亲,该文档总共65页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《卫生统计学资料(精心整理).docx》由会员分享,可在线阅读,更多相关《卫生统计学资料(精心整理).docx(65页珍藏版)》请在优知文库上搜索。

1、卫生统计学资料(精心整理)统计工作基本步骤:统计设计(调查设计和实验设计)、资料分析收集资料、整理资料、分析资料【统计描述和统计推断(参数估计和假设检验)】。统计推断:是利用样本所提供的信息来推断总体特征,包括:参数估计和假设检验。a参数估计是指利用样本信息来估计总体参数,主要有点估计(把样本统计量直接作为总体参数估计值)和区间估计【按预先设定的可信度(l-),来确定总体均数的所在范围】。b假设检验:是以小概率反证法的逻辑推理来判断总体参数间是否有质的区别。变量资料可分为定性变量、定量变量。不同类型的变量可以进行转化,通常是由高级向低级转化。资料按性质可分为计量资料、计数资料和等级资料。定量资

2、料的统计描述1频率分布表和频率分布图是描述计量资料分布类型及分布特征的方法。离散型定量变量的频率分布图可用直条图表达。2频率分布表(图)的用途:描述资料的分布类型;描述分布的集中趋势和离散趋势;便于发现一些特大和特小的可疑值;便于进一步的统计分析和处理;当样本含量足够大时,以频率作为概率的估计值。3集中趋势和离散趋势是定量资料中总体分布的两个重要指标。(1)描述集中趋势的统计指标:平均数(算术均数、几何均数和中位数)、百分位数(是一种位置参数,用于确定医学参考值范围,P50就是中位数)、众数。算术均数:适用于对称分布资料,特别是正态分布资料或近似正态分布资料;几何均数:对数正态分布资料(频率图

3、一般呈正偏峰分布)、等比数列;中位数:适用于各种分布的资料,特别是偏峰分布资料,也可用于分布末端无确定值得资料。(2)描述离散趋势的指标:极差、四分位数间距、方差、标准差和变异系数。四分位数间距:适用于各种分布的资料,特别是偏峰分布资料,常把中位数和四分位数间距结合起来描述资料的集中趋势和离散趋势。方差和标准差:都适用于对称分布资料,特别对正态分布资料或近似正态分布资料,常把均数和标准差结合起来描述资料的集中趋势和离散趋势;变异系数:主要用于量纲不同时,或均数相差较大时变量间变异程度的比较。标准差的应用:表示变量分布的离散程度;结合均数计算变异系数、描述对称分布资料;结合样本含量计算标准误。定

4、性资料的统计描述1定性资料的基础数据是绝对数。描述一组定性资料的数据特征,通常需要计算相对数。定性变量可以通过频率分布表描述其分布特征。2常用相对数类型:频率型、强度型和相对比型指标。指标频率型指标强度型指标相对比型指标概念近似反映某一时间出现概率单位时间内某现象的发生频率两个有关联的指标A和B之比计算公式一壁型生题空LXk可能发生某事件的个体数某事件叁生电挣整Xk观察人日数总计A/B有无量纲无有可有、可无取值范围0zlJ可大于1无限制本质大样本时作为概率近似值分子式分母的一部分频率强度,即概率强度的近似值表示相对于B的一个单位,A有多少个单位A和B可以是绝对数、相对数和平均数A和B的量纲可相

5、同也可不同A和B互不包含相对比:A、B两指标可以是绝对数、相对数或平均数。最常见的相对比是人口学中的男女性别比,流行病学中的相对危险度RR=P1PO也是相对比指标。3应用相对数应该注意:防止概念混淆,避免以比代率的错误现象;(2)计算相对数时分母应有足够数量,如果例数较少会使相对数波动较大,应该使用绝对数;正确的计算频率(或强度)指标的合计值。当分组的资料需要合并起来估计频率(或强度)时,应将各组频率的分子相加作为合并估计的分子,各组的分母相加作为合并估计的分母;频率型指标的解释要紧扣总体和属性;相对数间比较要具备可比性:要注意观察对象是否同质、研究方法是否相同、观察时间是否一致、观察对象内部

6、结构是否一致、对比不同时期资料应注意客观条件是否相同;正确进行相对数的统计推断:在随机抽样的情况下,从样本估计值推断总体相对数应该考虑抽样误差,因此要进行参数估计和假设检验。4医学人口统计资料主要来源为日常工作记录(报告单、卡、册)、统计报表、人口调查(普查和抽样调查)。5描述人口学特征的常用指标一般有人口总数和反映人口学基本特征的某些指标。人口学的基本特征包括性别、年龄、文化、职业等,最常用来描述人口结构的是性别和年龄。人口学特征指标:老年人口系数、少儿人口系数、负担系数、老少比、性别比。6有关生育的常用指标有出生率、生育率和人口再生产指标。测量生育水平的统计指标:粗出生率、总生育率、年龄别

7、生育率、总和生育率。测量人口再生育的统计指标:自然增长率、粗再生率和净再生率。7常用的死亡统计指标有:粗死亡率、年龄别死亡率、婴儿死亡率、新生儿死亡率、围生儿死亡率、死因别死亡率、某病病死率和死因构成等。8疾病统计资料主要来源于:疾病报告和报表材料、医疗卫生工作记录、疾病专题调查资料。9标准化:两个率或多个率之间进行比较时,为消除内部构成不同的影响,采用统一的标准,对两组或多组资料进行校正(调整),计算得到标准化率后再做比较的方法,称为。其目的是统一内部构成,消除混杂因素,是资料具有可比性。应用标准化法的注意事项:1标准化法的应用范围很广。当某个分类变量在两组中分布不同时,这两个分类变量就成为

8、两组频率比较的混杂因素,标准化的目的是消除混杂因素。2标准化后的标准化率,已经不再反映当时当地的实际水平,只表示相互比较的资料间的相对水平。3标准化法实质是找一个标准,使两组得意在一个共同的平台上进行比较。选择不同的标准,算出的标准化率也会不同,比较的结果也未必相同,因此报告比较结果时必须说明所选用的标准和理由两样本标准化率是样本值,存在抽样误差。比较两样本标准化率,当样本含量较小时,还应作假设检验。10常用的动态数列分析指标有:绝对增长量、发展速度与增长速度、平均发展速度与平均增长速度。(I)绝对增长量:是说明事物在一定时期增长的绝对值,可分为:累计增长量(报告期指标与基线期指标之差)和逐年

9、增长量(报告期指标与前一期指标之差)O(2)发展速度与增长速度:均为相对比,说明事物在一定时期的变化,可计算定基比(即报告期指标与基线期指标的比:ana)和环比(报告期指标与其前一期指标之比:an/an-1)o增长速度表示的是净增长速度,增长速度=发展速度(3)平均发展速度与平均增长速度:用于概括某现象在一段时期中的平均后变化。平均发展速度是发展速度的几何平均数,平均发展速度,平均增长速度=平均发展速度-IO0%。11统计表和统计图是描述资料特征、呈现统计分析结果的重要工具。统计表结构标题、标目、线条、数字和备注。12常用统计图用途:条图:适用于相互独立的资料(资料有明确分组、不连续);百分条

10、图、圆图适用于构成比资料;线图适用于连续性资料,表达事物的动态变化(绝对差值);半对数线图适用于连续性资料,表达事物的发展速度(相对比);直方图用于描述连续变量的频数分布;散点图适用于双变量资料,用点的排列趋势和密集度表示两变量的相关关系。常用概率分布1正态分布(连续型随机变量的概率分布)(1)正态概率密度曲线特点:关于x=对称;在x=处取得该概率密度函数的最大值,在x=u。处有拐点;曲线下面积为1;正态分布有两个参数:位置参数(决定曲线在横轴上的位置)和变异参数。(决定曲线的形状);1.64o面积为90%,L96面积为95%,2.58o面积为99%。(2)Z变换与标准正态分布:对于任意一个服

11、从正态分布N(,2)的随机变量,可作Z变:Z=O,变换后的Z值仍然服从正态分布,且其总体均数为0、总体标准差为1,称此为标准正态分布,用N(0,1)表示。(Z)为标准正态分布Z变量的累积面积,-8玲Z的面积,即下侧累计面积。(3)正态分布的应用:确定医学参考值范围:是指特定的“正常人群(排除了对所研究的指标有影响的的疾病和有关因素的特定人群)的解剖、生理、生化指标及组织代谢产物含量等数据中大多数个体的取值所在范围,习惯用该人群的95%的个体某项医学指标的取值范围作为该指标的医学参考值范围。方法:a百分位数法:适用于任何分布类型的资料;b正态分布法。质量控制图:如果某一波动仅仅由个体差异或随机测

12、量误差所致,那么观察结果服从正态分布。控制图共有7条水平线,中心线位于总体均数四处,警戒限位于吐2。处,控制限位于3处,此外还有两条位于处。(4)确定医学参考值的步骤:从正常人总体中抽样,明确研究总体;用统一和准确的方法测定相应的指标;根据不同的用途选定适当的百分界限,常用95%;根据此指标的实际意义,决定单侧范围还是双侧范围;根据此指标的分布决定计算方法,常用的计算方法:正态分布法、百分位数法。2二项分布:(1)是一种离散型随机变量的分布类型。如果每个观察对象阳性结果的发生概率为71,阴性结果的发生概率为(l-n);而且每个观察对象的结果是相互对立的,那么,重复观察n个人,发生阳性结果的人数

13、X的概率分布为而二项分布,n!f*xCx记作B(n,)O二项分布的概率函数P(X)=nn-X,(l-)n-x,=X!(一X)!适用条件:每次实验只有两种互斥的结果;各次实验互相独立;发生成功事件的概率恒定。分布特征:二项分布的特征由二项分布的参数11以及观察的次数n决定。图形分布特征:二项分布图的高峰在=rm处或附近;=0.5时,图形对称;TlWO.5时,分布不对称,且对同一n,n离0.5愈远,对称性愈差。对于同一n,随着n的增大,分布趋于对称。当n玲8时,只要n不太靠近0或1(特别是当rm和n(l-n)均大于5时),二项分布趋于对称。二项分布的均数和标准差:若X服从二项分布B(n,冗),则X

14、的总体均数为=nn,总体方差为2=nnX(l-n),总体标准差为。(1力);若将出现阳性结果的频率记为:P=E7(17)则样本率P的总体均数为HP=TI,总体方差为。口=,总体标准差为OPn,OP是频率P的标准差,又称频率的标准误,反映阳性频率的抽样误差大小。累积概率计算:二项分布出现阳性的次数至多为k次的概率为:P(Xk)2X!(X)!叱(1一“)1=X=O出现阳性的次数至少为k次的概率为:Px(n-X)!zr1,rjnx(Xk)=x=*o3Poisson分布:是一种离散型随机变量的分布类型,是二项分布的特例,用以描述单位时间、空间、面积等的罕见事件发生次数的概率分布。一般记作PS),人是P

15、oiSSOn分布的唯一参数。总体均数为入=rm。前提条件:互斥、独立、恒定。x概率函数为:P(X)=e-X!,X为观察单位内稀有事件的发生次数,e=2.71828,(3)分布特性:PoiSSc)n分布是非对称的,总体参数人值越小,分布越偏;随着人8,分布趋于对称,当20时,Poisson分布资料可按正态分布处理。PoiSSOn分布总体均数与总体方差相等,均为入;PoiSSOn分布的观察结果可加性,即对于服从PoiSSOn分布的m歌互相独立的随机变量XI、X2.Xm,它们的和也服从Poisson分布,其均数为这个m随机变量的均数之和。4概率计算:如果稀有事件发生次数的总体均数为入,有事件发生次数至多e为k次的概率为:P(Xk)=X=O;生次数至少为k次的概率:P(Xk)=I-P(Xk-1) 4三种常用分布之间的关系:二项分布与Poisson分布的关系:当n很大,发生概率(或1-11)很小,二项分布B(n,)近似于PoiSSOn分布P(rm);二项分布与正态分布的关系:当n较大

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 研究生考试 > 专业课

copyright@ 2008-2023 yzwku网站版权所有

经营许可证编号:宁ICP备2022001189号-2

本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!