《华北理工卫生统计学教案02定量资料的统计描述.docx》由会员分享,可在线阅读,更多相关《华北理工卫生统计学教案02定量资料的统计描述.docx(8页珍藏版)》请在优知文库上搜索。
1、课程名称:卫生统计学A第_L周,第2讲次摘要授课题目(章、节)第二章定量资料的统计描述第一节频数与频数分布第二节定量变量的特征数【目的要求】掌握描述集中趋势、离散趋势的常用指标及其意义、适用范围。熟悉集中趋势、计算,频数分布表的编制及用途,频数分布的类型。【重点】描述集中趋势、离散趋势的常用指标及其意义、适用范围【难点】各类指标的应用。内容【本讲课程的引入】统计描述是统计分析的内容之一,也是对科研实际工作中收集的资料进行分析的常用方法,通过统计描述可以了解资料的数量特征及其分布规律。但是统计描述的指标和方法却因资料类型而异,这一章主要介绍的是定量资料的统计描述。【本讲课程的内容】笫一节频数与频
2、数分布频数:对一个随机变量做重复观察,其中某变量值出现的次数。频率(frequency):各组频数除以总例数n所得的比值。频数分布表(frequencydistributiontable):将各变量值及其相应的频数列成表格的形式。一、离散型定量变量的频数分布:例2-1,表2T12JijtJit好#121998年-96名一女户前检9次改分才曼率f,)KiftUiHlf()0)O44.244.2I77.31111.52Il!LS222193B11535MS42627.1615SBMOM87.51212S_96JOO.0合计%100举例内容二、连续型定量变量的频数分布例2-2:120名健康成年男子血
3、清铁含量资料讲授、举例1、频数表的编制(1)求全距(极差)R=29.64-7.42=22.22(2)定组段数与组距:815个组段,组距i:全距/组段数(3)划组段:以一个稍小于或等于最小值的整数作为第一个组段的起点数据。下限:每个组段的起点(最小值)。上限:每个组段的终点(近似最大值)。最后一个组段应同时写出上限和下限。(4)归组划记:得出频数并可计算频率、累积频数、累积频率。表2-2120名正常成年男子血清铁含量(molL)软数表组段(1)算致(2)频率(3)(4)累计频率(5)610.8310.838-32.5043.3310-5.00108.33126.671815.0014-10.00
4、3025.0016.675041.6722.507764.172015.009579.1722*10.0010789.1724_6.67IlS95.83263.3311999.!728-3010.831201.合计120l陈述资料。揭示资料的分布类型:对称分布和偏态分布对称分布型:指集中位置在正中,左右两侧频数分布大体对称。偏态分布型;指集中位置偏向一侧,频数分布不对称。偏态分布型:正偏态分布-集中位置偏向数值小的一侧。负偏态分布:集中位置偏向数值大的一侧。302520领率由度68 IO 12 14 16 18 20 22 24 26 28(moLL)S2-2 120例健康成年男子血清铁含jt
5、(molL) 分布(频率密度=濒率/组距)%热图发汞蛆中值(moIAg)某地居民238人发汞含(molkG分布(3)揭示资料的分布特征:集中趋势(Centraltendency)、离散趋势(dispersion)集中趋势:血清铁含量向中央部分集中,即中等含量者居多,集中在18这个组段,这种现象为集中趋势。离散趋势:从中央部分到两侧的频数分布逐渐减少,而且血清铁含量的值参差不齐,最低的接近6,最高的接近30,这种现象称为离散趋势。便于进一步计算指标和统计处理;便于发现某些特大或特小的可疑值讲授总体中的某些个体总是具有某些同质性,同一地区、同一年度、同一民族、同一年龄段、相同的性别与类似的健康状况
6、,这些共同点使得观察单位的同一变量趋向同一数值,即集中趋势。另一方面,同一总体中的个体之间又普遍存在着各种差别,也就是说由于遗传、营养、行为等各种因素在个体之间都不会完全相同,即个体间存在差异,因此导致某地18-35岁健康男性居民血清铁含量不会完全相同,而是呈现或大或小的离散趋势。集中趋势与离散趋势是频数分布的两个特征,需进行定量的描述。一、描述集中趋势的统计指标描述集中趋势的统计指标:均数、几何均数、中位数1 .算术均数(arithmeticmean):简称均数(mean)常用X表示样本均数,表示总体均数。均数用于反映一组同质观察值的平均水平,适用于正态或近似正态分布的数值变量资料。其计算方
7、法有:直接法:.=%+J+.例2一3例2-4n加权法:乙J应用-适用于描述对称分布特别是正态分布资料的平均水平或集中位置,因为这时均数位于分布的中心,最能反映资料的集中趋势。2 .几何均数(geometricmean)用G表示,适用于对数正态分布,即数据经过对数变换后呈正态分布的资料;等比级数资料,即观察值之间呈倍数或近似倍数变化的资料。如医学实践中的抗体滴度、平均效价等。其计算方法有直接法:G=QxvX2.JC”G=IgT(幻例2-5加权法:G=Ig产丝F例2-6I/J12452-慢肝炎患者的HBSAg一度资料抗体满度颖敷S满度倒数(X)的AW1;162161.204122.408241:3
8、27321.5051510.536051:64H641.8061819.867981:!28131282.1072127.393731:25612256X4082428.898881:51275122.7092718.96489_合计52108.06977C1_)f21.20412+7x1.50515+.+72.7027)举例G-IgI52)=lg,(108.06977/52)=lg(2.7017)=119.74705应用:适用于等比及对数正态分布资料;计算时,观察值不能有。或同时有正有负。【本讲课程的小结】【本讲课程的作业】1 .频数分布有哪些类型?2 .频数分布有什么特征?3 .描述定量资
9、料集中趋势的常用指标有哪几个?4 .均数和几何均数各自的适用条件是什么?内容课程名称:卫生统计学A第2周,第3讲次S S一第二章定量资料的统计描述, 第二节定量变量的特征数授课题目(章、节)第三节描述分布形态的特征数【目的要求】掌握描述集中趋势、离散趋势的常用指标及其意义、适用范围。熟悉集中趋势、离散趋势常用指标的计算。了解描述分布形态的特征数。【重 点】描述集中趋势、离散趋势的常用指标及其意义、适用范围。【难 点】各类指标的应用。【本讲课程的引入】上一次课我们介绍了频数分布的两个特征:集中趋势与离散趋势,要进行定量的描述需分别采用不同的指标,其中描述集中趋势的常用指标有: 均数、几何均数、中
10、位数,均数与几何均数在上一课中已介绍,今天将介绍中位数, 同时还要介绍描述离散趋势的指标。【本讲课程的内容】一、描述集中趋势的统计指标描述集中趋势的统计指标:均数、几何均数、中位数3.中位数(median) M将一组变量值从小到大按顺序排列,中间位置对应的数值就是中位数。一个中位数将全部观察值分为两部分,有50%的观察值比它小,有50%的观察 值比它大。百分位数(percentile):将n个观察值从小到大排列后,将其平均的分为100 等份,对应于每一分割位置的数值就是一个百分位数,用PX表示。一个百分位数PX将总体或样本的全部观察值分为两部分,理论上,在不包括 PX的全部数据中有X%的观察值
11、比它小,有(IOO-X) %的观察值比它大。中位数M = EO计算 直接法:n为奇数时一 M = x+1讲授例2-7频数表法:Pv=L+x%-)JXL为百分位数所在组段的下限,i为该组段的组距,fx为该组段的频数,FL为百分位数所在组段的前一组段的累计频数,n为总例数。例2-8表2.5某市大气中SQ2日平均浓度举例浓度,岱?)频数/(2)祟计厥数2/(3)祟计频率(4)25393910.8506710629.4756417047.1100-6323364.5125-4527877.0150-3030885.3175-1732590.0200-933492.5225-734194.5250634
12、796.1275-535297.5300-335598.3325-3506361100.0求P25,P50,P75M=Ro=L+(几x%-J=IOO+(361x50%17O)=1Q4.17gi、2563色=L+-(几x%-)=50+(361x25%-39)=69.1g/?3A67Z3S5=+(nx%-)=125+(36175%-233)=146w3fX45中位数和百分位数的应用1)中位数适用于各种分布类型的数值资料。常用于描述偏态分布、特别是分布末端无确定数值资料的集中趋势,反映位次居中的观察值的平均水平。在对称分布的资料中,中位数和均数在理论上是相同的。2)百分位数既可用于描述集中趋势,也可
13、用于描述离散趋势,还可用于确定医学参考值范围。例2-9试观察3组数据的离散情况。AA组26 28 30 32 34B C4-B组24 27 30 33 36C组26 29 30 313424262830323436描述离散趋势的常用指标:极差、四分位数间距、方差、标准差、变异系数二、描述离散趋势的统计指标讲授、举例1、极差(rage)R也称全距,用R表示,即一组资料中,最大值与最小值之差。缺点:1)除了最大、最小值外,不能反映组内其他数据的变异度。2)不够稳定,样本例数越多,抽到较大或较小变量值的可能性越大,因而极差可能越不稳定。2、四分位数间距(力7teLquartierange)QQ=Pts-P25=Qu-QlP25表示全部观察值中有25%(1/4)的观察值比它小,记为下四分位数。,P75表示全部观察值中有25%(1/4)的观察值比它大,记为上四分位数适用于:各种类型的连续型变量,特别是偏态分布的资料。3、方差AVarianCa4-2总体方差:?=E(X-M2样本方差:S?二(F一NT同类资料比较时,方差越大说明数据间变异越大,越分散。适用于:对称分布、特别是正杰分布资料。4、标准差(Standarddiv