《雷静卫生统计学第二章定量资料的统计描述二.ppt》由会员分享,可在线阅读,更多相关《雷静卫生统计学第二章定量资料的统计描述二.ppt(14页珍藏版)》请在优知文库上搜索。
1、衡量变异程度的常用指标:衡量变异程度的常用指标:极差、四分位间距、方差、标准差和变异系数极差、四分位间距、方差、标准差和变异系数1.极差(极差(range),),R亦称全距亦称全距 R =Xmax -Xmin优点:简单明了优点:简单明了缺点:缺点:1)不能反映组内其他数据的变异度;)不能反映组内其他数据的变异度;2)样本例数越多,极差可能越大)样本例数越多,极差可能越大 n1与与n2 相差大时,不宜比较其极差;相差大时,不宜比较其极差;3)即使样本例数不变,极差的抽样误差亦)即使样本例数不变,极差的抽样误差亦较大,即不够稳定。较大,即不够稳定。2.四分位间距四分位间距(quartile)用用Q
2、表示:表示:QL下四分位数即下四分位数即P25,QU上四分位数即上四分位数即P75 Q=QU-QL 可看成是中间一半观察值的极差可看成是中间一半观察值的极差 Q 较极差稳定,但仍未考虑到每个观察值较极差稳定,但仍未考虑到每个观察值 的变异度。的变异度。其它百分位间距:其它百分位间距:P95-P5、P90-P10、P80-P203.离均差平方和、方差、标准差离均差平方和、方差、标准差 1)离均差平方和:)离均差平方和:(X-)2 2)方差()方差(variance)总体方差:总体方差:样本方差:样本方差:NX22)(1)(22nXXS4.标准差标准差(standard deviation)为了用
3、原单位表示变异度,把方差开方为了用原单位表示变异度,把方差开方 标准差标准差 标准差越大,说明个体差异越大,则平均标准差越大,说明个体差异越大,则平均数的代表性就越差。数的代表性就越差。总体标准差总体标准差 样本标准差样本标准差 公式中公式中n-1 为自由度,其意义是当为自由度,其意义是当 给定时,给定时,随机变量随机变量 X X 能能“自由自由”取值的个数取值的个数任何统计量的自由度任何统计量的自由度=n-限制条件的个数限制条件的个数 N)(2X1)(2nXXSX数学上可以证明:数学上可以证明:所以,样本标准差的计算公式可写成:所以,样本标准差的计算公式可写成:直接法:直接法:频率表法:频率
4、表法:NXXXXlSSXX222)()(1)(22nnXXS1)(2020nnfXfXSn5.变异系数变异系数(coefficient of variation)CV 亦称离散系数亦称离散系数 极差、四分位间距和标准差都是有单位的,极差、四分位间距和标准差都是有单位的,其单位与观察值单位相同;而变异系数是相对数,其单位与观察值单位相同;而变异系数是相对数,没有单位,更便于资料间的分析比较。没有单位,更便于资料间的分析比较。:比较度量衡单位不同的多组资料的变异度;比较度量衡单位不同的多组资料的变异度;比较均数相差悬殊的多组资料的变异度。比较均数相差悬殊的多组资料的变异度。%100XSCV描述分布
5、形态的指标:偏度系数、峰度系数描述分布形态的指标:偏度系数、峰度系数偏度系数偏度系数(coefficient of skewness,SKEW)3)()2)(1(sxxnnnSKEW意义:理论上,总体偏度系数为意义:理论上,总体偏度系数为0 0时,分布是对称时,分布是对称的;取正值时,分布为正偏峰,取负值时,分布的;取正值时,分布为正偏峰,取负值时,分布为负偏峰。为负偏峰。峰度系数峰度系数(coefficient of kurtosis,KURT))3)(2()1(3)()3)(2)(1()1(24nnnsxxnnnnnKURT意义:理论上,正态分布的总体峰度系数为意义:理论上,正态分布的总体
6、峰度系数为0 0;取;取负值时,其分布较正态分布的峰平阔,取正值时,负值时,其分布较正态分布的峰平阔,取正值时,分布较正态峰尖峭。分布较正态峰尖峭。小结小结计量资料离散趋势的统计描述常用指标:计量资料离散趋势的统计描述常用指标:四分位间距四分位间距常用于常用于偏态分布偏态分布资料离散趋势的描述资料离散趋势的描述 标准差标准差用于用于对称分布对称分布尤其是正态分布尤其是正态分布 变异系数变异系数用于比较度量衡单位不同的多组资料的变用于比较度量衡单位不同的多组资料的变异度;比较均数相差悬殊的多组资料的变异度。异度;比较均数相差悬殊的多组资料的变异度。例:某地例:某地4040例中年健康男子血清总胆固
7、醇值例中年健康男子血清总胆固醇值(mmol/Lmmol/L)测定结果如下:)测定结果如下:4.77 3.37 6.14 3.95 3.56 4.23 4.31 4.77 3.37 6.14 3.95 3.56 4.23 4.31 4.71 4.56 4.37 5.39 6.30 5.21 4.71 4.56 4.37 5.39 6.30 5.21 7.22 7.22 5.54 3.39 5.18 5.77 4.79 5.12 5.20 5.54 3.39 5.18 5.77 4.79 5.12 5.20 5.10 4.70 4.74 4.38 4.89 6.25 5.32 5.10 4.70
8、4.74 4.38 4.89 6.25 5.32 4.50 4.63 3.61 4.44 4.47 3.40 3.91 4.50 4.63 3.61 4.44 4.47 3.40 3.91 2.70 2.70 4.60 4.09 5.96 5.48 4.60 4.09 5.96 5.48 1 1)编制频数分布表并绘制直方图)编制频数分布表并绘制直方图 2 2)估计其频数分布的类型)估计其频数分布的类型 3 3)计算均数)计算均数 、标准差、标准差S S、变异系数、变异系数CVCV 4 4)计算中位数)计算中位数MM,并与,并与 比较。比较。表表2 某地某地40例健康成年男子血清胆固醇值的频数表例健康成年男子血清胆固醇值的频数表组段组段 划记划记 频数频数2.70 13.20 43.70 44.20 104.70 95.20 65.70 36.20 26.70 07.207.70 1 合计合计 40