《人群健康研究的统计学方法定量资料的统计描述、正态分布.ppt》由会员分享,可在线阅读,更多相关《人群健康研究的统计学方法定量资料的统计描述、正态分布.ppt(33页珍藏版)》请在优知文库上搜索。
1、定量资料的统计描述 集中趋势 离散趋势 对称分布 非对称分布 倍数变化 集中趋势 均数 中位数 几何均数 离散趋势 标准差 四分位数间距 对数标准差 变异系数 定量资料的描述 正态分布 05101520251091131171211251291330246810105109113117121125129133107 109 111 113 115 117 119 121 123 125 127 129 131 133正态分布的特点:1.单峰,钟形2.以均数为中心,两侧对称3.尾端不与横轴相交4.均数位置,标准差形状5.曲线下面积分布有特殊规律00.10.20.30.40.50.60246 图3
2、.2 不同均数、不同标准差的正态分布示意图sx96.1 身高范围(cm)估计频数比例%(频率)实际频数 实际频率%sx 121.951(4.72)117.23126.67 68.27 75 68.18 sx64.1 121.951.64(4.72)114.21129.69 90.90 99 90.00 sx96.1 121.951.96(4.72)112.70131.20 95.00 104 94.55 sx58.2 121.952.58(4.72)109.77134.13 99.00 109 99.10 表表3.1 110名名7岁男童身高频数实际分布与理论分布的比较岁男童身高频数实际分布与理
3、论分布的比较 标准正态分布-3-2-10123图3.3 标准正态分布示意图sxxU例3.3例2.1中已得110名7岁男童身高 ,现欲估计该地1995年身高界于116.5cm 到119.0cm范围内的7岁男童比例及110名7岁男童中身高界于116.5119.0cm范围的人数。cmScmX72.4,95.12115.172.495.1215.1161u63.072.495.1210.1192u 正态分布的应用 临床参考值范围的制定 1.选取适当数量的“正常”人2.控制测量误差3.确定单、双侧4.确定适当的范围大小5.确定正确的统计方法正态分布法 百分位数法 统计分析统计描述 统计推断参数估计 假设
4、检验 在大多数情况下,研究者并不知道总体的参数,而是在总体中随机抽取一定数量观察单位作为样本进行抽样研究(sampling study),通过样本指标来说明总体特征,这种从样本获取有关总体信息的过程称为统计推断(statistical inference)。抽样研究总体样本 抽样误差在抽样研究中,抽样误差是不可避免的。nXXSSn总体均数的估计点估计 区间估计 xsx96.1中心极限定理数理统计推理和中心极限定理(central limit theorem)表明:从正态总体N(,)中,随机抽取例数为n的样本,样本均数 也服从正态分布;即使从偏态总体随机抽样,当n足够大时(如n50),也近似正态
5、分布。XX t 分布 t0.000.100.200.300.40-5.0-4.0-3.0-2.0-1.00.01.02.03.04.05.0 (标准正态曲线)=5=1f(x)图4.1 不同自由度下t分布图 xstx,05.0例4.2 试求例4.1中该地1岁婴儿血红蛋白平均值95%的可信区间。本例n=25,S=11.9g/L,按式(4.2)算得样本均数的标准误为:(g/L)=n1=251=24,取双尾0.05,查附表2,t值表得 。按式(4.4)得:即 (118.79,128.61)g/L 故该地1岁婴儿血红蛋白平均值95%的可信区间为(118.79,128.61)g/L。11.92.3825XSSn0.05 2,242.064t38.2064.27.123,38.2064.27.123例4.4 某地抽得正常成人200名,测得其血清胆固醇的均数为3.64mmol/L,标准差为1.20mmol/L,试估计该地正常成人血清胆固醇均数的95%可信区间。本例n=20050,故采用正态近似的方法按式(4.7)计算可信区间。今 =3.64,S=1.20,取双尾0.05得 。即(3.47,3.81)mmolL 故该地正常成人血清胆固醇均数的95%可信区间为(3.47,3.81)mmolL。X96.105.0u20020.196.1.643 ,20020.196.164.3