《第5章正态分布.ppt》由会员分享,可在线阅读,更多相关《第5章正态分布.ppt(57页珍藏版)》请在优知文库上搜索。
1、1第五章:正态分布第五章:正态分布1、标准正态分布、标准正态分布2、常用统计分布、常用统计分布3、大数定理与中心极限定理、大数定理与中心极限定理2学习目标学习目标n掌握正态分布的特性;掌握正态分布的特性;n正态分布曲线下面积的含义;正态分布曲线下面积的含义;n标准分的计算和应用;标准分的计算和应用;n利用标准正态分布表计算概率。利用标准正态分布表计算概率。n理解大数定理和中心极限定理理解大数定理和中心极限定理3从从 “分布分布”说起说起定 类定 序直 方 图折 线 图定 距统 计 图一、什么是正态分布?一、什么是正态分布?4直方图直方图用长条的面积来表示频次或用长条的面积来表示频次或相对频次;
2、相对频次;折线图折线图用直线连接直方图中条形顶用直线连接直方图中条形顶端的中点;端的中点;当组距逐渐减小时,折线将逐渐平滑为曲当组距逐渐减小时,折线将逐渐平滑为曲线。线。5峰点(峰点(Peak)研究(研究(P40)单峰单峰多峰多峰6几种常见的频数分布曲线几种常见的频数分布曲线对称分布右偏分布左偏分布正J型分布反J型分布U型分布7 一、一、正态分布曲线正态分布曲线 81.1 什么是正态分布?什么是正态分布?1 1、由德国数学家高斯提出,也叫高斯分布;、由德国数学家高斯提出,也叫高斯分布;2 2、自然界、社会经济生活中大量存在的分布规律;、自然界、社会经济生活中大量存在的分布规律;3 3、经典统计
3、推断的基础;、经典统计推断的基础;4 4、在所有的分布中,正态分布居于首要位置;、在所有的分布中,正态分布居于首要位置;91.2 正态分布的基本特征正态分布的基本特征特征一特征一:一个高峰:一个高峰特征二特征二:一条对称轴:一条对称轴特征三特征三:一条渐近线:一条渐近线M0Md=众值众值=中位值均值中位值均值101.3 正态分布的数学表达式正态分布的数学表达式(x)=随机变量随机变量 X 的频次(概率密度)的频次(概率密度)总体标准差;总体标准差;=总体方差总体方差 =总体均值总体均值 =3.14159;e=2.71828x=随机变量的取值随机变量的取值(-x )111.4 两个参数的影响两个
4、参数的影响(,)均均 值值标准差标准差 121.4.1 对正态曲线的影响对正态曲线的影响1 2 31 2 3131.4.2 对对正态曲线的影响正态曲线的影响xCAB曲线A和B的比较14n正态曲线的位置由均值正态曲线的位置由均值 决定;决定;n正态曲线的形状正态曲线的形状“高,矮,胖,瘦高,矮,胖,瘦”的特点由标准差的特点由标准差 决定;决定;15二、正态曲线下的面积二、正态曲线下的面积n2.1 正态曲线下面积的涵义正态曲线下面积的涵义n随机变量的频次总和;随机变量的频次总和;n一般把正态曲线下的总面积约等于一般把正态曲线下的总面积约等于1,这时一定区间内的频次分布表现为概率分布。这时一定区间内
5、的频次分布表现为概率分布。162.2 正态曲线的一个重要性质正态曲线的一个重要性质 无论正态曲线具有哪种均值和标准无论正态曲线具有哪种均值和标准差,在均值和横坐标某一点的距离内差,在均值和横坐标某一点的距离内(用标准差来表示)曲线下的面积是常(用标准差来表示)曲线下的面积是常数。数。下图说明此意。下图说明此意。17正态曲线下的面积(图)正态曲线下的面积(图)-2+22.3%2.3%-+95.46%68.26%182.3 几个典型取值区间的概率值几个典型取值区间的概率值nP(-+)=0.6827;nP(-2 +2 )=0.9545;nP(-3 +3 )=0.9973;19三、标准正态分布三、标准
6、正态分布3.1 什么是标准正态分布什么是标准正态分布 以标准差为单位的正态分布一以标准差为单位的正态分布一般称为标准正态分布般称为标准正态分布(standardized normal distribution)203.2 标准正态分布的重要性标准正态分布的重要性 简化统计分析简化统计分析 一般的正态分布取决于均值一般的正态分布取决于均值 和标准差和标准差 ;计算概率时计算概率时,每一个正态分布都需要有自,每一个正态分布都需要有自己的正态概率分布表,这种表格是无穷多己的正态概率分布表,这种表格是无穷多的的 若能将一般的正态分布转化为标准正态分若能将一般的正态分布转化为标准正态分布,计算概率时只需
7、要查一张表布,计算概率时只需要查一张表213.3 标准分标准分(Standard scores)n公式公式:Z Z值代表每个值代表每个X X值在标准正态分布上的数值。值在标准正态分布上的数值。223.4 标准正态分布的表达式标准正态分布的表达式正态分布的表达式为:正态分布的表达式为:N(,)标准正态分布的表达式为:标准正态分布的表达式为:N(0,1)标准正态分布是一般正态分布的特例,即标准正态分布是一般正态分布的特例,即 0 0,1 1的正态分布。的正态分布。233.5 标准分的实际意义标准分的实际意义n各总体之间可以通过标准分进行合各总体之间可以通过标准分进行合理的比较理的比较n不同总体间综
8、合指标的比较不同总体间综合指标的比较243.7 标准正态分布的面积标准正态分布的面积nP(-1 Z 1)=0.6827;nP(-2 Z 2)=0.9545;nP(-3 Z 3)=0.9973;由于标准正态分布由于标准正态分布N(0,1)的图形是的图形是唯一的,因此使用标准正态分布无须自唯一的,因此使用标准正态分布无须自己计算,只需要学会查表就行了。己计算,只需要学会查表就行了。25四、标准正态分布表的使用四、标准正态分布表的使用4.1 标准正态分布表的介绍标准正态分布表的介绍264.2标准正态分布的计算标准正态分布的计算【例【例5】已知】已知服从标准正态分布服从标准正态分布N(0,1),),求
9、求P(1.3)=?1.3)=?解:因为解:因为 服从标准正态分布服从标准正态分布N N(0 0,1 1),),可直接查附表可直接查附表4 4,根据,根据z=1.3z=1.3,有有 P P(1.3)=1.3)=1.31.3=0.9032=0.9032Xi:大写大写,小写小写读作:克西读作:克西 27【例【例6】:已知已知服从标准正态分布服从标准正态分布N(0,1),),求求P(1.3)=?1.3)=?解:因为解:因为 1 1,而而 P P(1.3)1.3)P P(1.3)1.3)1 1因此有因此有P P(1.3)1.3)1 1 P P(1.3)1.3)1 1 1.31.3 0.09680.096
10、828【例【例7】已知已知服从标准正态分布服从标准正态分布N(0,1),),求求P(1.3)=?1.3)=?解:附表四中没有给出解:附表四中没有给出Z0Z0的的 Z Z 值。根值。根据标准正态分布图形是以据标准正态分布图形是以Z Z0 0为对称的为对称的原理,原理,P P(1.3)=11.3)=1 1.31.3 0.09680.096829【例【例8】已知已知服从标准正态分布服从标准正态分布N(0,1),),求求P(1.3 2.3)?)?解:解:P P(1.3 1.3 2.3 2.3)2.32.3 1.31.3 =0.9893 =0.98930.9032=0.08610.9032=0.0861
11、30【例【例9】已知已知服从标准正态分布服从标准正态分布N(0,1),),求满求满足足P()0.05 0.05 中中的值的值解:解:P P()P P()+)+(-)2 P 2 P()=2(1-=2(1-)=0.05)=0.05 =1-0.025=0.975=1-0.025=0.975查表得,查表得,=1.96=1.9631【例【例10】根据统计,北京市初婚年龄服从正态分布。其均值为根据统计,北京市初婚年龄服从正态分布。其均值为25岁,标岁,标准差为准差为5岁,问岁,问25岁到岁到30岁之间结婚的人,其百分比为多少?岁之间结婚的人,其百分比为多少?解:解:1.1.年龄换为标准分:年龄换为标准分:
12、Z1Z1 ,Z2Z22.2.查表得查表得 Z1Z1 0.50,0.50,Z2Z2 0.84130.8413 Z2Z2 -Z1Z1 =0.3413,=0.3413,所以所以2525岁到岁到3030岁之间结婚的人,百分数为岁之间结婚的人,百分数为34.13%.34.13%.052525152530324.3 标准正态分布表的使用标准正态分布表的使用1.通过标准分公式,将一般为正态分布转换为标通过标准分公式,将一般为正态分布转换为标准正态分布;准正态分布;2.计算概率时计算概率时,查标准正态分布表;,查标准正态分布表;3.对于负的对于负的 x,可由可由 (-x)x 得到;得到;4.对于标准正态分布,
13、即对于标准正态分布,即XN(0,1),有有nP(a X b)b a nP(|X|a)2 a 133常用的标准值常用的标准值Z 1.65,1.65,概率概率P P为为0.05;0.05;Z 1.96,1.96,概率概率P P为为0.025;0.025;Z 2.58,2.58,概率概率P P为为0.005;0.005;344.二项分布的正态近似法二项分布的正态近似法 通过前面的讨论,我们已经知道二项分布受成功事件概率p和重复次数n两个参数的影响,只要确定了p和n,二项分布也随之确定了。但是,二项分布的应用价值实际上受到了n的很大限制。也就是说,只有当n较小时,我们才能比较方便地计算二项分布。所幸的
14、是,二项分布是以正态分布为极限的。所以当n很大时,只要p或q不近于零,我们就可以用正态近似来解决二项分布的计算问题。即以n p、n p q2,将B(x;n,p)视为N(n p,n p q)进行计算。在社会统计中,当n 30,n p、n q均不小于5时,对二项分布作正态近似是可靠的。35常见的抽样分布常见的抽样分布(一)分布 设 是独立同分布的随机变量,且每个随机变量都服从标准正态分布,即 (0,1),则随机变量 =的分布称为自由度为 的 分布,记作 ()。当当 时,时,分布趋近于正态分布分布趋近于正态分布,即 ()(,2 )。2nxxx,21ix2niix12n22nn2n2nnn 卡方分布是
15、一种连续型随机变量的概率分布,主要用于列联表卡方分布是一种连续型随机变量的概率分布,主要用于列联表检验。检验。1.数学形式数学形式 设随机变量设随机变量X1,X2,Xk,相互独立,且都服从同一的正态,相互独立,且都服从同一的正态分布分布N(,2)。那么,我们可以先把它们变为标准正态变量。那么,我们可以先把它们变为标准正态变量Z1,Z2,Zk,k个独立标准正态变量的平方和被定义为卡方分布个独立标准正态变量的平方和被定义为卡方分布(分布)的随机变量分布)的随机变量 (读作卡方),且读作卡方),且kiikiikZxxxx12122222212)(1)()()();(2kx22222 我们把随机变量我
16、们把随机变量 的概率分布称为的概率分布称为 分布,其概率密度记分布,其概率密度记作作 。其中。其中k为卡方分布的自由度,它表示定义式中独立变量为卡方分布的自由度,它表示定义式中独立变量的个数。的个数。关于卡方分布的分布函数,附表关于卡方分布的分布函数,附表7对不同的自由度对不同的自由度k及不同的临及不同的临界概率界概率(01),给出了满足下面概率式的,给出了满足下面概率式的 的值的值(参见参见图图)。22)(2k 注意注意 写法的含义:它写法的含义:它表示自由度为表示自由度为k的卡方分布,当的卡方分布,当其分布函数其分布函数 时,其随机变量时,其随机变量 的临界值的临界值(参参见图见图)。具体来说,在假设检验。具体来说,在假设检验中,它表示在显著性水平中,它表示在显著性水平上卡上卡方分布随机变量方分布随机变量 的临界值。的临界值。22);();(22dxkxkP);(22kP)(2k 例例 试求下列各值:试求下列各值:)5(2)5;(201.02P)7()4(),7()3(),10()2(),10()1(201.0205.0295.0205.0 例例 已知已知k5,15,求临界概率,求