统计学—抽样推断.ppt

上传人:王** 文档编号:185371 上传时间:2023-04-02 格式:PPT 页数:76 大小:1.84MB
下载 相关 举报
统计学—抽样推断.ppt_第1页
第1页 / 共76页
统计学—抽样推断.ppt_第2页
第2页 / 共76页
统计学—抽样推断.ppt_第3页
第3页 / 共76页
统计学—抽样推断.ppt_第4页
第4页 / 共76页
统计学—抽样推断.ppt_第5页
第5页 / 共76页
统计学—抽样推断.ppt_第6页
第6页 / 共76页
统计学—抽样推断.ppt_第7页
第7页 / 共76页
统计学—抽样推断.ppt_第8页
第8页 / 共76页
统计学—抽样推断.ppt_第9页
第9页 / 共76页
统计学—抽样推断.ppt_第10页
第10页 / 共76页
亲,该文档总共76页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《统计学—抽样推断.ppt》由会员分享,可在线阅读,更多相关《统计学—抽样推断.ppt(76页珍藏版)》请在优知文库上搜索。

1、1STAT本章重点提示: 1、抽样推断的一般问题; 2、抽样平均误差的概念及其计算; 3、总体参数的区间估计; 4、样本容量的确定;本章难点提示: 1、抽样平均误差的概念及其计算; 2、总体参数的区间估计2STAT第一节 抽样推断的一般问题 抽样推断过程包括三个方面:随机抽样、参数估计、假设检验。 一、抽样推断的概念 按随机原则,从总体中抽取一部分单位组成样本进行调查,并根据样本指标,对相应的总体指标作出具有一定可靠程度的估计和判断。 随机原则:又称同等可能性原则,即。 作用:防止人的主观思想和利益关系的干扰。 从总体中抽取样本的方法有概率抽样与非概率抽样两种: 概率抽样也叫随机抽样,是按随机

2、原则抽取样本。概率抽样可避免系统性误差、可计算和控制抽样误差、可说明估计结果的可靠程度。3STAT 非概率抽样也叫非随机抽样,是根据经验或判断从总体中选取若干单位构成样本。如重点调查、典型调查、配额抽样、方便抽样等。非概率抽样难免掺杂调查者的主观偏见,存在系统性误差、不可以计算和控制抽样误差、不可以说明估计结果的可靠程度。 统计上讲的抽样一般都是指概率抽样。统计上讲的抽样一般都是指概率抽样。二、抽样推断的特点1、是非全面调查 与普查的区别;2、按随机原则抽取样本 与典型调查和重点调查的区别;3、根据样本指标推断总体指标 与重点调查的区别;4、抽样误差可以事先计算与控制 与典型调查的区别。4抽样

3、推断抽样推断STAT三、抽样推断的作用1、对某些社会现象不可能或不必要进行全面调查,但又必须了解其全面情况时,可采用抽样推断。(如:破坏性检验、无限总体、家计调查等等);2、与全面调查比较,省时、省力、省费用、时效性高;3、可用抽样推断资料对全面调查资料加以补充或修正;4、可用于工业生产过程中的质量控制。四、抽样推断中的基本概念(一)总体与样本: 1、总体(全及总体):被观察对象的全体。N:总体单位数。 2、样本(样本总体):按从总体中的部分单位所构成的整体。n : 样本单位数、样本容量5 全及总体是唯一确定的,样本总体不是唯一确定的。(二)抽样框 将全及总体中的每个单位进行编号而制定的目录或

4、表格就是抽样框。 一个理想的抽样框应与目标总体一致,不重复、不遗漏。 编制抽样框的目的:1、便于抽取样本;2、保证随机原则得以实现。(三)抽样方法 1、重复抽样(回置抽样、放回抽样) 特点: 同一单位有多次被抽中的机会,每个单位中选的机会在每次都一样。 2、不重复抽样(不回置抽样、不放回抽样) 特点: 同一单位只有一次被抽中的机会,每个单位中选的机会在各次都不相同。不重复抽样抽取的样本代表性高不重复抽样抽取的样本代表性高小样本大样本3030nn6STAT(四)总体指标与样本指标总体指标(总体参数) 样本指标(样本统计量) 总体指标是确定性变量,样本指标是随机变量。名称总体参数样本统计量单位数N

5、n平均数NXnxx成数P=N1/Np=n1/n方差NXX22)(1)(22nxxs标准差s 7STAT 五、抽样推断的组织形式(一)简单(纯)随机抽样 对总体不经过任何分组和排队,按照随机原则抽取样本单位。 产生样本随机数字表摇号抽签编号特点:1、最符合随机原则,不含任何主观影响;2、当总体单位标志值变异较大时,抽样误差较大;3、编号在某些情况下难度较大。4、是其他抽样组织形式及抽样推断的基础。8STAT(二)等距(机械)抽样 1、概念:事先将总体全部单位按某一标志排队,再按照相同的间隔抽取样本单位。 总体N、样本 n 抽样间隔K=N/n。第一个样本单位用简单随机抽样方法确定。例N=50 n

6、=5,则 K=50/5=10 ;若用抽签法确定第一组的4号为样本单位则 A4、A14、A24、A34、A44 2、排队方式(1)按无关标志排队:排队的标志与调查研究的标志无关。(2)按有关标志排队:排队的标志与调查研究的标志有关。 3、特点:容易组织、按有关标志排队的等距抽样代表性较高。9STAT(三)分层(类型)抽样 1、概念 先将全部总体单位按主要标志进行分组(类),再按随机原则在各组进行纯随机抽样。 2、抽样数目在各组的确定(1 )类型平均抽样 适用前提是各组单位数相等或差异不大的情况下。(2)不等比例抽样: i/ =ni/n 离差越大,抽得越多,反之亦反。 niiini10STAT*(

7、2)等比例抽样:先将全部总体单位分类,再按同一比例在各类抽取样本单位。即:n1/N1= n2/N2= = n/N 样本与总体比例一致 。 例: 类型比例抽样法算例类型区村 数( )村 数 比重(%)各类型区抽取村数山区 6 10 1丘陵 42 70 6平原 12 2o 2合计 60(N) 100 9 (n)NiNnNniini11 特点: *由于各类型组内标志差异程度缩小,类型抽样抽取的样本代表性高,抽样误差小。特别是总体各单位标志值大小悬殊时,类型抽样更具有优越性。 (四)整群抽样 1、概念 先按某种标志或要求将总体区分为若干群(R),群内单位数(M)相等;再采取不重复抽样方式从R群随机抽出

8、r群,尔后对样本群进行全面调查以推断总体。 整群抽样和分层抽样都是统计分组和简单随机抽样结合的产物。但它们还是有本质区别的。其一,分群(层)原则不同。对于分层抽样,层间差异应尽可能大,层内差异应尽可能小;而对于整群抽样则相反。其二,抽样单位不同。分层抽样的抽样单位是基本单位(即总体单位),而整群抽样的抽样单位是群。其三,调查方式不同。对于分层抽样,在层内是抽样调查,在层间是全面调查;而对于整群抽样则相反。 2、特点 组织方便、省时省费用;但样本分布不均匀,代表性稍差。 12STAT 六、抽样推断的理论基础 (一)大数定理和中心极限定理 1、大数定理 在大量观察和多次试验的情况下,随机现象的偶然

9、离差趋向于互相抵消,总体呈现出稳定的统计规律性。 大数定理说明随机变量随着样本容量n的不断增大,样本平均数(或成数)愈来愈接近总体平均数(或成数)。 2、中心极限定理 表明,在样本容量n充分大的条件下,不论总体的变量是否服从正态分布,其样本平均数 趋向于以总体平均数为 ,方差为 / n 的正态分布N( , /n )。 (二)抽样分布 1、样本平均数的分布(见中心极限定理) 2、样本成数的分布: 当n 大n 和 n(1- ) 同时大于5时,样本成数近似服从于以总体成数为P,方差为P(1-P)/n的正态分布。 x22pp13STAT 第二节、抽样误差的计算一、抽样误差的概念 登记性误差调查误差 系

10、统性误差 代表性误差 实际抽样误差 抽样误差 抽样平均误差 代表性误差是指 由于样本的结构不能完全代表总体的结构所引起的误差。 系统性误差是指由于抽样调查违反随机原则引起的误差; 抽样误差是指由于抽样的随机性而产生的样本指标与总体指标的绝对离差。xPp 22s14STAT 实际抽样误差:指某一次抽样结果所得的样本指标与总体指标之间的误差(不存在),实际抽样误差是随机变量; 抽样平均误差:指所有可能的样本指标与总体指标之间的平均误差。用所有可能出现的样本指标的标准差表示(简称抽样误差),抽样平均误差是确定性变量。二、抽样平均误差概念举例 例:一个4人的全及总体,日产量为:甲40件,乙50件,丙7

11、0件,丁80件,假定从中抽取2人进行调查,求抽样平均误差。解:采用不重复抽样不重复抽样,考虑顺序考虑顺序,可组成样本个数为:12121234)!24(! 424AAnN15STAT 采用不重复抽样不重复抽样,不考虑顺序不考虑顺序,可组成样本个数为:612121234! 2)!24(! 424CCnN现采用不重复抽样,不考虑顺序,则可抽取到6个的样本。 采用重复抽样重复抽样,考虑顺序考虑顺序,可组成样本个数为:1642nN采用重复抽样重复抽样,不考虑顺序不考虑顺序,可组成样本个数为:10! 2)!25(! 5251CCnnN16 不重复抽样抽样平均误差计算表样本日产量(x)甲 乙 40 50 4

12、5-15 225甲 丙 40 70 55 -5 25甲 丁 40 80 60 0 0乙 丙 50 70 60 0 0乙 丁 50 80 65 5 25丙 丁 70 80 75 15 225合计360 0 500 xxx)(2xxixiMxMxx2)(.606360 ( 为全及总体平均数,M为可能组成的样本个数, 为抽样平均误差)(xx17 三、抽样平均误差的实际计算 概率论研究证明,所有可能出现的样本平均数的标准差与总体平均数的标准差之间的关系为: 则: nxnnxx2xixMx件13.96500)(22(此公式为定义公式,不能据此公式计算抽样平均误差)即:6个样本平均数与总体平均数的平均离差

13、为9.13件,不管抽到哪个样本,平均来说,误差是9.13件。注:因总体方差不知,可A、用历史资料替代,若有若干个 ,取最大值;B、用样本方差替代。(样本的方差可不断地接近于总体的方差)18STAT(一)纯随机抽样形式下 1、抽样平均数抽样平均误差的计算 重复抽样: 不重复抽样: )1 ()1(122NnnNnNnNnNnxnnx2)1(为校正因子NnN* *由于校正因子总是1,所以不重复抽样的抽样平均误差总比重复抽样的抽样平均误差小。在N很大时,校正因子趋近于1,因此,按不重复抽样方法抽取样本,也可按重复抽样的公式计算抽样平均误差。19STAT例:某工厂生产一种灯泡共2000只,随机抽取400

14、只作耐用时间实验,测试结果为平均寿命为4800小时,样本标准差为300小时,求抽样平均误差。 重复抽样: 不重复抽样:)(1540030022小时nsx)(42.13)20004001 (400)1 (30022小时Nnnsx20STAT 2、抽样成数抽样平均误差的计算 重复抽样: 不重复抽样: NPN1nnP1)1 (2PPp成数方差nPPp)1()1 ()1 ()1()1 (NnnPPNnNnPPpp 注:(1)可用样本成数方差代替总体成数方差; (2)可用样本成数 代替总体成数P; (3)有若干个P值时,取最接近0.5的P值; (4)无P值时,取P=0.5 (此时方差最大)21STAT

15、例:一批食品罐头60,000桶,随机抽查300桶,发现有6桶不合格,求合格率的抽样平均误差。 解:已知样本的合格率= 重复抽样: 不重复抽样:98. 03006300%808. 000808. 0300)98. 01 (98. 0)1 (nPPp%806. 0)000,603001 (30002. 098. 0)1 ()1 (NnnPPp22STAT 方差的加法定理:总方差=组间方差+平均组内方差 *所以:类型比例(等比例)抽样抽样误差的计算是将各类型组的平均组内方差代替纯随机抽样误差计算公式中的总体方差。 抽样平均数抽样平均数平均组内方差:平均组内方差:响受各组的组内方差的影类型抽样的抽样误

16、差仅产生抽样误差抽样调查内单位类不产生抽样误差全面调查体中的各类总的产生原因xnnNnNnssnNnNiiiiiiiiii22222)( (二)分层(类型)抽样形式下23STAT 抽样成数平均组内方差抽样成数平均组内方差= 1、抽样平均数抽样平均误差的计算 重复抽样:不重复抽样: 2、抽样成数抽样平均误差的计算重复抽样:)1 ()1 (2222NnnNnnnnssiixiixnppiip)1 ( NNPPppiiiii)1()1(24STAT例:某乡农户月平均收入抽样调查资料如下:)1 ()1 (Nnnppiip类 别 户 数 ( 户 ) 抽 取5% 作 样 本 ( 户 ) 样 本 平 均 数 组 内 标 准 差 组 内 方 差 种 粮 食 为 主 2500 125 366 45 62 2081 18 种 经 济 作 物 为 主 1500 75 433 41 43 1716 44 合 计 4000 (N) 200 (n) 391 12 x)(元si)(2元si不重复抽样试计算该乡农户月平均收入的抽样平均误差。25STAT )(118. 32004 .19444 .19447512575

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 中学教育 > 中考

copyright@ 2008-2023 yzwku网站版权所有

经营许可证编号:宁ICP备2022001189号-2

本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!