《第7章抽样推断.ppt》由会员分享,可在线阅读,更多相关《第7章抽样推断.ppt(76页珍藏版)》请在优知文库上搜索。
1、1第第 章章 抽样推断抽样推断2 学习目的与要求:学习目的与要求:抽样推断是统计研究中的一种重要分析方法。抽样推断是统计研究中的一种重要分析方法。学习本章要求掌握能利用统计资料来推断总学习本章要求掌握能利用统计资料来推断总体数量特征的原理及方法,其具体要求体数量特征的原理及方法,其具体要求:理解抽样推断的概念及特点理解抽样推断的概念及特点 深刻理解抽样误差产生的原因深刻理解抽样误差产生的原因 对抽样误差、抽样平均误差、抽样极限误差加以对抽样误差、抽样平均误差、抽样极限误差加以区别区别 重点掌握简单随机抽样组织形式的区间估计方法重点掌握简单随机抽样组织形式的区间估计方法 掌握必要样本单位数的确定
2、方法掌握必要样本单位数的确定方法3第七章第七章 抽样推断抽样推断 第一节第一节 抽样推断的一般问题抽样推断的一般问题 第二节第二节 抽样误差抽样误差 第三节第三节 抽样估计的方法抽样估计的方法 第四节第四节 抽样的组织方式抽样的组织方式 第五节第五节 必要抽样单位数的确定必要抽样单位数的确定 4第一节第一节 抽样推断的一般问题抽样推断的一般问题一、抽样推断的意义一、抽样推断的意义抽样推断是按照随机原则,从全部研抽样推断是按照随机原则,从全部研究总体中抽取一部分单位进行调查,究总体中抽取一部分单位进行调查,并依据所获得的数据对总体的某一数并依据所获得的数据对总体的某一数量特征做出具有一定可靠程度
3、的估计量特征做出具有一定可靠程度的估计与推断的一种统计方法。抽样推断的与推断的一种统计方法。抽样推断的全过程,就是抽样调查。全过程,就是抽样调查。5抽样推断基本特点抽样推断基本特点 按照随机原则按照随机原则抽取样本单位抽取样本单位 抽样调查的目的抽样调查的目的在于推断总体在于推断总体 抽样误差可以事先抽样误差可以事先计算并加以控制计算并加以控制 6二、抽样调查的作用二、抽样调查的作用(一)应用抽样法可对某些不可能或不容易进行全(一)应用抽样法可对某些不可能或不容易进行全面调查而又要了解其全面情况的社会经济现象进面调查而又要了解其全面情况的社会经济现象进行数量方面的统计分析。行数量方面的统计分析
4、。对无限总体不可能进行全面调查。对无限总体不可能进行全面调查。有些现象总体范围过大,单位分布又过于分散,很难有些现象总体范围过大,单位分布又过于分散,很难或不必要进行全面调查。或不必要进行全面调查。对于产品或商品具有破坏性的质量检验也不能进行全对于产品或商品具有破坏性的质量检验也不能进行全面调查。面调查。对那些资料要求紧迫,需以较短时间,迅速了解总体对那些资料要求紧迫,需以较短时间,迅速了解总体全面情况时,也可用抽样法。全面情况时,也可用抽样法。7(二)应用抽样法可对全面调查的结果加以补充或(二)应用抽样法可对全面调查的结果加以补充或订正订正 许多社会经济现象虽然可以全面调查,但同时开展抽许多
5、社会经济现象虽然可以全面调查,但同时开展抽样调查,把两者结合起来应用也具有重要的意义。样调查,把两者结合起来应用也具有重要的意义。全面调查不论是一次性普查,还是经常性统计报表制全面调查不论是一次性普查,还是经常性统计报表制度,由于范围广、工作量大,参加人员多,就较多地度,由于范围广、工作量大,参加人员多,就较多地存在发生登记性和计算性误差的可能。在全面调查后,存在发生登记性和计算性误差的可能。在全面调查后,随即抽取一部分单位重新再调查一次,将这些单位两随即抽取一部分单位重新再调查一次,将这些单位两次调查的资料进行对照、比较,计算其差错比率,并次调查的资料进行对照、比较,计算其差错比率,并以此为
6、依据对全面调查的资料加以修正,这样就可以以此为依据对全面调查的资料加以修正,这样就可以进一步提高全面调查资料的准确性。进一步提高全面调查资料的准确性。另外,由于抽样调查范围小,可以根据需要增加一些另外,由于抽样调查范围小,可以根据需要增加一些调查项目,以便进行某项更深入的研究,以补充全面调查项目,以便进行某项更深入的研究,以补充全面调查的不足。调查的不足。8(三)应用抽样法可对生产过程中产品质量进行检(三)应用抽样法可对生产过程中产品质量进行检查和控制查和控制 抽样调查不但广泛用于生产结果的核算和估计,而且抽样调查不但广泛用于生产结果的核算和估计,而且也有效地应用于对成批或大量连续生产的工业产
7、品在也有效地应用于对成批或大量连续生产的工业产品在生产过程中进行质量控制,观察生产工艺过程是否正生产过程中进行质量控制,观察生产工艺过程是否正常,是否存在某些系统性的偏误,及时提供有关信息,常,是否存在某些系统性的偏误,及时提供有关信息,分析可能的原因,便于采取措施,防止损失。分析可能的原因,便于采取措施,防止损失。(四)应用抽样法可对总体的某种假设进行检验,(四)应用抽样法可对总体的某种假设进行检验,来判断这种假设的真伪,决定行动的取舍来判断这种假设的真伪,决定行动的取舍9抽样推断的几个基本概念抽样推断的几个基本概念 全及总体和样本总体全及总体和样本总体 全及总体全及总体:抽样调查所要认识对
8、象的全体,也叫母体,简称:抽样调查所要认识对象的全体,也叫母体,简称总体,它是具有某种共同性质或特征的许多单位的集合体。总体,它是具有某种共同性质或特征的许多单位的集合体。全及总体的单位数通常用全及总体的单位数通常用N来表示,来表示,N总是很大的数。总是很大的数。样本总体样本总体:又叫子样或抽样总体,简称样本。它是从全及总:又叫子样或抽样总体,简称样本。它是从全及总体中随机抽取出来,代表全及总体的那部分单位的集合体。体中随机抽取出来,代表全及总体的那部分单位的集合体。样本总体的单位数称为样本容量,通常用样本总体的单位数称为样本容量,通常用n表示,相对表示,相对N来说,来说,n是很小的数,它可以
9、是是很小的数,它可以是N的几十分之一、几百分之一、几千的几十分之一、几百分之一、几千分之一、几万分之一。(一般来说,样本单位数达到或超过分之一、几万分之一。(一般来说,样本单位数达到或超过30个称为大样本,而在个称为大样本,而在30个以下称为小样本。社会经济现象个以下称为小样本。社会经济现象的抽样调查多取大样本的抽样调查多取大样本)10 全及指标和抽样指标全及指标和抽样指标 全及指标全及指标:根据全及总体各个单位的标志值或标:根据全及总体各个单位的标志值或标志特征计算的,反映总体某种数量特征的综合指志特征计算的,反映总体某种数量特征的综合指标称为全及指标。也叫总体指标或母体参数。由标称为全及指
10、标。也叫总体指标或母体参数。由于全及总体是唯一确定的,所以根据全及总体计于全及总体是唯一确定的,所以根据全及总体计算的全及指标也是唯一确定的。算的全及指标也是唯一确定的。抽样指标抽样指标:由样本总体各单位标志值或标志特征:由样本总体各单位标志值或标志特征计算的,反映样本数量特征的综合指标,它是用计算的,反映样本数量特征的综合指标,它是用来估计全及指标的。来估计全及指标的。11全及指标和样本指标的相关公式全及指标和样本指标的相关公式 FXFXNXXFFXXNXX22)()(FFXXNXX2222)()(fxfxnxx22()1()1xxsnxxfsf2222()1()1xxsnxxfsf变量总体
11、变量总体总体平均数总体标准差 总体方差全及指标 样本指标 12全及指标和样本指标的相关公式全及指标和样本指标的相关公式属性总体属性总体总体成数总体成数标准差 总体成数方差全及指标 样本指标 PXNNP1)1(PPP)1(2PPPpxnnp1)1(ppsp)1(2ppsp13四、抽样方法四、抽样方法重复抽样重复抽样也称重置抽样、回置抽样。它是指从总体也称重置抽样、回置抽样。它是指从总体N个单位中随机抽取个单位中随机抽取容量为容量为n的样本时,每次从总体中抽取一个单位,把结果登记的样本时,每次从总体中抽取一个单位,把结果登记下来后,重新返回,再从全及总体中抽取下一个样本单位。下来后,重新返回,再从
12、全及总体中抽取下一个样本单位。在这种抽样方式中,同一单位可能有多次被重复抽取的机会。在这种抽样方式中,同一单位可能有多次被重复抽取的机会。例如例如不重复抽样不重复抽样也称不重置抽样、不回置抽样。它是指从总体也称不重置抽样、不回置抽样。它是指从总体N个单位中随机个单位中随机抽取容量为抽取容量为n的样本时,每次从总体中抽取一个单位,不再放的样本时,每次从总体中抽取一个单位,不再放回去,下一次则从剩下的总体单位中继续进行抽取,如此反回去,下一次则从剩下的总体单位中继续进行抽取,如此反复构成一个样本,就是说,每个总体单位只能被抽取一次,复构成一个样本,就是说,每个总体单位只能被抽取一次,所以从总体中每
13、抽取一次,总体就少一个单位,因此,先后所以从总体中每抽取一次,总体就少一个单位,因此,先后抽出来的各个单位被抽中机会是不相等的。抽出来的各个单位被抽中机会是不相等的。例如例如14重复抽样重复抽样总体有总体有A、B、C、D四个单位,要从中随四个单位,要从中随机抽取两个单位构成样本。可先从机抽取两个单位构成样本。可先从4个单个单位中取一个,结果登记后放回,然后再从位中取一个,结果登记后放回,然后再从相同的相同的4个中取一个,就构成一个样本。个中取一个,就构成一个样本。全部可能抽取的样本数目为全部可能抽取的样本数目为44=16个。个。它们是:它们是:AA,AB,AC,AD,BA,BB,BC,BD,C
14、A,CB,CC,CD,DA,DB,DC,DD。一般地说,从总体一般地说,从总体N个单位中,随机抽取个单位中,随机抽取n个单位构成样本,则样本可能数目为个单位构成样本,则样本可能数目为 个。个。nN15不重复抽样不重复抽样前例中,用不重复抽样的方法从中抽两个单位构前例中,用不重复抽样的方法从中抽两个单位构成样本,则全部可能抽取得样本共有成样本,则全部可能抽取得样本共有43=12个,个,它们是:它们是:AB,AC,AD,BA,BC,BD,CA,CB,CD,DA,DB,DC。一般地讲,从总体一般地讲,从总体N个单位中,随机不重复抽取个单位中,随机不重复抽取n个单位构成一样本,则样本可能数目为个单位构
15、成一样本,则样本可能数目为N(N1)(N2)(Nn+1)个。个。由上可知,在相同的样本容量的要求下,不重复由上可知,在相同的样本容量的要求下,不重复抽样的样本可能数目比重复抽样为少。在实际工抽样的样本可能数目比重复抽样为少。在实际工作中,一般多采用不重复抽样,但有些调查如公作中,一般多采用不重复抽样,但有些调查如公交车辆乘客情况的调查,商场顾客流量情况的调交车辆乘客情况的调查,商场顾客流量情况的调查只宜用重复抽样。查只宜用重复抽样。16第二节第二节 抽样误差抽样误差一、抽样误差的概念和影响抽样误差一、抽样误差的概念和影响抽样误差的主要因素的主要因素(一)抽样误差的概念(一)抽样误差的概念抽样误
16、差是指样本指标与总体指标之抽样误差是指样本指标与总体指标之间的离差。具体地讲,就是样本平均间的离差。具体地讲,就是样本平均数与总体平均数的离差(即数与总体平均数的离差(即 ),),或样本成数与总体成数的离差或样本成数与总体成数的离差(即(即 )Xx Pp 17 在抽样中误差的来源有许多方面。在抽样中误差的来源有许多方面。其中一类是登记性误差,即在调查过程中其中一类是登记性误差,即在调查过程中由于观察、测量、登记、计算上的差错所由于观察、测量、登记、计算上的差错所引起的误差,这类误差是所有统计调查都引起的误差,这类误差是所有统计调查都可能发生的。可能发生的。另一类是代表性误差,即样本各单位的结另一类是代表性误差,即样本各单位的结构不足以代表总体而引起的误差。构不足以代表总体而引起的误差。18 代表性误差的发生有以下两种情况:代表性误差的发生有以下两种情况:一种是由于违反抽样调查的随机原则,如有意地一种是由于违反抽样调查的随机原则,如有意地多选较好的单位或较坏的单位进行调查。这样做,多选较好的单位或较坏的单位进行调查。这样做,所据以计算的抽样指标必然出现偏高或偏低现象,所据以计算的抽样指标