《统计学原理课件PPT.ppt》由会员分享,可在线阅读,更多相关《统计学原理课件PPT.ppt(40页珍藏版)》请在优知文库上搜索。
1、1第三章第三章 统统 计计 整整 理理 教教 学学 目目 的的 通过本章的学习,要求掌握各种不同类通过本章的学习,要求掌握各种不同类型资料的整理方法、整理原则、以及一些相型资料的整理方法、整理原则、以及一些相关的概念,并能够利用所学的方法对所给的关的概念,并能够利用所学的方法对所给的实际资料按照研究目的的要求进行整理。实际资料按照研究目的的要求进行整理。2第三章第三章 统统 计计 整整 理理 教教 学学 目目 的的 通过本章的学习,要求掌握各种不同类通过本章的学习,要求掌握各种不同类型资料的整理方法、整理原则、以及一些相型资料的整理方法、整理原则、以及一些相关的概念,并能够利用所学的方法对所给
2、的关的概念,并能够利用所学的方法对所给的实际资料按照研究目的的要求进行整理。实际资料按照研究目的的要求进行整理。3第三章第三章第三章第三章第三章第三章 统计整理统计整理统计整理统计整理统计整理统计整理 统计整理的方法和意义统计分组的含义和种类统计分组的方法统计分布和分配数列的编制统计表的结构和种类4第三章第三章第三章第三章第三章第三章 统计整理统计整理统计整理统计整理统计整理统计整理 统计调查搜集上来的资料,不论是哪一种类型的统计调查搜集上来的资料,不论是哪一种类型的资料都必须经过整理才能进一步进行分析。资料的类资料都必须经过整理才能进一步进行分析。资料的类型不同,研究的目的不同,资料整理的方
3、法也不同。型不同,研究的目的不同,资料整理的方法也不同。 统计整理是根据统计研究任务的要求,对调查所统计整理是根据统计研究任务的要求,对调查所搜集到的原始资料进行搜集到的原始资料进行分组、汇总分组、汇总,使其条理化、系使其条理化、系统化的工作过程。统化的工作过程。一、统计整理的意义和方法5 统计整理又称数据整理,根据统计研究任务的要求,对调查、搜集到的原始资料进行分组汇总使其条理化、系统化的工作过程,就是统计整理。 统计整理的意义:通过统计调查所取得的总体单位的资料,是不系统的、分散的,还只是事物的表象、事物的某一侧面或外部联系的感性材料。统计整理的任务就是对这些资料进行加工处理,借助总量指标
4、,对总体内部规律、相互联系、结构关系,作出概括性的说明。统计整理实现了从个别单位的标志值向说明总体特征的指标值的过度,使人们对社会经济现象的认识从感性认识上升到理性认识的过度阶段,为统计分析提供了基础。它在统计研究中起着承前启后的作用。6 根据某班根据某班4040名学生统计学考试成绩分名学生统计学考试成绩分析该班学生考试情况。析该班学生考试情况。57 89 49 84 86 87 75 73 72 68 57 89 49 84 86 87 75 73 72 68 75 82 97 81 67 81 54 79 87 95 75 82 97 81 67 81 54 79 87 95 76 71
5、60 90 65 76 72 70 86 76 71 60 90 65 76 72 70 86 85 89 89 64 57 83 81 78 87 85 89 89 64 57 83 81 78 87 72 61 72 61 7 按成绩等级分组按成绩等级分组 人数(人)人数(人) 各组人数占各组人数占 总人数比重(总人数比重(%) 不及格不及格 4 10.0 及及 格格 6 15.0 中中 12 30.0 良良 15 37.5 优优 3 7.5 合合 计计 40 100.08第三章第三章第三章第三章第三章第三章 统计整理统计整理统计整理统计整理统计整理统计整理 再如:通过调查取得再如:通过调
6、查取得100100个商业企业某月销个商业企业某月销售额资料:(单位:万元)售额资料:(单位:万元) 2020,6060,4545,9090,105105,5656,250250,8989,130130,3030,9898,300300。 将这些数据资料按将这些数据资料按“销售额销售额”的多少进行整的多少进行整理,得到下列整理结果:理,得到下列整理结果:9销售额(万元)销售额(万元) 企业数(个)企业数(个) 0 50 12 50 100 25 100 150 30 150 200 23 250 300 10 合合 计计 100第三章第三章第三章第三章第三章第三章 统计整理统计整理统计整理统计整
7、理统计整理统计整理统计整理的方法:统计整理的方法:分组、汇总、编表分组、汇总、编表10第三章第三章第三章第三章第三章第三章 统计整理统计整理统计整理统计整理统计整理统计整理统计分组统计分组:根据研究任务的要求和现象总体的内在特点,把统计总体按照某一标志划分为若干性质不同又有联系的几个部分。统计分组应统计分组应达到的要求达到的要求同一组内的单位性质相同,不同组所包括的单位性质有差异。二、例如:工业企业按经济类型分组,可分为以下几组: 经济类型 企业数(个) 国有企业 1000 合资企业 200 合作经营企业 300 股份制企业 500 工业企业按职工人数分组,可分为以下几组: 职工人数 企业数(
8、个) 500人以下 50 5001000 200 10001500 100 工业企业按地区分组,可分为以下几组: 地区 企业数(个)北京市 10000 天津市 8000 上海市 11000 11统计分组的特点 统计分组是在总体内进行的一种定性分类,它是把总体进一步划分为一个个性质不同的范围更小的总体。 这些被称为亚总体的组,同样具有总体的特征(只是变成小一点的总体而已),它们可以继续分组。如在进行工业企业的统计调查时,我们可以按工业企业所在的地域进行分类,一个省的为一组,每一个省的工业企业又可以按不同的市进行分组。12分组标志的选择分组标志的选择选择什么样的分组标志,就会形成什么样的分组结果,
9、选择什么样的分组标志,就会形成什么样的分组结果,因此,因此,分组标志的选择是统计分组的关键分组标志的选择是统计分组的关键。选择分组标志的一般原则必须根据统计研究的目的,在对现象进行分析的基础上,必须根据统计研究的目的,在对现象进行分析的基础上,抓住具有本质性的区别及反映现象内在联系的标志来抓住具有本质性的区别及反映现象内在联系的标志来作为分组标志。(作为分组标志。(P54P54)统计分组必须遵循两个原则:统计分组必须遵循两个原则:穷尽原则和互斥原则穷尽原则和互斥原则 即不重复不遗漏即不重复不遗漏如我们在进行城乡青少年接受教育水平的比较分析,应按如我们在进行城乡青少年接受教育水平的比较分析,应按
10、城乡进行分组,如果按年龄进行分组或按性别进行分组就城乡进行分组,如果按年龄进行分组或按性别进行分组就不能到达研究分析的目的。不能到达研究分析的目的。13统统计计分分组组的的种种类类 按研究任务和作用不同 按分组标志的多少不同 按分组标志的性质不同类型分组结构分组分析分组简单分组复合分组品质分组(按品质标志进行分组)变量分组(按数量标志进行分组)通常认为总体按品质标志分组属于类型分组,按数量标志分组属于结构分组仅按一个标志来进行分组称为简单分组;按两个或两个以上的标志进行分组并且层叠在一起称为复合分组14 分析分组:为了研究总体的各标志之间的依存关系而进行的分组。即为了研究某个标志表现和另一个标
11、志表现之间有何关系而进行的分组,如要研究在东莞打工的外来劳动者的工资报酬是否与他们的学历有关,则把他们按学历进行分组来进行研究。 分析分组的分组标志称为原因标志,与原因标志相对应的叫结果标志。如上例中学历是原因标志,报酬是结果标志。15第三章第三章第三章第三章第三章第三章 统计整理统计整理统计整理统计整理统计整理统计整理品质品质分组分组方法方法变量变量分组分组方法方法以一个变量值代表一组。如:人口按年龄分组1岁一组,学生按报考科目分组等。这种分组适用于离散性变量,且变量值的个数较少的情况。如对家庭构成情况进行分析时,可按家庭人数进行分组 以变量值变动的一个区间作为一组,区间的距离称为组距。适用
12、于连续型变量和离散型变量的变量值较多的情况。如学生成绩、工厂职工数按品质标志对资料进行分组。这种分组有些比较简单,有些非常复杂,复杂的品质分组称为分类。一般的情况下该品质标志的标志表现有多少就分成多少组,或按统一规定的分组标准进行分组如:人口按性别分组、按职业分组、企业按经济类型分组等。单项式分 组组距式分 组三、统计分组方法16第三章第三章第三章第三章第三章第三章 统计整理统计整理统计整理统计整理统计整理统计整理 等等 距距 分分 组组各组组距均相等。如: 1020 2030 3040以上各组组距均为10。这种分组适用于均匀分布的总体。 不等距不等距 分分 组组各组组距不一定相等。如: 10
13、20 2050 5060 6070 以上分组中,其中第二组与其它各组的组距不同。这种分组适用于资料分布离差较大或者是为了满足特殊的研究目的的需要。按组距式分组会使资料的真实性受到一些损害17组距的计算对于重叠组距式分组,可以用 组距=上限下限 进行计算如成绩分组中,6070分、70 80分、80 90分,其组距就是10分。对于间断式分组,使用的公式为 组距=本组上限前组上限 =本组下限上组下限如商店按职工规模分组分为:1 5人、6 10人11 15人,则组距为105=5而不是4。18 组限组限(p57)组限就是每一组两端的数值。 10 20 20 30 30 40下限上限 确定组限的方法有两种
14、:间断式确定组限和重叠式确定组限。职工人数(人) 99以下 100199 200299 300399固定资产额(万元) 5060 6070 7080 8090间断式确定组限适用于离散变量(分组时要注意满足不重不漏原则,上、下限都要包含在内,有特殊说明的除外)重叠式确定组限适用于连续变量上面的60、70、80归于哪一组呢?P57一般把此值归并到作为下限的那一组19 例:某地区对企业按工人人数的多少进行分未两组,下列五种分组方法中正确的是( ) A. 300人以下 300500人 B. 300人以下 300500人(不含300) C. 300人以下 301500人 D. 300人以下 310500
15、人 E. 300人以下 300499人注意区分重叠式组限和间断式组限的不同之处,分组时应该做到不重复不遗漏20第三章第三章第三章第三章第三章第三章 统计整理统计整理统计整理统计整理统计整理统计整理组中值组中值每组上限与下限之间的中点数值,是各组的每组上限与下限之间的中点数值,是各组的假定平均数。假定平均数。组中值组中值 = = (上限值(上限值+ +下限值)下限值)2 2开口组组中值的计算:开口组组中值的计算:缺下限:组中值缺下限:组中值= =本组上限本组上限 相邻组组距相邻组组距/2/2缺上限:组中值缺上限:组中值= =本组下限本组下限+ + 相邻组组距相邻组组距/2/2例如例如产值(万元)
16、产值(万元)5050以下以下50 6050 6060 7060 707070以上以上第一组组中值:第一组组中值:5050(10102 2)= 45= 45最后一组组中值:最后一组组中值:70+70+(10102 2)= 75= 7521第三章第三章第三章第三章第三章第三章 统计整理统计整理统计整理统计整理统计整理统计整理(一)统 计 分 布 统计分布又称分配数列统计分布又称分配数列。它是把总体的所有单位按组归并排列后形成总体中各个单位在各组间的分布。这里的单位有个、次的含义,所以分配数列又称此书发布。它由两部分组成:它由两部分组成: 总体所分的各个组和各组所拥有的单位数(次数或频数)。四、统计分布和分配数列的编制22第三章第三章第三章第三章第三章第三章 统计整理统计整理统计整理统计整理统计整理统计整理工资分组工资分组 职工人数(人)职工人数(人) 各组人数所占比重各组人数所占比重 (元)(元) (次数或频数)(次数或频数) (%) (频率)(频率)500600 100 25600700 200 50700800 100 25 合合 计计 400 100频率:各组的频率大于频率:各组的频