《统计学知识架构.ppt》由会员分享,可在线阅读,更多相关《统计学知识架构.ppt(18页珍藏版)》请在优知文库上搜索。
1、统计学知识构架统计学知识构架拿到一个数据:从以下几个方面判断数据类型,增强对数据的认知拿到一个数据:从以下几个方面判断数据类型,增强对数据的认知第一个方面:判断数据可用性第一个方面:判断数据可用性试验数据:准确度非常高,可以直接应用试验数据:准确度非常高,可以直接应用观察数据:谨慎使用结论,必须注意其关联性观察数据:谨慎使用结论,必须注意其关联性调查数据:必须关注该样本数据能否代表总体调查数据:必须关注该样本数据能否代表总体第二个方面:判断统计方法和步骤第二个方面:判断统计方法和步骤个体数据:验证可用性(数据的审核、筛选)个体数据:验证可用性(数据的审核、筛选)样本数据:需要描述统计和推断统计
2、样本数据:需要描述统计和推断统计总体数据:只需描述统计总体数据:只需描述统计统计学探索现象数量规律性的过程:统计学探索现象数量规律性的过程:反映客观现象的反映客观现象的数据数据样本数据样本数据描述统计描述统计概率论概率论推断统计推断统计总体数据总体数据总体内在的总体内在的数量规律性数量规律性定类数据定类数据定序数据定序数据数值型数据数值型数据审核审核筛选筛选排序排序数据整理数据整理数据显示数据显示数据度量数据度量描述统计描述统计数据整理数据整理表表数据显示数据显示图图定类数据定类数据频数分布表频数分布表条形图、饼图、环形图条形图、饼图、环形图定序数据定序数据频数分布表频数分布表+ +累积数累积
3、数(向上累积、向下累积)(向上累积、向下累积)累计分布图、环形图累计分布图、环形图数值型数据数值型数据分组后绘制频数分布表分组后绘制频数分布表直方图、折线图、茎叶直方图、折线图、茎叶图、箱线图、时间序列图、箱线图、时间序列图、雷达图图、雷达图集中趋势集中趋势离散程度离散程度分布形状分布形状定类数据定类数据众数众数异众比率异众比率偏态系数偏态系数峰态系数峰态系数定序数据定序数据众数、众数、中位数、中位数、四分位数四分位数四分位差四分位差数值型数据数值型数据众数、中位数、众数、中位数、平均数平均数方差、标准差、方差、标准差、离散系数、(平离散系数、(平均差、极差)均差、极差)数据度量数据度量推断统
4、计推断统计抽样分布抽样分布参数估计参数估计假设检验假设检验随机变量随机变量X X的概率分布的概率分布离散型随机变量离散型随机变量二项分布二项分布泊松分布泊松分布超几何分布超几何分布均匀分布均匀分布p0.25p0.25,n20n20,np5np5时时X X近似服从近似服从Pois(np)Pois(np)连续型随机变量连续型随机变量均匀分布均匀分布指数分布指数分布正态分布正态分布标准正态分布标准正态分布n n很大,很大,0 0p p1 1为定值时,为定值时,X X近似服从近似服从N(np,np(1-p)N(np,np(1-p)抽样分布抽样分布选择样本容量为选择样本容量为n n时所有可能抽取时所有可
5、能抽取的样本组合的样本组合计算统计量计算统计量得到样本统计量得到样本统计量服从的分布服从的分布画出统计量画出统计量的分布图的分布图抽样方式抽样方式统计量计算公式统计量计算公式四大重要分布四大重要分布不放回抽样是误不放回抽样是误差最大的抽样方差最大的抽样方式,其他的抽样式,其他的抽样都可以减小标准都可以减小标准误差误差正态分布正态分布t t分布分布F F分布分布卡方分布卡方分布样本均值样本均值样本方差样本方差样本变异系数样本变异系数样本样本k k阶距阶距样本样本k k阶中心距阶中心距样本偏度样本偏度样本峰度样本峰度常用统计量常用统计量四大重要分布四大重要分布样本统计量的分布样本统计量的分布参数估计参数估计假设检验假设检验估计总体参数估计总体参数判断对总体参数判断对总体参数的假设是否成立的假设是否成立参数估计参数估计假设检验假设检验以不放回随机抽样的总体均值的假设检验为例以不放回随机抽样的总体均值的假设检验为例谢谢谢谢