第2章描述统计学1.ppt

上传人:王** 文档编号:599867 上传时间:2023-12-08 格式:PPT 页数:40 大小:615KB
下载 相关 举报
第2章描述统计学1.ppt_第1页
第1页 / 共40页
第2章描述统计学1.ppt_第2页
第2页 / 共40页
第2章描述统计学1.ppt_第3页
第3页 / 共40页
第2章描述统计学1.ppt_第4页
第4页 / 共40页
第2章描述统计学1.ppt_第5页
第5页 / 共40页
第2章描述统计学1.ppt_第6页
第6页 / 共40页
第2章描述统计学1.ppt_第7页
第7页 / 共40页
第2章描述统计学1.ppt_第8页
第8页 / 共40页
第2章描述统计学1.ppt_第9页
第9页 / 共40页
第2章描述统计学1.ppt_第10页
第10页 / 共40页
亲,该文档总共40页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《第2章描述统计学1.ppt》由会员分享,可在线阅读,更多相关《第2章描述统计学1.ppt(40页珍藏版)》请在优知文库上搜索。

1、1课前热身:n检查第一章课后实践题的完成情况n1.关于北京卫视某档节目收视率调查的调查总体(调查对象)和个体(单位)的确定问题。n(提问23名学员回答)n2.统计表的编制(一名学员到黑板做)2第二章第二章 数据描述方法数据描述方法1:表格和图形方法:表格和图形方法 n学习目标n掌握质量数据和数量数据的概括方法。n学会用统计常用图表表现各类数据。n了解探索性数据和交叉列表的基本知识。3n案例讨论(课后进行):n1.这个案例都告诉了我们哪些信息?n2.通过阅读这个案例你受到哪些启发?4习 题1.P23-2 4.P32-182.P25-9 5.P36-22 3.P31-15 6.P41-325第一节

2、第一节 质量数据的概括质量数据的概括 n一、频数分布一、频数分布 n频数分布频数分布(Frequency distribution)是用数据概括表的形式来列示各组中每组数值出现的次数次数(频数)。n编制频数分布表的目的目的:提供更进一步了解原始数据的信息。6例2-1 从表2-1观察哪种软饮料购买的数量最多?(P21)表2-2 购买软饮料的频数分布表 软饮料 频数(次)古典可乐 19 健怡可乐 8 彭伯碳酸饮料 5 百事可乐 13 雪碧 5 合 计 507二、相对频数分布和百分比频数分布二、相对频数分布和百分比频数分布n相对频数分布相对频数分布(Relative frequency distri

3、bution)是一数据集的表格汇总法,显示在若干个组别中每一组的项目总数的相对频数,即分数或比例。n计算公式:(2.1)n每组频数每组相对频数8n百分比频数分布(Percent frequency distribution)是一数据集的表格汇总法,显示在若干无重叠组别中每一组的项目总数的百分率。n每组百分比频数是该组相对频数乘以100%n 教科书强调是相对频数乘以100,我强调乘以100%9n表2-3 购买软饮料的相对频数和百分比频数分布表 软饮料 相对频数 百分比(%)古典可乐 0.38 38 健怡可乐 0.16 36 彭伯碳酸饮料 0.10 10 百事可乐 0.26 26 雪碧 0.10

4、10 合 计 1.00 100?相对频数的计量单位是什么(x/1)相对频数是否有计量单位?10n从表2-3我们可以获得以下有用信息:n 在种软饮料中,购买次数最多的是古典可乐,占5种软饮料购买总次数的38%。购买次数最少的是彭伯碳酸饮料和雪碧,各占总购买次数的10%。n 依购买次数多少排序依次为:古典可乐、百事可乐、健怡可乐、彭伯碳酸饮料和雪碧。n 购买次数最多的前3种软饮料占全部购买次数的比重已达80%(38%+26%+16%)。11三、条形图和饼图三、条形图和饼图n 条形图条形图(Bar graph/Bar chart)是用条形的固定宽度表示变量,不同长度表示频数、相对频数或百分比频数分布

5、的一种图示方法。12图2.1 购买软饮料次数的条形图13n 饼图饼图(Pie chart)是用圆形及圆内扇形面积来表示数值大小的图形,它主要用于表示总体中各组成部分所占的比例。14n 图2.2 软饮料购买次数图15第二节第二节 数量数据的概括数量数据的概括n一、频数分布n 分组分组(Group)根据特定目的,对一组数据所进行的归类。n 利德会计师事务所提供的数据提供了该所在完成20个客户样本的年终审计所需要时间的具体数据。16 表2-4 年终审计时间(天)12 14 19 18 15 15 18 17 20 27 22 23 22 21 33 28 14 18 16 13分组的具体步骤:(1)

6、确定组数 采用斯特格斯(Sturges)提出的经验公式来确定。172loglog11010NK532.52log20log12loglog110101010NK18n(2)确定组距52.451233组数最小数最大数组距19n(3)确定组限n欧美教材处理方法:组与组之间的组限互不重叠,即每组之间的数据是断开的。n10-14,15-19,20-24,25-29,30-34n国内教材处理方法:n1 离散变量:n第一种方法:间断型组限。如:n10-14,1529,20-2420n第二种方法:重叠型组限。如:n10-15,15-20,2025,2530n对于重叠型组限,为避免重复将同一数据分配到不同组,

7、规定“上限不包括在内”。n2连续变量:n强调必须做重叠型组限。n(4)将各个数据分配到相应组中去,形成一个数量数据频数分布表。21n表2-5 审计时间数据频数分布 审计时间(天)频数(个)10 15 4 15 20 8 20 25 5 25 30 2 30 35 1 合 计 20教科书P27表26采用间断型分组,不如重叠型分组好。22n表2-5的频数分布为我们提供了以下简单信息:n 审计时间发生最频繁的是1520天这一组。在20个审计时间中属于这一组的有8个。n 只有一次审计时间需要30或更长的时间。23n二、相对频数分布和百分比频数分布n表2-6 审计时间数据的相对频数分布和百分比频数分布

8、审计时间(天)相对频数 百分比(%)10 15 0.20 20 15 20 0.40 40 20 25 0.25 25 25 30 0.10 10 30 35 0.05 5 合 计 1.00 10024n三、直方图三、直方图n 直方图直方图(Histogram)是一种通过在横轴上放置组距,在纵轴上放置频数来描述数量数据的频数分布、相对频数分布和百分比频数分布的图形。25图2.4 审计时间数据直方图 (单位:天)注意:本课件的直方图与教科书(P28)直方图的区别。26n四、累积频数分布四、累积频数分布n 累积频数分布累积频数分布(Cumulative frequency distribution

9、)对数量数据集的表格法汇总,显示数值小于或等于每组上限的项目数。或者显示数值大于或等于每组上限的项目数。27n(一)由最小数值向最大数值累积方法(显示数值小于每组上限的项目数)表2-7 审计时间数据的累积频数分布 审计时间(天)频数(个)累积频数(个)10 15 4 4 15 20 8 12 20 25 5 17 25 30 2 19 30 35 1 20 合 计 20 -28n(二)由最大数值向最大数值累积方法(显示数值大于或等于每组下限的项目数):表2-8 审计时间数据的累积频数分布 审计时间(天)频数(个)累积频数(个)10 15 4 20 15 20 8 16 20 25 5 8 25

10、 30 2 3 30 35 1 1 合 计 20 -29审计时间(天)频数(个)向上累计频数(个)向下累计频数(个)1015152020252530303548521 4 12 17 19 202016 8 3 1合计20表29 审计时间累计频数表30第三节第三节 探索性数据分析探索性数据分析n 探索性数据分析探索性数据分析(Exploratory data analysis)是用茎叶显示(Stem-and-leaf display)图形来反映概括性数据的一种统计技术。31n一、茎叶显示图的绘制方法:一、茎叶显示图的绘制方法:n第一步:把每个观察值分成茎和叶两个部分。n茎包括了除了个位数之外的

11、所有数字,叶就是个位数字。n第二步:把茎由小到大,从上往下写成一列,并且在这一列右边画一条直线。n第三步:把每片叶子写在它所属的茎的右边,并由小到大排成一行。32n例2-3 表2-10是某证券公司对应聘某一职位50人参见面试时,回答所提出的150个问题正确回答的测试结果。n表2-10 能力测试回答正确的问题数目 112 72 69 97 107 73 92 76 86 73 126 128 118 127 124 82 104 132 134 83 92 108 96 100 92 115 76 91 102 81 95 141 81 80 106 84 119 113 98 75 68 98

12、 115 106 95 100 85 94 106 11933 6 8 9 2 7 2 3 3 5 6 6 6 8 0 1 1 2 3 4 5 6 8 9 1 2 2 2 4 5 5 6 7 8 8 1110 0 0 2 4 6 6 6 7 8 911 2 3 5 5 8 9 9 712 4 6 7 8 413 2 4 214 1 1图2.5 能力测试回答正确问题数目茎叶显示图 34n二、茎叶显示图的含义二、茎叶显示图的含义n第一行:表明在回答问题正确数目在60个以上,69个及以下的人数有两个。其中一个答对了68道题,另一个答对了69道题。n第二行:表明在回答问题正确数目在70个以上,79个及

13、以下的人数有6个。他们答对题的数目分别为:72,73,73,75,76,76。n35第四节第四节 交叉分组列表和散点图交叉分组列表和散点图n一、交叉分组列表n交叉分组列表交叉分组列表(Cross tabulation)对两个数据的表格汇总。一个变量的组用行来描述,另一个变量的组用行、列来描述。36n表2-11 300家洛衫矶饭店质量等级和菜肴价格交叉分组列表 质量 等级 菜肴价格(美元)合计 1019 2029 3039 4049 好 42 40 2 0 84 很好 34 64 46 6 150 极好 2 14 28 22 66 合计 78 118 76 26 30037n二、散点图n 散点图

14、散点图(Scatter diagram)表示两个变量之间关系的图形方法。一个变量列在横轴上,另一个变量列在纵轴上。n 例2-4 美国旧金山某音响商店广告次数和销售额的数据如下:38n表2-12 立体声音响设备商店样本资料 周 次 广告次数(x)销售额(百美元)y 1 2 50 2 5 57 3 1 41 4 3 54 5 4 54 6 1 38 7 5 63 8 3 48 9 4 59 10 2 4639 图2.6 立体声音响设备商店样本资料散点图0204060800246广告次数(百美元)销售额40nQuestion?Questions and Comments are welcome THANKS Have a great Day!Have a great Day!

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 高等教育 > 统计学

copyright@ 2008-2023 yzwku网站版权所有

经营许可证编号:宁ICP备2022001189号-2

本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!