《MS02用样本估计总体.docx》由会员分享,可在线阅读,更多相关《MS02用样本估计总体.docx(5页珍藏版)》请在优知文库上搜索。
1、用样本估计总体一、作频率分布直方图的步骤1 .求极差(即一组数据中最大值与最小值的差).2 .确定组距与组数.3 .将数据分组.4 .列频率分布表.5 .画频率分布直方图.二、频率分布折线图和总体密度曲线1 .频率分布折线图:连接频率分布直方图中各小长方形上端的空点,就得频率分布折线图.2 .总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,即总体密度曲线.三、样本的数字特征数字特征定义众数在一组数据中,出现次数谩组的数据叫做这组数据的众数.中位数将组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数
2、据的中位数.在频率分布直方图中,中位数左边和右边的直方图的面积应该粗笠.平均数样本数据的算术平均数.即I=J(X+怎)方差s2=(XXl)2(XX2)2+(X&)2.其中S为标准差.四、茎叶图茎叶图的优点是可以保留原始数据,而且可以随时记录,方便记录与表示.例1,一个容量为32的样本,已知某组样本的频率为0.375,则该组样本的频数为()A.4B.8C.12D.16解:频数=32X0.375=12.例2:某部门计划对某路段进行限速,为调查限速60km/h是否合理,对通过该路段的300辆汽车的车速进行检测,将所得数据按40,50),50,60),60,70),70,80分组,绘制成如图所示的频率
3、分布直方图.则这A.75辆B.120辆C.180辆D.270辆解:据直方图可得300辆中车速低于限速的汽车所占的频率为10X0.025+10X0.035=0.6,故其频数为300X0.6=180.例3:某同学进入高三后,4次月考的数学成绩的茎叶图如图.则该同学数学成绩的方差是()A.125B.55C.45D.35解:由茎叶图知平均值为I+126:28+132=25,A?=1(125-114)2+(125-126)2+(125-128)2+(125-132)2=45.例4:一个容量为20的样本数据,分组后,组别与频数如下:组别(10,20(20,301(30,40(40,50(50,60频数23
4、456则样本在Q0,50上的频率为例5:甲、乙两人比赛射击,两人所得的平均环数相同,其中甲所得环数的方差为5.乙所得环数如下:5、6、9、10、5,那么这两人中成绩较稳定的是.解:y&=/(5-7)2+(67)2+(97)2+(107)2+(57)2=4.4,Ts甲2$乙2,,乙的成绩较稳定.1 .在频率分布直方图中,中位数左边和右边的直方图的面积相等,由此可以估计中位数的值,而平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和,众数是最高的矩形的中点的横坐标.2 .对标准差与方差的理解:标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散
5、程度越大,标准差、方差越小,数据的离散程度越小,因为方差与原始数据的单位不同,且平方后可能夸大了偏差的程度,所以虽然方差与标准差在刻画样本数据的分散程度上是一样的,但在解决实际问题时,一般多采用标准差.例6:有一个容量为200的样本,其频率分布直方图如图所示.根据样本的频率分布直方图估计,样本数据落在区间10,12)内的频数为()A.18B.36C.54D.72解:由直方图得样本数据在10,12)内的频率为0.18.则样本数据在区间10,12)内的频数为36.本例条件不变,问:(1)样本数据的众数约为多少?(2)样本数据的平均数是多少?解:(1)众数应为最高矩形的中点对应的横坐标,故应为9.(
6、2)平均数为3X0.02X2+5X0.05X2+7X0.15X2+9X0.19X2+0.09X11X2=8.12.例Z为了了解某校今年准备报考飞行员的学生的体重情况,将所得的数据整理后,画出了频率分布直方图(如图),已知图中从左到右的前3个小组的频率之比为1:2:3,第2小组的频数为12,则报考飞行员的学生人数是.解:据图可得第四组及第五组的频率之和为5(0.013+0.037)=0.25,故前3个小组的频率之和为1-0.2521?=0.75,即第2小组的频率为0.75x5=0.25,又其频数为12,故样本容量为株=48.例8:某初一年级有500名同学,将他们的身高(单位:Cm)数据绘制成频率
7、分布直方图(如图),若要从身高在120,130),130,140),140,150三组内的学生中,用分层抽样的方法选取30人参加一项活动,则从身高在130,140)内的学生中选取的人数应为.解:如图所示,由频率分布直方图可得,频率之和为10(0.035+67+0.020+0.0100.005)=l,解得U=O.030,由此可得身高在120,130),130,140),140,150)的频率分别为100.030=0.3J00.020=0.2,100.010=0.1,由此可得此三组的人数分别为150,100,50,共300人,要从中抽取30人,则每一个个体被抽入样的概率为:=白,其中身高在130,
8、140)内的学生中选取的JvvIv人数为IooX=10.频率分布直方图反映了样本的频率分布(1)在频率分布直方图中纵坐标表示髓,频率=组距X标.(2)频率分布表中频率的和为1,故频率分布直方图中各长方形的面积和为1.(3)用样本的频率分布可以估计相应总体的频率分布.例%以三叶图记录了甲、乙两组各四名同学的植树棵数.乙组记录中有一个数据模糊,无法确认,在图中以X表示.甲组乙组990X891110(1)如果X=8,求乙组同学植树棵数的平均数和方差;(2)如果X=9,分别从甲、乙两组中随机选取一名同学,求这两名同学的植树总棵数为19的概率.(注:方8+ 8+9+10 35X =4 =不差$2=(即-
9、X)2(2-X)2+.(xh-X)2,其中X为Xi,闷,X的平均数)解(1)当X=8时,由茎叶图可知,乙组同学的植树棵数是:8,8,9,10,所以平均数为:13S35353sll方差为:$2=不(Ai,Ba),(A,B3),(Ai,B4),(A2,B),(A2,B2)(AaB3),(A2,B”,(A3,Bi),(A3,B2),(A3,B3),(A3,B4),(A4,Bi),(A4,B2),(A4,B3),(A4,B4),5313682454793263781I57甲乙418 0 22 9 1用C表示“选出的两名同学的植树总棵数为19”这一事件,则C中的结果有4个,它们41是:(4,B4),(A
10、2,&),(4,B2),(A4fBi).故所求概率为P(C)=而=不例10:如图是某赛季甲、乙两名篮球运动员每场比赛得分的茎叶图,则甲、乙两人比赛得分的中位数之和是.解:甲比赛得分的中位数为28,乙比赛得分的中位数为36,所以甲、乙两人比赛得分的中位数之和为28+36=64.例11:甲、乙两个体能康夏训练小组各有10名组员,经过一段时间训练后,某项体能.组.测试结果的茎叶图如图所示,则这两个小组中体能测试平均成绩较高的是.解:由茎叶图所给数据依次确定两组体能测试的平均成绩分别为63+65+66+71+77+77+79+81+84+92XH1TTi=75.5,58+68+69+74+75+78+
11、79+80+82+91山W口EX乙=m=75.4,故平均成绩较品的是甲.例11:在某次测验中,有.6位同学的平均成绩为75分.用Xn表示编号为n(n=1,2,6)的同学所得成绩,且前5位同学的成绩如下:编号n12345成绩xn7076727072(1)求第6位同学的成绩x6,及这6位同学成绩的标准差s;(2)从前5位同学中,随机地选2位同学,求恰有1位同学成绩在区间(68,75)中的概率.解:V这6位同学的平均成绩为75分,.。70+76+72+70+72+46)=75,解得抵=90.这6位同学成绩的方差s2=(70-75(76-75+(72-75)2+(70-75)2+(72-75+(90-
12、75)2=49,,标准差s=7.从前5位同学中,随机地选出2位同学的成绩有:(70,76),(70,72),(70,70),(70,72),(76,72),(76,70),(76,72),(72,70),(72,72),(70,72),共10种,恰有1位同学成绩在区间(68,75)中的有:(70,76),(76,72),4(76,70),(76,72),共4种,所求的概率为元=04即恰有1位同学成绩在区间(68,75)中的概率为0.4.例12:如图,是某篮球运动员在一个赛季的30场比赛中得分的茎叶图,则得分的中位数与众数分别为()123112 3 4 6 7 8 913 3 3 5 7 8 8
13、01 2 2 3 4 8 9A.3与3B23与3C.3与23D.23与23解:由茎叶图可得,图中数据的中位数为23,众数为23.例13,已知一组数据:6,。2,的,4,的,。6,。7构成公差为d的等差数列,且这组数据的方差等于1,则公差d等于()A.|B.C.七D.无法求解解:这组数据的平均数为I;=掌=由,又因为这组数据的方差等于1,所以TKal4)2+(。24)2+(。3。4)2+(。4-)2+(。5-改+(。68产+(。7-仙沟(32+(22+(i020+(2+(2J)2+(32.,,1=L即4乃=1,解得d=巧.质量(单位:克)数量(单位:袋)90,94)294,98)698,102)12102J06)8106,110)2例14:某种袋装产品的标准质量为每袋100克,但工人在包装过程中一般有误差,规定误差在2克以内的产品均合格.由于操作熟练,某工人在包装过程中不称重直接包装,现对其包装的产品进行随机抽查,抽查30袋产品获得的数据如下:(1)根据表格中的数据绘制产品质量的频率分布直方图;(2)估计该工人包装的产品的平均质量的估计值是多少.解:(1)频率分布直方图如下:I-10115120I频率/组距LaI1IlIO09O9498102106110(2)92+96+1OO+104+108100.27(克)