《第02讲用样本估计总体(解析版).docx》由会员分享,可在线阅读,更多相关《第02讲用样本估计总体(解析版).docx(15页珍藏版)》请在优知文库上搜索。
1、备战2024年高考解读突破强化一轮复习讲义(新高考)统计与成对数据的统计分析第02讲用样本估计总体【考试要求】1 .会用统计图表对总体进行估计,会求n个数据的第p百分位数.2 .能用数字特征估计总体集中趋势和总体离散程度.一、样本的数字特征1 .百分位数一般地,一组数据的第P百分位数是这样一个值,它使得这组数据中至少有侬的数据小于或等于这个值,且至少有(100-)的数据大于或等于这个值.画解读计算一组个数据的的第百分位数的步骤(1)按从小到大排列原始数据.(2)计算i=xp%.(3)若,不是整数而大于i的比邻整数人则第P百分位数为第/项数据;若i是整数,则第p百分位数为第i项与第i+1项数据的
2、平均数.2 .四分位数我们之前学过的中位数,相当于是第50百分位数.在实际应用中,除了中位数外,常用的分位数还有第25百分位数,第75百分位数.这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数.3 .平均数、中位数和众数(1)平均数:X=-(x+x2+.+Xn).(2)中位数:将一组数据按从小到大或从大到小的顺序排列,处在最中间的一个数据(当数据个数是奇数时)或最中间两个数据的壬均数(当数据个数是偶数时).(3)众数:一组数据中出现次数地多的数据(即频数最大值所对应的样本数据).4 .标准差和方差(I)标准差:标准差是样本数据到平均数的一种平均距离,一般用S表示.假设样本数据
3、是APW,,X表示这组数据的平均数,则标准差S=-X)2+(x2-X)2+(x-X)2.(2)方差:方差就是标准差的平方,即=_!_(芭-工)2+(达-#2+*“一)2显然,n在刻画样本数据的分散程度上,方差与标准差是一样的.在解决实际问题时,多采用标准差.l三3解读数据特征标准差、方差描述了一组数据围绕平均数波动程度的大小.标准差、方差越大,则数据的离散程度越大;标准差、方差越小,数据的离散程度越小.反之亦可由离散程度的大小推算标准差、方差的大小.二、频率分布直方图1 .频率、频数、样本容量的计算方法八频率啮常X组距=频率.样T:量=频率,霆=样本容量,样本容量X频率=频数.频率分布直方图中
4、各个小方形的面积总和等于1.2 .频率分布直方图中数字特征的计算(1)最高的小长方形底边中点的横坐标即是众数.(2)中位数左边和右边的小长方形的面积和是相等的.设中位数为X,利用不左(右)侧矩形面积之和等于0.5,即可求出”.(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和,即有I=XPl+xw+xnpll,其中X”为每个小长方形底边的中点,P“为每个小长方形的面积.画解读均数、方差的性质:如果数据2吃,王的平均数为方差为一,那么一组新数据X+b,x2+b,xn+)的平均数为一+b,方差是V.一组新数据OT1,以2,axn的平均数为
5、X,方差是气2.一组新数据+h,x2+b,axn+。的平均数为x+6方差是/s?.1.(多选)下列结论正确的是()(1)对一组数据来说,平均数和中位数总是非常接近.(2)方差与标准差具有相同的单位.(3)如果一组数中每个数减去同一个非零常数,则这组数的平均数改变,方差不变.(4)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数.【答案】CD2.为评估一种农作物的种植效果,选了n块地作试验田.这n块地的亩产量(单位:kg)分别为x,x2,,Xn,下面给出的指标中,可以用来评估这种农作物亩产量稳定程度的是()A.X,X2,Xn的平均数B. X,X2,Xn的标准差C. Xi,X2,Xn的最大
6、值D. X,X2,Xn的中位数【答案】B【解析】因为可以用极差、方差或标准差来描述数据的离散程度,所以要评估亩产量稳定程度,应该用样本数据的极差、方差或标准差.故选B.3 .若数据即,,,沏的方差为2,则数据2x,2x2,,2即的方差为()A.2B.4C.6D.8答案D解析根据方差的性质可知,数据加,X2,,X9的方差?=2,那么数据2n,2X2,,2X9的方差为22?=8.4 .某射击运动员7次的训练成绩分别为86,88,90,89,88,87,85,则这7次成绩的第80百分位数为()答案B解析7次的训练成绩从小到大排列为85,86,87,88,88,89,90,780%=5.6,所以第80
7、百分位数为从小到大排列的数据中的第6个数据,即89.5 .某校体育节10名旗手的身高(单位:Cm)分别为175,178,176,180,179,175,176,179,180,179,则中位数为.答案解析把10名旗手的身高从小到大排列为175,175,176,176,178,179,179,179,180,180,178+179则一L=178.5,所以所求中位数为178.5.考点一总体百分位数的估计例1一组数据为6,47,49,15,42,41,7,39,43,40,36,则这组数据的一个四分位数是()A.15B.25C.50D.75【答案】A【解析】由小到大排列的结果:6,7,15,36,3
8、9,40,41,42,43,47,49,一共11项,由11x25%=2.75,11x50%=5.5,11x75%=8.25,故第25百分位数是15,第50百分位数是40,第75百分位数是43.故选A.(2)如图是将高三某班80名学生参加某次数学模拟考试所得的成绩(成绩均为整数)整理后画出的频率分布直方图,则此班的模拟考试成绩的80%分位数是.(结果保留两位小数)答案解析由频率分布直方图可知,分数在120分以下的学生所占的比例为(0.01+0015+0.015+O.O3)1O1OO%=7O%,分数在130分以下的学生所占的比例为(0.01+0.015+0.015+0.03+0.0225)X101
9、00%=92.5%,因此,80%分位数一定位于120,130)内.由120+,0.925-0.70)10124.44,故此班的模拟考试成绩的80%分位数约为124.44.【对点演练1(1)某中学高一年级8名学生某次考试的数学成绩(满分150分)分别为85,90,93,99,101,103,116,130,则这8名学生数学成绩的第75百分位数为()A.102B.103C.109.5D.116答案C解析这组数据已经按照由小到大的数据排列,875%=6,则这8名学生数学成绩的第75百分位数为第6个数与第7个数的平均数,即为刃116=1095【对点演练2】(2023秋贵州贵阳高三校联考阶段练习)如图,
10、是某一数据的频率分布直方图,则由图形中的数据,可知其75%分位数(上四分位数)的估计值为(保留2位小数)【详解】由题意可知,工=5x0.04=0.2,=50.1=05,所以75%分位数为4:0.7(x-15)0.06=0.75,解得:=15.83.故答案为:15.83【对点演练3】(2023秋贵州高二贵州省兴义市第八中学校联考阶段练习)今年,被称为“村超”的贵州榕江县“和美乡村足球超级联赛”,使榕江成为网络顶流,刷爆各大网络平台,更吸引了大量游客到赛事举办地观赛游玩,为更好地发展当地的旅游业,政府随机调查了18个旅游团对榕江县旅游满意度的综合评分情况,得到如下数据:,80,81,80,8283
11、,84,84,85,86,87,89,90,93,95,97,95,100.若。恰好是这组数据的上四分位数,则的值不可能为()A.93B.94C.95D.96【答案】D【详解】上四分位数即第75百分位数,由1875%=135,则将这些数据按照从小到大排列后,第14个数为上四分位数,即为18个数据从小到大排列后的第14个数,由己知去掉。后,其余数据从小到大排列为:80,80,81,82,83,84,84,85,86,87,89,90,93,95,95,97J00,其中,第13个数据为93,第14个数据为95,所以93x,发生改变.(2)(多选)如图是某班50名学生期中考试数学成绩的频率分布直方图
12、,其中成绩分组区间是40,50),50,60),60,70),70,80),80,90),90,100,则下列说法正确的是()A.图中的X的值为0.018B.该班50名学生期中考试数学成绩的众数是75C该班50名学生期中考试数学成绩的中位数是75D.该班50名学生期中考试数学成绩的平均数是75解析:AB由频率分布直方图可得10(0.0063+0.010+0.054)=1,解得x=0.018,A正确;由结论1知,数学成绩的众数是75,B正确;设中位数为小则0.22十丁FX100.054=0.5,解得aF5.2,C错误;450.06+550.06650.l750.54+850.18+950.06=74,D错误.故选A、B.【对点演练1】每年的4月23日是世界读书日,某中学为了了解八年级学生的读书情况,随机调查了50名学生读书的册数,统计数据如表所示:册数01234人数31316171则这50名学生读书册数的众数、中位数是()A.3,3B.2,2C.2,3D.3,2【答案】D【分析】利用众数,中位数的定义,即可得出答案.【详解】这组样本数据中,3出现了17次,出现的次数最多,这组数据的众数是3;