《大题04 统计与统计案例(解析版).docx》由会员分享,可在线阅读,更多相关《大题04 统计与统计案例(解析版).docx(21页珍藏版)》请在优知文库上搜索。
1、大题04统计与统计案例王囿叵Hl高考对本讲内容的考查往往以实际问题为背景,考查随机抽样与用样本估计总体、经验回归方程的求解与运用、独立性检验问题,常与概率综合考查,中等难度.荔荔71用样本估计总体(2023北京门头沟一模)已知某种业公司培育了新品种的软籽石榴,从收获的果实中随机抽取了50个软籽石榴,按质量(单位:g)将它们分成5组:360,380),380,400),400,420),420,440),440,460得到如下频率分布直方图.(1)用样本估计总体,求该品种石榴的平均质量;(同一组中的数据用该组区间的中点值作代表)按分层随机抽样,在样本中,从质量在区间380,400),400,42
2、0),420,440)内的石榴中抽取7个石榴进行检测,再从中抽取3个石榴作进一步检测.(0)已知抽取的3个石榴不完全来自同一区间,求这3个石榴恰好来自不同区间的概率;(0)记这3个石榴中质量在区间420,440)内的个数为X,求X的分布列与数学期望.【解】(1)该品种石榴的平均质量为i=20x370x0.005+(390+410+450)x0.010+430x0.0151=416,所以该品种石榴的平均质量为416g.(2)由题可知,这7个石榴中,质量在380,400),400,420),420,440)上的频率比为0.010:0.010:0.015=2:2:3,所以抽取质量在380,400),
3、400,420),420,440)上的石榴个数分别为2,2,3.(0)记A=抽取的3个石榴不完全来自同一区间”,8=“这3个石榴恰好来自不同区间”,则P(八)=k=有_CeC;=12C352-5-4-51-3-3-3-67即这3个石榴恰好来自不同区间的概率为卷.(0)由题意X的所有可能取值为0,1,2,3,WIHX=O)=盘,尸(X=I)=等=,C1C2I?C31p(X=2)=岩=最P(=3)亳=M所以X的分布列为解注赛导1 .频率分布直方图中相邻两横坐标之差表示组距,纵坐标表示藉,频率=组距X罐.2 .在频率分布直方图中各小长方形的面积之和为1.3 .利用频率分布直方图求众数、中位数与平均数
4、.最高的小长方形底边中点的横坐标即众数.中位数左边和右边的小长方形的面积和相等.平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.4平均数与方差都是重要的数字特征,是对数据的一种简明描述,它们所反映的情况有着重要的实际意义.5.易混清频率分布条形图和频率分布直方图,误把频率分布直方图纵轴的几何意义当成频率,导致样本数据的频率求错.44变式(2023北京大兴三模)某空调企业为了解产品售后服务情况,给用户发放一份调查问卷,满分为100分.现从回收的问答卷中随机抽取100份作为样本.得到如下频率分布直方图.从样本中得分在(8(),I(X)的问卷
5、中,按分层抽样抽取8份,再从中随机抽取3份,记这3份问卷中得分在(90,100的份数为X,求X的分布列及数学期望.【解】(DS10(0.001+0.013+0.031+0.028+0.015+0.005)=1,解得=0.007因为0.01+0.07+0.130.5,所以中位数在60分到70分之间,设中位数为X,贝!10.01+0.07+0.13+0.31x=0.5,解得X念69.4.所以a=0007,样本的中位数约为69.4分.(2)根据分层抽样的意义,可知所抽取的8份答题卷中,得分在(80,90的有8Ool50.015+0.005=6份,得分在(90,1(叫的有8竺生一、J0.015+0.0
6、05=2份,所以X的所有可能取值为。,1,2,则P(X=O)=寻=5,P(X=I)=等=,*=2)=等q,所以X的分布列为X0P5121528351533所以X的数学期望E(X)=OXQl*+2亮=关椅IqZoZoZoH-后”模拟1. (2021北京顺义二模)某自行车厂为了解决复合材料制成的自行车车架应力不断变化问题,在不同条件下研究结构纤维按不同方向及角度黏合强度,在两条生产线上同时进行工艺比较实验,为了比较某项指标的对比情况,随机地抽取了部分甲生产线上产品该项指标的值,并计算得到其平均数5=74,中位数.t=72,随机地抽得乙生产线上100件产品该项指标的值,并绘制成如下的频率分布直方图.
7、频率(1)求乙生产线的产品指标值的平均数与中位数(每组值用中间值代替,结果精确到0.01),并判断乙生产线较甲生产线的产品指标值是否更好(如果l5-yK亍-则认为乙生产线的产品指标值较甲生产线的产品指标值更好,否则不认为更好).用频率估计概率,现从乙生产线上随机抽取5件产品,抽出指标值不小于70的产品个数用X表示,求X的数学期望与方差.【解】(1)y=10(550.01+650.02+750.034+850.026+950.01)=75.60,因为(0.01+0.02)10=0.30.5,所以中位数在区间70,80)上,贝(0.01+0.02)xl0+0.034(y-70)=0.5,解得y75
8、.88,即中位数=75.88,因为I=0.28V-所以乙生产线较甲生产线的产品指标值更好;7(2)指标值不小于70的概率为(0.034+0.026+0.01)x10=,由题意可得X所以E(X)=5*=(X)fS卷.2. (2023河北开滦第二中学模拟)高中数学试卷满分是150分,其中成绩在130,150内的属于优秀.某数学老师为研究某次高三联考本校学生的数学成绩,随机抽取了200位学生的数学成绩(均在90,150内)作为样本,并整理得到如下频率分布直方图.频率根据频率分布直方图,求样本的中位数,并估计本次高三联考该校学生的数学成绩的优秀率;(结果保留两位小数)从样本数学成绩在120,130),
9、130,140)的两组学生中,用分层抽样的方法抽取5名学生,再从这5名学生中随机选出2人,求这2人来自两组的概率.【解】(1)由频率分布直方图可知(2x+0.012+0.018+0.022+0.028)l0=l,解得X=O.010,样本中数学成绩在90,100)内的频率Pi=00t在100,110)内的频率玛=0.22,在110,120)内的频率为G=0.28,同R+6=0.320.5,团样本的中位数落在11(),120)内,设样本的中位数为?,贝!)0.5-0.32=。-IlO)XO.028,解得z116.43,故样本的中位数为116.43分.由样本估计总体,得本次高三联考该校学生的数学成绩
10、的优秀率约为(012+0.10)x100%=22%;(2)由频率分布直方图可知,按分层抽样的方法,抽取5名学生中成绩在120,130)内的有3名,分别记为A,B,C,在130,140)内的有2名,分别记为D,E,则从5人中抽取2人的所有抽取情况有AB,AC,AD,AE,BC,BD,BE,CD,CE,DE,共10种,其中2人来自两组的有AD,AE,BD,BE,CD,CE,共6种,故所求概率P=K=I3所以这2人来自两组的概率为:(2022新高考11)在某地区进行流行病学调查,随机调查了100位某种疾病患者的年龄,得到如下的样本数据的频率分布直方图:(1)估计该地区这种疾病患者的平均年龄(同一组中
11、的数据用该组区间的中点值为代表);(2)估计该地区一位这种疾病患者的年龄位于区间20,70)的概率;(3)已知该地区这种疾病患者的患病率为0.1%,该地区年龄位于区间40,50)的人口占该地区总人口的16%,从该地区中任选一人,若此人的年龄位于区间40,50),求此人患这种疾病的概率(以样本数据中患者的年龄位于各区间的频率作为患者的年龄位于该区间的概率,精确到0.0001).频率/组距0.0230.0200.017010203040506070【解析】(I)由频率分布直方图得该地区这种疾病患者的平均年龄为:X=50.00lX0+150.00210250.012l0+350.01710+450.
12、023l0+550.02010+650.0l710+750.00610850.00210=47.9r(2)该地区一位这种疾病患者的年龄位于区间20,70)的频率为:(0.012+0.017+0.023+0.020+0.017)10=0.89,.估计该地区一位这种疾病患者的年龄位于区间20,70)的概率为0.89.(3)设从该地区中任选一人,此人的年龄位于区间40,50)为事件8,此人患这种疾病为事件C,则P(CB)=P(BC)0.1%0.023X10jU0大题典例2回归分析我国风云系列卫星可以监测气象和国土资源情况.某地区水文研究人员为了了解汛期人工测雨量弋(单位:dm)与遥测雨量I(单位:d
13、m)的关系,统计得到该地区10组雨量数据如下:样本号i12345678910人工测雨量工5.387.996.376.717.535.534.184.046.024.23遥测雨量工5.438.076.576.147.955.564.274.156.044.49i-yi0.050.080.20.570.420.030.090.110.020.26IO10IO并计算得Z%;=353.6,Xx2=361.7,ZXa=357.3,FiS33.62,y34.42,Xyk34.02.I=I4-1三1求该地区汛期遥测雨量y与人工测雨量X的样本相关系数(精确到0.01),并判断它们是否具有线性相关关系;规定:数组(4y)满足N-yi为1类误差;满足0i七-ytow【解】(1)因为=丁吉=玄=一V店(XD(yi-y)-1。/卜(力2-io,代入已知数据,工0.98357.3-1034.0217.1得厂=I=/(353.6-1033.62)(361.7-1034.42)304.5(2)依题意,I类误差有5组,“II类误差有3组,“小类误差有2组.若从I类误差和II类误差数据中抽取3组,抽到“I类误差的组数X的所有可能取值为O,1,2,3.则P