《专题跟踪检测(十三)统计与统计案例.docx》由会员分享,可在线阅读,更多相关《专题跟踪检测(十三)统计与统计案例.docx(6页珍藏版)》请在优知文库上搜索。
1、专题跟踪检测(十三)统计与统计案例1 .(2023天津离老)调查某种群花萼长度和花瓣长度,所得数据如图所示.其中相关系数r=0.8245,下列说法正确的是()A.花瓣长度和花萼长度没有相关性B.花瓣长度和花萼长度呈负相关C.花瓣长度和花萼长度呈正相关D.若从样本中抽取一部分,则这部分的相关系数一定是0.8245解析:选C因为样本相关系数r=0.82450.75,所以花瓣长度和花萼长度的相关性较强,并且呈正相关,所以A、B错误,C正确;因为样本相关系数与样本的数据有关,所以当样本发生变化时,样本相关系数也会发生变化,所以D错误.故选C.2 .(2023南通模拟)经验表明,树高y与胸径X具有线性关
2、系,为了解回归方程的拟合效果,利用下列数据计算残差,用来绘制残差图.胸径x/cm18.219.122.324.526.2树高的观测值Wm18.919.420.822.824.8A树高的预测值Wm18.619.321.523.024.4则残差的最大值和最小值分别是()A.0.4,-1.8B.1.8,-0.4C.0.4,-0.7D.0.7,-0.4解析:选C由表可得,各组数据的残差为18.918.6=0.3,19.419.3=0.1,20.821.5=-0.7,22.823=-0.2,24.824.4=0.4,故残差最大值为0.4,最小值为一0.7.故选C.3 .为深入推进“五育”并举,促进学生身
3、心全面和谐发展,某校于上周六举办跳绳比赛.现通过简单随机抽样获得了22名学生在1分钟内的跳绳个数如下(单位:个):6977929899100102103115116116122123124127128129134140142143159估计该校学生在1分钟内跳绳个数的第65百分位数为()A.124B.125.5C. 127D.127.5解析:选C因为22X0.65=14.3,22名学生的跳绳成绩从小到大第15个数为127,所以该校学生在1分钟内跳绳个数的第65百分位数为127,故选C.4 .下列说法不正确的是()A.回归分析中,N的值越大,说明残差平方和越小B.若一组观测数据(X1,y),(及
4、,2),(X”,%)满足M=她+e4=l,2,若g恒为0,则心=1C.回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法D.画残差图时,纵坐标为残差,横坐标一定是编号解析:选D对于A,回归分析中,W的值越大,说明模型的拟合效果越好,则残差平方和越小,A正确;对于B,若一组观测数据(汨,y),(X2,刃),(x,)满足y=fexj+0+eM=l,2,,),若给恒为0,则N=,B正确;对于C,回旧分析是对具有相关关系的两个变量进行统计分析的一种常用方法,C正确;对于D,残差图中横坐标可以是样本编号,也可以是身高数据,还可以是体重的估计值等,D错误.故选D.5 .(2023滨州二模)某组样
5、本数据的频率分布直方图如图所示,设该组样本数据的众数、平均数、第一四分位数分别为制,必,X3,则用,M,内的大小关系是(注:同一组中数据用该组区间中点值近似代替)()解析:选A由频率分布直方图可知众数为二=2.5,即=2.5,平均数42=0.2X1.5+0.242.5+0.23.5+0.164.5+0.125.5+0.046.5+0.047,5=3.54,显然第一四分位数位于2,3)之间,则0.2+(13-2)X0.24=0.25,解得刈七2.208,所以右41令2.故选A.6 .(多选)随着社会的发展,人们的环保意识越来越强了,某市环保部门对辖区内A,B,C,。四个地区的地表水资源进行检测,
6、按照地表水环境质量标准,若连续10天,检测到地表水粪大肠菌群都不超过200个/L,则认为地表水粪大肠菌群指标环境质量稳定达到I类标准,否则不能称稳定达到I类标准.已知连续10天检测数据的部分数字特征为A地区的极差为20,75%分位数为180;8地区的平均数为170,方差为90;。地区的中位数为150,极差为60;。地区的平均数为150,众数为160.根据以上数字特征推断,地表水粪大肠菌群指标环境质量稳定达到I类标准的地区是()A.A地区B.B地区C.C地区D.。地区解析:选AB根据题意,设数据的最大值为xt最小值为),每天的检测数据为xi(i=1,2,10),对于A地区,极差为20,-y=20
7、,又由75%分位数为180,W-18020,110IO则900,矛盾,所以这10个数据I=I均不大于200,5地区一定达标;对于C地区,数据150,150,150,150,150,150,150,150,150,210,满足中位数为150,极差为60,C地区可能没有达标;对于。地区,数据100,100,140,150,150,160,160,160,160,220,满足平均数为150,众数为160,。地区可能没有达标.7 .(多选)下列命题是真命题的是()A.若X,8,*),则E(X)=8 .在线性回归模型拟合中,若相关系数/越大,则样本的线性相关性越强C.有一组样本数据(i=1,2,3),m
8、1,2,3.若样本的平均数;=2,则样本的中位数为2D.投掷一枚骰子10次,并记录骰子向上的点数,平均数为2,方差为1.4,可以判断一定没有出现点数6解析:选ACD对于A,若XBgp),则E(X)=印,故A正确:对于B,若H越大,则样本的线性相关性越强,故B不正确:对于C,有两种情况:1,2,3和2,2,2,故C正确;对于D,若出现点数6,则.一=由(为一2)2+s-2)2+S-2)2+(62)22=X161.4,此时其方差不可能是1.4,所以D正确.故选A、C、D.8.(2023盐城模拟)(多选)2023年6月18日,很多商场都在搞促销活动.重庆市物价局派人对5个商场某商品同一天的销售量及其
9、价格进行调查,得到该商品的售价X元和销售量),件之间的一组数据如下表所示:X9095100105110y1110865用最小二乘法求得y关于X的经验回归直线是:=-0.32x+),相关系数,一一0.9923,则下列说法正确的有()A.变量X与y负相关且相关性较强AB.二40C.当x=85时,),的估计值为13D.相应于点(105,6)的残差为一0.4解析:选ABD对于A,由回归直线可得变量y线性负相关,且由相关系数Irl=O.99213可知相关性较强,故A正确;对于B,由题可得X=5(90+95+100+105+110)=100,yA=(11+10+8+6+5)=8,故回归直线恒过点(IOo,
10、8),故8=-0.32X100+q,即=40,故AB正确:对于C,当=85时,y=-0.32X85+40=12.8,故C错误:对于D,相应于点(105,6)的残差e=6-(0.32X105+40)=0.4,故D正确.故选A、B、D.9 .(多选)下列说法正确的是()A.若数据内,X2,,X”的方差?为0,则此组数据的众数唯一B.已知一组数据2,3,578,9,9,11,则该组数据的第40百分位数为6C.若两个具有线性相关关系的变量的相关性越强,则样本相关系数的值越大D.在残差图中,残差点分布的水平带状区域越窄,说明模型的拟合精度越高解析:选AD对于A,由方差s2=%(-X+-X)2F(XZJX
11、)2=0,得汨=X2=m=T,即此组数据的众数唯一,故A正确;对于B,数据2,3,5,7,8,9,9,11共有8个,由8X40%=3.2可知,该组数据的第40百分位数为7,故B错误;对于C,若两个具有线性相关关系的变量的相关性越强,则样本相关系数Irl的值越接近于1,故C错误;对于D,在残差图中,残差点分布的水平带状区域越窄,说明波动越小,即模型的拟合精度越高,故D正确.故选A、D.10 .(多选)某渔业养殖场新进IoOO尾鱼苗,测量其体长(单位:亳米),将所得数据分成6组,其分组及频数情况如下表:分组(单位:亳米)70,75)75,80)80,85)85,90)90,95)95,100频数1
12、00100tn350150n已知在按以上6个分组作出的频率分布直方图中,95,100分组对应小矩形的高为0.01,则下列说法正确的是()A.,=250B.鱼苗体长在90,100上的频率为0.16C.鱼苗体长的中位数一定落在区间85,90)内D.从这批鱼苗中有放回地连续抽取50次,每次一条,则所抽取鱼苗体长落在区间80,90)上的次数的期望为30解析:选ACD因为95,100分组对应小矩形的高为0.01,组距为5,所以95,100分组对应的频率为0.01X5=0.05,n=0000.05=50,Sm=000-100-100-350-150-50=250,A正确;鱼苗体长在90,100上的频率为耳
13、蜉=0.2,B错误;因为鱼苗的总数为11lv000,100+100+250=450,100100+250+350=800,所以鱼苗体长的中位数一定落在区间85,90)内,C正确;由表中数据易知,鱼苗体长落在区间80,90)上的概率=一:=06,1UUU设所抽取鱼苗体长落在区间80,90)上的次数为X,则X服从二项分布,即X8(50,0.6),则E(X)=50X0.6=30,D正确,故选A、C、D.11 .某校高三(1)班(45人)和高三(2)班(30人)进行比赛,按照分层随机抽样的方法从两个班共抽取10名同学,相关统计情况如下:高三(1)班答对题目的平均数为1,方差为1;高三(2)班答对题目的
14、平均数为1.5,方差为0.35,则这10人答对题目的方差为()A.0.61B.0.675C.0.74D.0.845解析:选D由分层随机抽样可得高三(1)班抽取的人数为石不济X10=6,高三(2)班抽30取的人数为石WXlo=4,设高三(1)班(6人)答对题目数依次为X2,,X6,高三(2)班161616(4人)答对题目数依次为y,y2f3,y4,由题意可得耳为=1,7(X,1)2=7(XZ6)=1,/=1m=1v/=11414146644yi=1.5,7(yf-1.5)2=(y14.52)=0.35,可得EH=6,xJ=12,Eyi=6,y=r=1/-14r=l三1r三l三l三11641610.4,则这10人答对题目的平均数为正(即+)力=1.2,这10人答对题目的方差为而忌三1三1三I4+EyJ-IOX1.22)=08/-I12. (2023保定模拟)下面对于样本相关系数r的叙述中,正确的是.rW0,1,r越大相关程度越大,反之相关程度越小;r(8,+8),越大相关程度越大,反之相关程度越小;r=0.85表示的两变量的相关程度大于r=0.80表示的