《2023-2024学年人教A版选择性必修第三册 8-2一元线性回归模型及其应用 学案.docx》由会员分享,可在线阅读,更多相关《2023-2024学年人教A版选择性必修第三册 8-2一元线性回归模型及其应用 学案.docx(12页珍藏版)》请在优知文库上搜索。
1、8.2一元线性回归模型及其应用素养目标定方向学习目标1 .结合具体实例,了解一元线性回归模型的含义,了解模型参数的统计意义.了解最小二乘法原理.掌握一元线性回归模型参数的最小二乘估计方法,会使用相关的统计软件.2 .针对实际问题,会用一元线性回归模型进行预测.3 .了解随机误差、残差、残差图的概念.核心素养1 .通过对散点图、线性回归的分析,培养数据分析素养.2 .借助回归模型的建立,培养数学建模、数据分析及数学运算素养.A必街知识探新知、ZZ知识点1一元线性回归模型Y=bx+a-e,一元线性回归模型的完整表达式为、八八/、2其中V称为因变量或响应变量,X称为自变量或解释变量:a,力为模型的未
2、知参数,e是?与H+a之间的机误差.想一想:具有相关关系的两个变量,其样本点散布在某一条直线y=6x+a的附近,可以用一次函数尸以+a来描述两个变量之间的关系吗?提示:不能.练一练:下列说法不正确的是(C).在回归模型中,变量间的关系是非确定性关系,因变量不能由自变量唯一确定B.在函数模型中,变量间的关系是确定性关系,因变量由自变量唯一确定C.在回归模型中,变量X和y都是普通变量D.在回归模型中,回归系数可能是正的也可能是负的解析在回归模型中,X是解释变量,y是响应变量,当解释变量取值一定时,响应变量的取值带有一定的随机性.知识点2最小二乘法与经验回归方程(D最小二乘法=+称为y关于X的经验回
3、归方程,也称经验回归函数或经验回归公式,其图形称为里验回归直线.这种求经验回归方程的方法叫做最小二乘法,求得的,叫做6,a的最小二乘估计.(2)经验回归方程的系数计算公式经验回归方程的计算公式的计算公式=x+nn2(XLX)(%一1ZXXy/=I/=1y(a;XyZ,一X2j=l/=1=y-X(3)经验回归方程的性质经验回归方程一定过点“上J;一次函数=x+的单调性由的符号决定,函数递增的充要条件是0;的实际意义:当X增大一个单位时,增大个单位.练一练:如果记录了必y的几组数据分别为(0,1),(1,3),(2,5),(3,7),那么y关于X的经验回归方程必过点(D)A. (2, 2)C. (
4、1,2)B.(1.5,2)D.(1.5,4)解析因为:=。+?2+3=1.5,1+3+5+7=4,所以经验回归方程必过点(L5,4).知识点3残差与残差分析(1)残差对于响应变量K,通过观测得到的数据称为一观测值通过经验回归方程得到的称为.预测值,观测值减去预测值称为残差.残差分析残差是随机误差的估计结果,通过对残差的分析可以判断模型刻画数据的效果,以及判断原始数据中是否存在可疑数据等,这方面工作称为残差分析.(3)对模型刻画数据效果的分析残差图法:在残差图中,如果残差比较均匀地集中在以横轴为对称轴的水平带状区域内,则说明经验回归方程较好地刻画了两个变量的关系;残差平方和法:残差平方和邑(匕一
5、越小,模型的拟合效果越好;法:可以用=1一来比较两个模型的拟合效果,川越大,模型拟合效果越好,而越小,模型拟合效果越差.练一练:甲、乙、丙、丁四位同学在建立变量X,y的回归模型时,分别选择了4种不同模型,计算可得它们的决定系数#分别如表:甲乙丙T*0.980.780.500.85哪位同学建立的回归模型拟合效果最好(A)A.甲B.乙C.丙D.T解析决定系数越大,表示回归模型的拟合效果越好.关健能力攻重旗题I型I探1究题型一求经验回归方程典例1随着网络的普及,网上购物的方式已经受到越来越多年轻人的青睐,某家网络店铺商品的成交量x(单位:件)与店铺的浏览量双单位;次)之间的对应数据如下表所示:x/件
6、24568力次3040506070(1)根据表中数据画出散点图;(2)根据表中的数据,求出y关于X的经验回归方程;当这种商品的成交量突破100件(含100件)时,预测这家店铺的浏览量至少为多少?分析以横轴表示成交量,纵轴表示浏览量,画出散点图,若散点图显示两变量线性相关,则依据公式求解经验回归方程,再利用经验回归方程进行估计.解析(1)散点图如图所示.(2)根据散点图可得,变量X与y之间具有线性相关关系.552X-5xy根据数据可知,X=5,y=50,xiyi=1390,E北=145,代入公式得二lIIEY-5/tI1390-5X5X50_-145-552-=7,=y-X=50-7X5=15.
7、故所求的经验回归方程是=7x+15.(3)根据上面求出的经验回归方程,当成交量突破100件(含100件),即x=2100时,715,所以预测这家店铺的浏览量至少为715次.规律方法经验回归分析的步骤(1)收集样本数据,设为(为,y,)(i=l,2,,)(数据一般由题目给出).(2)作出散点图,确定筋y具有线性相关关系.(3)计算Xy,xnTfXiYi.J=IJ三l(4)代入公式计算相关系数,确定相关性的强弱.(5)代入公式计算,写出经验回归方程=+.(6)利用经验回归方程进行预测.10对点训练佩戴头盔是一项对家庭与社会负责的表现,某市对此不断进行安全教解析(1)由表中数据知,1+2+3+4 5
8、X =4=2f-=l2150l0501 000,9001育.下表是该市某主干路口连续4年监控设备抓拍到的驾驶员不戴头盔的统计数据:年度2020202120222023年度序号1234不戴头盔人数y125010501000900(D请利用所给数据求不戴头盔人数y与年度序号X之间的经验回归方程=x+;(2)估算该路口2024年不戴头盔的人数.050,ZXM-4XyIqqtx-in500_c所以=喋_a=Tl0,所以=y=1050-(-no)=4 5UNbN-4T2/=I1325,故所求回归直线方程为=-110x+l325.(2)令x=5,则=-110X5+1325=775,则估算该路口2024年不
9、戴头盔的人数为775人.题型二户的求解与回归模型的拟合典例2我国在第七十五届联合国大会上提出:“中国将提高国家自主贡献力度,采取更加有力的政策和措施,二氧化碳排放力争于2030年前达到峰值,努力争取2060年前实现碳中和.”减少碳排放,实现碳中和,人人都可出一份力.某中学数学教师组织开展了题为“家庭燃气灶旋钮的最佳角度”的数学建模活动.实验假设:烧开一壶水有诸多因素,本建模的变量设定为燃气用量与旋钮的旋转角度,其他因素假设一样:由生活常识知,旋转角度很小或很大,一壶水甚至不能烧开或造成燃气浪费,因此旋转角度设定在10到90之间,建模实验中选取5个代表性数据:18。,36,54,72,90.某数
10、学建模小组收集了“烧开一壶水”的实验数据,如表:项目旋转角度开始烧水时燃气表度数/dm?水烧开时燃气表度数d18908092103689589080548819895872。867088199084988670以X表示旋转角度,y表示燃气用量.(D用列表法整理数据(筋y);立旋转角度:度)1836547290y(燃气用量:dm3)(2)假定x,y线性相关,试求经验回归方程=x+;(注:计算结果精确到小数点后三位)(3)计算(2)中所求模型的决定系数,评价此模型的拟合效果.(注:计算结果精确到小数点后两位)5 5_5_5_参考数据:y=712,ZU-7)(-7)=1998,Z(a,-T)2=32
11、40,(y-J)2/=I/=1/=1/=I=1501.2,5(一,)2*269.1.解析整理数据如表:(旋转角度:度)1836547290双燃气用量:Clm3)130122139149172Z(品X)(y-y)/=11998(2)X=54,y=142.4,=Q询=0.617,5JquU-T)2/-1=142.4-0.617X54=109.082,故回归直线方程为=0.617x+109.082.(3)计算(2)中所求模型的决定系数此模型的拟合效果较好.规律方法决定系数/、残差图在回归分析中的作用1(y.-y.)2(D决定系数#是用来刻画回归效果的,由,=1-T可知,越大,意味着残差1(y.-y)
12、2I三I平方和越小,也就是说模型的拟合效果就越好;(2)残差图也是用来刻画回归效果的,判断依据是残差点比较均匀地分布在水平带状区域中,带状区域越窄,说明模型拟合精度越高,回归方程预测的精度也越高.|Q对点训I练某运动员训练次数与训练成绩之间的数据关系如表:次数(X)3033353739444650成绩(。3034373942464851(D作出散点图;求出经验回归方程;(3)作出残差图;(4)计算,并说明运动员的训练次数对成绩的影响占百分之几.解析(I)作出该运动员训练次数X与成绩的散点图,如图所示.由散点图可知,它们之间具有相关关系.y605040302010102()30405()60V_
13、88(2)T=39.25,7=40.875,xi=2656,ZMM=I3180,/=IZ=IZMyL8xy/-l所以=*1.0415,Z必一8X2/=IyX=0.003875,所以经验回归方程为=Lo415-0.003875.(3)残差分析:下面的表格列出了运动员训练次数和成绩的原始数据以及相应的残差数据.Xy=y3030-1.24113334-0.365635370.551437390.468439421.385444460.177946480.09495051-1.0711作残差图如图所示.残差21.5由图可知,残差点比较均匀地分布在水平带状区域内,说明选择的模型比较合适.(4)计算而%0.9855,说明了该运动的训练次数对成绩的影响占98.55%.题型三非线性经验回归问题典例3某公交公司推出扫码支付优惠乘车活动,活动设置了一段时间的推广期,由于推广期内优惠力度较大,吸引了越来越多的人开始使用扫码支付.某线路公交车队统计了活动刚推出一周内每一天使用扫码支付的人次,用X表示推出的天数,y表示每天使用扫码支付的人次(一人次等于十人),统计数据如下表:X1234567y611213466IOl196根据以上数据,绘制了如图所示的散点图.(D根据散点图判断,在