《《概率论与数理统计》教案第29课一元线性回归分析.docx》由会员分享,可在线阅读,更多相关《《概率论与数理统计》教案第29课一元线性回归分析.docx(7页珍藏版)》请在优知文库上搜索。
1、课题一元线性回归分析课时2课时(90min)教学目标知识技能目标:(1)理解一元线性回归模型的概念(2)掌握参数b标的估计的计算(3)掌握线性回归的显著性检验(4)会应用,检验法与相关系数检验法解决实际问题素质目标:(1)帮助学生掌握本课程所涉及的现代数学中的重要思想方法(2)激发学生探索与求知的欲望,培养学生自主学习与职后发展的能力教学重难点教学重点:一元线性回归模型的概念,参数f2的估计的计算教学难点:应用/检验法与相关系数检验法解决实际问题教学方法讲练结合法、问答法、讨论法教学用具电脑、投影仪、多媒体课件、教材教学过程主要教学内容及步骤课前任务【教师】布置课前任务,和学生负责人取得联系,
2、让其提醒同学通过APP或其他学习软件,搜集并了解一元线性回归分析的相关知识【学生】完成课前任务考勤【教师】使用APP进行签到【学生】按照老师要求签到互动导入【教师】提出问题:对于具有相关关系的变量,虽然不能找到它们之间的确定表达式,但是通过大量的观测数据,可以发现它们之间存在一定的统计规律,那么这种规律如何把握呢?【学生】思考、讨论、回答传授新知【教师】通过大家的发言,引入新的知识点,讲解一元线性回归分析的相关知识在实际工作中,我们会经常碰到一些互相联系、互相制约的变量,它们之间存在着一定的关系.一般来说,变量之间的关系可分为两类:一类是确定性的函数关系,这是大家所熟知的.例如,圆的面积S与半
3、径R之间,存在着以公式S=冗/表示的确定性关系.另一类是非确定性的关系,称为相关关系.例如,小麦的单位面积施肥量X与单位面积产量Y的关系是不确定性的.在一定的范围内X越大,Y也越大,因而Y依赖于X;但X一定,Y并不完全相等,它是一个随机变量.这是因为单位面积产量还受到许多其他因素及一些无法控制的随机因素的影响.这里我们有两个变量X与Y.其中,X为一般变量,它的值可以精确测量或严格控制;Y是依赖于X的随机变量Y与X之间的关系就是相关关系.我们还可以举出很多具有相关关系的例子,如人的身高X和体重Y等.对于具有相关关系的变量,虽然不能找到它们之间的确定表达式,但是通过大量的观测数据,可以发现它们之间
4、存在一定的统计规律,数理统计中研究变量之间相关关系的一种有效方法就是回归分析.一、一元线性回归模型【教师】介绍回归分析的作用,并引出一元正态线性回归分析反映丫与X之间关系的最重要的数字特征当然是Y的数学期望与X之间的关系.我们称(幻=E(Y)为y对的回归函数回归分析的一个重要内容就是估计然后利用估计结果作预测和控制为估计(”),通常是指定n各X的值X*2,X”,做n次独立试验,取得Y的相应观察值)管,再由对数据(%,%),(,必),(七,)来估计以(X).实际中常先用近似作图法描绘的图形.将n对观察(占%)=12,)看成个点,并把它们描点在坐标平面XQV上,这种图称为散点图;然后在平面上引一条
5、直线或曲线,使它最好地与这些散点的分布相符合.一直线或曲线就近似地描绘了y=()的图形.当然,这是很粗糙的描述方法,回归分析为我们提供了研究回归函数y=的精确统计推算方法.本节将讨论最简单但经常遇到的一元正态线性回归分析.这里K为正态变量,回归函数4(x)=+为工的线性函数.【教师】通过例题,引出一元线性回归模型的概念例1某广告公司为了研究某一类产品的广告费X与其销售额Y之间的关系,对多个厂家进行调查,获得如表9-1所示数据.(详见教材)一般地,假设X与Y之间的相关关系可表示为Y=a+bx+,(9/)其中“方为未知常数,E为随机误差,是人们不可控制的,且5N(92),/未知,X与Y的这种关系称
6、为一淄性回归模型.丫=+女1称为回归直线,b称为回归系数,此时yNS+x,b)对于(xy)的样本(不见,区,必),“王,北),有yi=a+bxj+j,i=,2,,耳N(l,4),弓,n相互独立.如果由样本得到式(9-1)中“”的估计值力,则称9=Z+R为拟合直线或经验回归直线,它可作为回归直线的估计.一元线性回归主要解决以下问题:(1)利用样本对未知参数cifh,2进行估计;(2)对回归模型作显著性检验;(3)当X=Xo时对Y的取值做预测,即对Y做区间估计.二参数a,b,。一的估计【教师】讲解参数2的估计已知变量X,YMn对试验数据(Xi+M)=1,2,),其中七不全相同,作偏差平方和Q(a,
7、b)=Yj(yi-a-bxi)2i=l(9-2)选择参数&b的估计”,使得QS)达到最小,这种方法称为最小二乘法.为了求Qm份的最小值,分别求Qm,/“关于“,的一阶偏导数,并令它们等于零:少二-2七(Mi一如)=0,aM冬=-2(Z-bxi)xl=0.OU整理后得方程组na+bZ%=Zy,Er=lnH+V=z、Z=Ir=!I=I式(94)称为正规方程组.由于为不全相同,正规方程组的系数行列式fl 丁 =,2V-fr =WU-X)20所以式(9-4 )有唯一解,解得方的估计值为rtx-fYl (XL)(yi-y)6= i=l 1 I=I 八 i=l )= AI冷2格J2“万=K京,(9-6)1
8、 n1 5=一以 y=-jyl其中 M , 仁于是,所求的经验回归直线方程(图9-2 )为图9-2若把力=歹一版代入式(9-7),则经验回归直线方程为(9-8)y=y+bx-x)式(9-8)表明,经验回归直线总是过散点图的几何中心叵乃.下面我们来求O?的估计,为此,记yi=a+bxj(/=1.2,n)t则yt称为Xi处的残差,平方和Qc=(-yi)2=(-购尸(9-9)称为残差平方和.事实上,残差平方和Q就是把G,/;代入到式(9-2)的结果,因此2=Qnin.我们用作为4的估计值.为了便于计算,下面导出它的另一种表达形式.由式(9.8),有Qt=t(yi-yi)2=lz-y-(i-)2/=I
9、Z=I=(-y)2-2这(%-y)(i-)+而-X)2i=!f=lZ=I即得ft=(-y)2-)2U-)2*=|(9-11)于是b=-a=-(y-yY-(1.-)n-2n-2n-2由以下定理可知,上述参数a=b的估计都是无偏估计.2I这(吃一幻2 /=1定理1a-N(1)i)N(2)三32%2(-2)(3) cr(4) 分别与A独立.证明略.【教师】通过例题,使学生将所学知识与实际应用相结合例2设例1中的随机变量Y与可控变量x之间的关系符合式(9-2)所述的条件.求Y关于工的经验回归直线方程,并计算02的估计值万?.(解析详见教材)三、线性回归的显著性检验在以上的讨论中,我们假定Y关于X的回归
10、MX)具有形式a+bx,在处理实际问题时,“是否为相等线性函数,首先要根据有关专业知识和实践来判断,其次就是根据实际观察得到的数据运用假设检验的方法来判断.这就是说,求得的线性回归方程是否有实用价值,一般来说,需要经过假设检验才能确定.若线性假设(9-2)符合实际,则b不应为零,因为若8二,则E(Y)=MX)就不依赖与X了.因此我们需要假设检验HO:b=0,Hzh0(913)下面介绍检验假设HO的两种常见方法.(一),检验法若。成立,即力二,由定理【知,N(0,1)(i-)2心(一且B与万独立,因而呻|.如2(-2)=。口为显著水平,即得。的拒绝域为通常称R为样本相关系数.类似于随机变量间的相
11、关系数,R的取值r反映了自变量X与因变量Y之间的线性相关关系.可以推出:在显著性水平下,当G时拒绝”。,其中临界值G在附表6中给出.相关系数检验法是工程技术中广泛应用的一种检验方法.当假设。:=被拒绝时,就认为Y与X存在线性关系,从而认为回归效果显著;若接受”。,则认为Y与X的关系不能用一元线性回归模型来描述,即回归效果不显著,此时,可能有如下几种情形:(I)X对Y没有显著影响;(2)X对Y有显著影响,但这种影响不能用线性相关关系来描述;(3)影响Y取值的,除X外,另有其他不可忽略的因素.因此,在接受Ho的同时,需要进一步杳明原因分别处理,此时,专业知识往往起着重要作用.【教师】通过例题,使学
12、生将所学知识与实际应用相结合例3检验例2中的回归效果是否显著,取二二5.(解析详见教材)四、预测当经过检验发现回归效果显著时,通过回归模型可对Y的取值进行预测,即当=不时,对Y做区间估计.设当”二/时Y的取值为。,有y0=a+bx0+0f0-N(O,2)可以取经验回归值%=a+bx=y+b(x0-x)作为先的预测值.可以证明T=,v-V,-t(n-2)心+L,AD2r从而可得PTo-wa2*+).【教师】通过例题,使学生将所学知识与实际应用相结合例4经检验例2中的回归效果显著.当=8时,求出片的预测区间.(a二05)解当X。=80时,%的预测值为5o=298.98,y0的95%的预测区间为(1
13、86.77,411.99)【学生】聆听、思考、理解、记忆拓展训练【教师】给出题目,组织学生以小组为单位进行解题对某矿体的8个采样进行测定,测得该矿体含铜量x(%)与含银量y(%),具体数据如表所示.y375441434134切4571.5141012103.61013(1)求y与X的线性回归方程;(2)对于=0.01,检验y与X线性关系是否显著?【学生】聆听、思考、讨论、解题【教师】公布正确答案,讲解解题步骤【学生】对比答案和解题步骤,提高自身解题技巧课堂小结【教师】简要总结本节课的要点一元线性回归模型参数4,b,O?的估计线性回归的显著性检验预测【学生】总结回顾知识点作业布置【教师】布置课后作业(1)完崛才总习题九的第1、2、3题;(2)登录APP他学习平台直看相若瞅雌.【学生】完成课后任务教学反思