《华北理工卫生统计学教案12多重线性回归与相关.docx》由会员分享,可在线阅读,更多相关《华北理工卫生统计学教案12多重线性回归与相关.docx(2页珍藏版)》请在优知文库上搜索。
1、课程名称:卫生统计学A第12周,第21讲次摘要授课题目(章、节)第十二章多重线性回归与相关第一节多重线性回归的概念及其统计描述第二节多重线性回归的假设检验第三节复相关系数与偏相关系数第四节自变量筛选本讲目的要求及重点难点:【目的要求】通过本讲课程的学习,掌握偏回归系数、标准化偏回归系数、复相关系数及偏相关系数的概念;自变量筛选的原则与方法。【重点】偏回归系数、标准化偏回归系数的概念及复相关系数、偏相关系数的概念;自变量筛选的原则与方法。【难点】偏回归系数、标准化偏回归系数的概念及复相关系数、偏相关系数的概念;自变量筛选的原则与方法。内容【本讲课程的引入】多重线性回归与多重相关是研究一个连续型变
2、量和多个自变量之间线性关系的统计学分析方法。由于生命现象的复杂性,对某个医学指标的影响因素进行深入了解往往会同时涉及多个自变量,需要采用不同与简单回归的多因素分析方法,这次课程我们就来学习一下多重线性回归与相关。板书“自变量筛选的原则与方法”。【本讲课程的内容】第十二章多重线性回归与相关第一节多重线性回归的概念及其统计描述多重线性回归研究的是一个应变量Y和S个自变量X,、2,XS之间的线性依存关系。构造多重线性回归模型需要有四个基本假定:线性、独立、正态、等方差。y=b0+bixi+xj因为k个自变量都具有各自的计量单位及不同的变异度,所以不能直接用普通偏回归系数的数值大小来反映各个自变量对反
3、应变量Y的贡献大小。将原始观测数据进行标准化转换,然后用标准化数据进行回归模型拟合,此时所获得的回归系数,记为P1,P2,P3,,Pk,标准化偏回归系数(StandardiZedpartialregressionCOeffiCient)又称通径系数(Pathcoefficient).,标准化偏回归系数Pi较大的自变量在数值上对反应变量Y的贡献较大。第二节多重线性回归的假设检验一、整体回归效应的假设检验(方差分析)二、偏回归系数Bi的假设检验(t检验)第三节复相关系数与偏相关系数一、确定系数、复相关系数与调整确定系数复相关系数的平方称为确定系数(CoeffiCientofdeterminatio
4、n),或决定系数,记为R2,用于反映线性回归模型能在多大程度上解释反应变量Y的变异性。定义为R2=SSR/SST.它的取值范围为0-1之间。它越接近1,表示样本数据很好地拟合了所选用线性回归模型。R2直接反映了回归方程中所有自变量解释反应变量Y总变异的百分比,或者说,R2也可以解释为回归方程使反应变量Y的总变异减少的百分比。讲授复相关系数(InUltiPlCcorrelationcoefficient)R,定义为确定系数的算术平方根,表示变量丫与k个自变量的线性相关的密切程度。调整复相关系数(AdjUStedR-Square):当回归方程中包含有很多自变量,即使其中有一些自变量对解释反应变量变
5、异的贡献极小,随回归方程自变量个数的增加,R2表现只增不减,这是复相关系数的缺点。心=/_也-P-1二、偏相关系数控制其它变量的影响后,变量丫与X的相关,称为变量丫与X的偏相关系数(partialcorrelationcoefficient)o第四节自变量筛选一、自变量筛选的标准与原则1 .残差平方和缩小与确定系数增大2 .残差均方缩小与调整确定系数增大3 .Cp统计量二、自变量筛选的常用的方法L所有可能自变量子集选择(allpossibleselection)2 .前向选择法:回归方程由一个自变量开始,每次引入一个偏回归平方和最大,且具有统计学意义的自变量,由少到多,直到无具有统计学意义的自变量可以引入为止。用此法建立的方程有时不够精炼。3 .后向选择法:先建立一个包含全部自变量的回归方程,然后每次剔除一个偏回归平方和最小且无统计学意义的自变量,直到不能剔除时为止,此法的计算量大。4 .逐步选择法:取上述两种方法的优点,在向前引入每一个新自变量之后,都应重新对前面已选入的自变量进行检查,以评价其有无继续保留在方程中的价值。为此,引入和剔除交替进行,直到无具有统计学意义的新变量可以引入,同时,方程中也无失去其统计学意义的自变量可以剔除为止。重点介绍逐步法【本讲课程的小结】【本讲课程的作业】L偏回归系数与标准化偏回归系数的意义。2 .确定系数的意义。3 .自变量筛选的准则与方法。