《第7讲多元线性回归3.ppt》由会员分享,可在线阅读,更多相关《第7讲多元线性回归3.ppt(26页珍藏版)》请在优知文库上搜索。
1、2023-11-161第七讲Multiple linear regression(3)2023-11-162例2.1 某精神病学医生想知道精神病患者经过个月治疗后疾病恢复的情况Y是否能通过精神错乱的程度X1、猜疑的程度X2两项指标来较为准确地预测。资料如下,试作分析。2023-11-163DATA d4p15;DATA d4p15;INPUT y x1 x2;INPUT y x1 x2;CARDS;CARDS;28 3.36 6.9 28 3.36 6.924 3.23 6.524 3.23 6.514 2.58 6.214 2.58 6.221 2.81 6.021 2.81 6.022 2
2、.80 6.422 2.80 6.410 2.74 8.410 2.74 8.428 2.90 5.628 2.90 5.6 8 2.63 6.9 8 2.63 6.923 3.15 6.516 2.60 6.313 2.70 6.922 3.08 6.320 3.04 6.821 3.56 8.813 2.74 7.118 2.78 7.2;2023-11-164PROC REG;PROC REG;MODEL y=x1 x2;MODEL y=x1 x2;RUN;RUN;以上是程序的参数估计结果,不难看出截距项可以上是程序的参数估计结果,不难看出截距项可以去掉。以去掉。2023-11-165D
3、ATA abc2;DATA abc2;SET D4P15;SET D4P15;PROC REG;PROC REG;MODEL y=x1 x2/NOINT P R;MODEL y=x1 x2/NOINT P R;RUN;RUN;将截距项去将截距项去掉掉计算各点上因计算各点上因变量的预测值变量的预测值进行残差分析进行残差分析2023-11-1662023-11-167 这是程序的这是程序的方差分析方差分析和参数估计结果,方程与各和参数估计结果,方程与各参数的检验结果都有显著性意义,所求得的二元线性参数的检验结果都有显著性意义,所求得的二元线性回归方程为回归方程为:1217.8060564.8735
4、84Yxx线性回归方程的估计标准误为:线性回归方程的估计标准误为:.2.53714Y xS2023-11-1682023-11-169这是对程序中的二元回归模型作残差分析的结果这是对程序中的二元回归模型作残差分析的结果,从第、两列发现第个观测点所对应的学生,从第、两列发现第个观测点所对应的学生化残差的绝对值大于化残差的绝对值大于(因因STUDENT=-2.170)STUDENT=-2.170),故认,故认为该点可能是异常点,需认真检查核对原始数据。为该点可能是异常点,需认真检查核对原始数据。2023-11-1610DATA abc3;SET D4P15;IF _N_=8 THEN DELETE
5、;PROC REG;MODEL y=x1 x2/NOINT P R;RUN;2023-11-16112023-11-1612 这是程序的这是程序的方差分析方差分析和参数估计结果,方程与和参数估计结果,方程与各参数的检验结果都有显著性意义,所求得的二元各参数的检验结果都有显著性意义,所求得的二元线性回归方程为线性回归方程为 1216.9721584.465611Yxx线性回归方程的估计标准误为:线性回归方程的估计标准误为:.2.14515Y xS2023-11-16132023-11-1614 比较第个观测点去掉前后预测平和比较第个观测点去掉前后预测平和PressPress的值的值从从122.8
6、819122.8819降为降为79.955079.9550;对整个方程检验的;对整个方程检验的F F值从值从474.661474.661上升为上升为660.326660.326;线性回归方程的估计标准线性回归方程的估计标准误由误由2.53714下降为下降为2.14515,表明该点对因变量预表明该点对因变量预测值的影响是比较大的测值的影响是比较大的,值得注意。值得注意。2023-11-1615例例2.2有人在某地抽样调查了有人在某地抽样调查了29例儿童的血红例儿童的血红蛋白与种微量元素的含量,蛋白与种微量元素的含量,资料如下,试资料如下,试问问 可否用种微量元素可否用种微量元素(单位都是单位都是
7、mol/L)钙钙(X1)、镁、镁(X2)、铁、铁(X3)、铜铜(X4)来较好地预测来较好地预测血红蛋白血红蛋白(Y,g/L)的含量?的含量?SAS程序:DATA d4p16a;INPUT y x1-x4;CARDS;135.0 13.70 12.68 80.32 0.16.70.0 11.80 11.73 52.75 0.13;2023-11-1616PROC reg;PROC reg;MODEL y=x1-x4/MODEL y=x1-x4/COLLINCOLLIN COLLINOINTCOLLINOINT;RUN;RUN;先用程序作试探性分析,并用了共线性诊断的技术。先用程序作试探性分析,并
8、用了共线性诊断的技术。共线性诊断选择共线性诊断选择项,对截距未进项,对截距未进行校正行校正共线性诊断选择共线性诊断选择项,对截距进行项,对截距进行校正校正2023-11-1617输出结果及其解释输出结果及其解释2023-11-1618程序的参数估计结果程序的参数估计结果 截距项、截距项、X2、X4都无显都无显著性意义,但不应过早将著性意义,但不应过早将X2、X4从模型中去掉。从模型中去掉。最好等截距项从模型中去掉之后,重新拟合,最好等截距项从模型中去掉之后,重新拟合,视最后的结果再作决定。视最后的结果再作决定。2023-11-1619这是共线性诊断的第部分,即未对截距项校正的这是共线性诊断的第
9、部分,即未对截距项校正的回归诊断结果回归诊断结果 从最后一行的条件数从最后一行的条件数25.558510可知可知,自变量之间有较强的共线性自变量之间有较强的共线性;从该行方差分从该行方差分量的数值可看出量的数值可看出 自变量之间的共线性主要表现自变量之间的共线性主要表现在在X2、X3两变量上。两变量上。2023-11-1620这是共线性诊断的第部分,即对截距项校正之后这是共线性诊断的第部分,即对截距项校正之后的回归诊断结果的回归诊断结果 因本例的截距项无显著性意义,因本例的截距项无显著性意义,故用第部分诊断结果就可以了。故用第部分诊断结果就可以了。2023-11-1621data d4p16b
10、;data d4p16b;set d4p16a;set d4p16a;PROC REG;PROC REG;MODEL y=x1-x4/NOINT SELECTION=STEPWISE MODEL y=x1-x4/NOINT SELECTION=STEPWISE SLE=0.30 SLS=0.10 STB;SLE=0.30 SLS=0.10 STB;RUN;RUN;用逐步回归法筛选自变量用逐步回归法筛选自变量变量进入方程变量进入方程的显著性水平的显著性水平剔除变量的显剔除变量的显著性水平著性水平求出标准化回求出标准化回归参数归参数2023-11-1622Stepwise Procedure fo
11、r Dependent Variable YStep 1 X3 EnteredR-square=0.98979882 C(p)=4.72240744Step 2 X1 EnteredR-square=0.99086912 C(p)=3.39412226Step 3 X4 EnteredR-square=0.99175444 C(p)=2.64104696Step 4 X4 Removed R-square=0.99086912 C(p)=3.39412226All variables in the model are significant at the 0.1000 level.No oth
12、er variable met the 0.3000 significance level for entry into the model.2023-11-1623这是程序中逐步回归分析的扼要结果,详细结这是程序中逐步回归分析的扼要结果,详细结果省略了。果省略了。筛选的结果表明筛选的结果表明 X3是有非常显是有非常显著性影响的变量;而著性影响的变量;而X1仅在仅在P=0.0865水平上有水平上有显著性意义,若规定显著性意义,若规定SLS=0.05,则回归方程中,则回归方程中只有只有X3一个自变量。一个自变量。2023-11-16242023-11-1625这是逐步回归分析的最后结果,回归方程
13、为这是逐步回归分析的最后结果,回归方程为 两个标准化回归系数分别为两个标准化回归系数分别为-0.174394-0.174394、1.1661841.166184,结合前面共线性诊断的结果可知,结合前面共线性诊断的结果可知,X1X1与与X3X3之间无密之间无密切的相关关系,故可认为切的相关关系,故可认为X3X3对对Y Y的影响大于的影响大于X1X1。131.2428061.813880Yxx 2023-11-1626专业结论专业结论微量元素中铁微量元素中铁(X3)的含量对血红蛋白的含量对血红蛋白(Y)的影响的影响有非常显著性意义。有非常显著性意义。铁的吸收量提高后,有助于血红蛋白含量的提高铁的吸收量提高后,有助于血红蛋白含量的提高(因因B3=1.166);而钙的吸收量提高后,反而会使血红蛋白含量有而钙的吸收量提高后,反而会使血红蛋白含量有减少的趋势减少的趋势(因因B1=-0.174)。