《7.5案例分析.ppt》由会员分享,可在线阅读,更多相关《7.5案例分析.ppt(14页珍藏版)》请在优知文库上搜索。
1、第五节第五节 案例分析案例分析已知天津市已知天津市1974-1987年的粮食销售量年的粮食销售量 Y(万吨(万吨/年)、常住人口数年)、常住人口数X1 (万人)、人均收入(万人)、人均收入X2(元(元/年)、肉销售量年)、肉销售量X3 (万吨(万吨/年)、蛋销售量年)、蛋销售量X4 (万吨(万吨/年)、鱼虾销售量年)、鱼虾销售量X5 (万吨(万吨/年)的数据年)的数据资料,试建立它们之间的多元线性回归模型。资料,试建立它们之间的多元线性回归模型。年份年份Y YX X1 1X X2 2 X X3 3X X4 4X X5 5197498.45 560.20 153.20 6.53 1.23 1.8
2、9 1975100.70 603.11 190.00 9.12 1.30 2.03 1976102.80 668.05 240.30 8.10 1.80 2.71 1977133.95 715.47 301.12 10.10 2.09 3.00 1978140.13 724.27 361.00 10.93 2.39 3.29 1979143.11 736.13 420.00 11.85 3.90 5.24 1980146.15 748.91 491.76 12.28 5.13 6.83 1981144.60 760.32 501.00 13.50 5.47 8.36 1982148.94 77
3、4.92 529.20 15.29 6.09 10.07 1983158.55 785.30 552.72 18.10 7.97 12.57 1984169.68 795.50 771.16 19.61 10.18 15.12 1985162.14 804.80 811.80 17.22 11.79 18.25 1986170.09 814.94 988.43 18.60 11.54 20.59 1987178.69 828.73 1094.65 23.53 11.68 23.37 天津市粮食需求的数据天津市粮食需求的数据资料来源:资料来源:天津统计年鉴天津统计年鉴,1988年。年。首先对模型
4、进行估计,得下估计结果:首先对模型进行估计,得下估计结果:从估计结果可以看出,模型的拟合优度较高,但回从估计结果可以看出,模型的拟合优度较高,但回归系数在统计上均不显著,说明模型可能存在多重归系数在统计上均不显著,说明模型可能存在多重共线性。共线性。计算各解释变量之间的相关系数:计算各解释变量之间的相关系数:表明各解释变量间确实存在严重的多重共线性。表明各解释变量间确实存在严重的多重共线性。采用逐步回归法检验和解决多重共线性问题。采用逐步回归法检验和解决多重共线性问题。1.分别作分别作Y 对对X1、X2、X3、X4、X5的一元回归的一元回归变量变量X1X2X3X4X5参数估计值参数估计值0.3
5、170.08154.8935.7403.081t 统计量统计量12.27.68.76.86.0拟合优度拟合优度0.9250.8280.8630.7960.75根据经济理论分析和回归结果易知,根据经济理论分析和回归结果易知, 常住人口数常住人口数X1是重要的解释变量,所以以是重要的解释变量,所以以X1为基础,逐次加为基础,逐次加入其他解释变量。入其他解释变量。Y与与X1的回归结果的回归结果2.分别引入变量分别引入变量X2、X3、X4、X5加入变量加入变量X3,对,对Y关于关于X1,X3作最小二乘估计,得作最小二乘估计,得可以看出,加入可以看出,加入X3后,拟合优度和调整的拟合优度后,拟合优度和调
6、整的拟合优度均有所增加,参数估计值的符号也正确,并且没有均有所增加,参数估计值的符号也正确,并且没有影响影响X1系数的显著性,所以在模型中保留系数的显著性,所以在模型中保留X3。2.再分别引入变量再分别引入变量X2、X4、X5在已有变量在已有变量X1、X3的基础上引入第三个解释变量,的基础上引入第三个解释变量,用逐步回归法判断的结果是,用逐步回归法判断的结果是,X2、X4、X5都不能都不能作为新的解释变量引入模型。作为新的解释变量引入模型。于是,最终得到于是,最终得到Y关于关于X1和和X3的回归方程,其中的回归方程,其中的常数项不显著,去掉常数项,回归结果为:的常数项不显著,去掉常数项,回归结
7、果为:回归方程为:回归方程为:1320.1412.802 (14.6) (5.8) 0.939 =1.29 199.83iYXXR DWF第七章第七章 小结小结1.多重共线性是指各个解释变量之间有准确或多重共线性是指各个解释变量之间有准确或近似的线性关系。近似的线性关系。2.多重共线性的后果:多重共线性的后果:如果各个解释变量之间有完全的共线性,则它如果各个解释变量之间有完全的共线性,则它们的回归系数是不确定的,并且它们的方差会们的回归系数是不确定的,并且它们的方差会无穷大。如果共线性是高度的但不完全的,回无穷大。如果共线性是高度的但不完全的,回归系数可估计,但有较大的标准误差。归系数可估计,
8、但有较大的标准误差。回归系回归系数不能准确地计。数不能准确地计。3.诊断共线性的经验方法: 相关系数检验 辅助回归模型检验 方差膨胀因子法 直观判断法 增大样本容量 剔除变量法 利用附加信息 变换变量形式 横截面数据与时序数据并用 逐步回归法4.降低多重共线性的方法: (1) 表现为可决系数异常高而回归系数的表现为可决系数异常高而回归系数的t 检验不显检验不显著。著。 (2) 变量之间的零阶或简单相关系数。多个解释变量变量之间的零阶或简单相关系数。多个解释变量时,较低的零阶相关也可能出现多重共线性,需要时,较低的零阶相关也可能出现多重共线性,需要检查偏相关系数。检查偏相关系数。 (4)如果如果 高而偏相关系数低,则多重共线性是可能高而偏相关系数低,则多重共线性是可能的。的。 (5) 用解释变量间辅助回归的可决系数判断。用解释变量间辅助回归的可决系数判断。