《计量经济学课件.ppt》由会员分享,可在线阅读,更多相关《计量经济学课件.ppt(36页珍藏版)》请在优知文库上搜索。
1、1-1计计 量量 经经 济济 学学 基基 础础 与与 应应 用用The Economic School of Jilin UniversityYu ZhenRegression Analysisin Practice第八章第八章 模型选择:标准与检验模型选择:标准与检验1-3前前 言言p 一、模型设定偏误的类型一、模型设定偏误的类型 p 二、模型设定偏误的后果二、模型设定偏误的后果 p 三、模型设定偏误的检验三、模型设定偏误的检验1-4第一节第一节 “好的好的”模型具有的性质模型具有的性质p A.C.Harvey(1981)简约性简约性/Parsimony 可识别性可识别性/Identifia
2、bility 拟合优度拟合优度/Good-of-Fit 理论一致性理论一致性/Theoretical Consistency 预测能力预测能力/Predictive Power1-5第二节第二节 模型设定偏误的类型模型设定偏误的类型 p 模型设定偏误主要有两大类模型设定偏误主要有两大类:(1)关于关于解释变量选取解释变量选取的偏误的偏误:主要包括:主要包括漏选漏选相关变量(遗漏)相关变量(遗漏)和和多选无关变量(冗余)多选无关变量(冗余)(2)关于关于模型函数形式选取模型函数形式选取的偏误的偏误。1-62.1 遗漏相关变量:拟合不足遗漏相关变量:拟合不足p 例如,如果例如,如果“正确正确”的模
3、型为的模型为而我们将模型设定为而我们将模型设定为 即设定模型时漏掉了一个相关的解释变量即设定模型时漏掉了一个相关的解释变量X3。这类错误称为这类错误称为遗漏变量偏差遗漏变量偏差(omitted variable bias)。*动态设定偏误动态设定偏误(dynamic mis-specification):遗遗漏相关变量表现为对漏相关变量表现为对Y或或X滞后项的遗漏滞后项的遗漏 。ubbb+=33221XXYvXY+=221aa1-7将正确模型将正确模型 的离差形式的离差形式 代入代入得:得:遗漏变量偏差的后果遗漏变量偏差的后果 ubbb+=33221XXYuubb-+=iiiixxy3322=
4、2222iiixyxa-+=-+=22222323222332222222)()(iiiiiiiiiiiiiixxxxxxxxxxyxuubbuubba1-8(1)如果漏掉的如果漏掉的X3与与X2相关,则上式中的第二项在小样本相关,则上式中的第二项在小样本下求期望与大样本下求概率极限都不会为零,从而使得下求期望与大样本下求概率极限都不会为零,从而使得OLS估计量在小样本下有偏,在大样本下非一致估计量在小样本下有偏,在大样本下非一致。注意:偏离方向由注意:偏离方向由 符号决定符号决定 遗漏变量偏差的后果遗漏变量偏差的后果(2)如果如果X3与与X2不相关,则不相关,则a a2的估计满足无偏性与一致
5、性;的估计满足无偏性与一致性;但这时但这时a a1的估计却是有偏的。的估计却是有偏的。22332()Eabb=+1133322()()EXXabb=+-332b 1-9精要精要 图图11-1 Net and gross effects of X2 on Y.1-10由由 Y=a a1+a a2X2+v 得得由由 Y=b b1+b b2X2+b b3X3+得得如果如果X2与与X1相关,显然有相关,显然有如果如果X2与与X1不相关,也有不相关,也有遗漏变量偏差的后果遗漏变量偏差的后果)()(22baVarVar)()(22baVarVar-=-=)1()()(22222322322232232xx
6、iiiiiirxxxxxxVarssb=2222)(ixvarvarsa2a2b2suX2和和X3的的相关系数相关系数1-11 回到例子回到例子10.2 婴儿死亡率的影响因素婴儿死亡率的影响因素p 两个解释变量下的实证结果:两个解释变量下的实证结果:p 错误设定下的实证结果:错误设定下的实证结果:1-12 回到例子回到例子10.2 婴儿死亡率的影响因素婴儿死亡率的影响因素p 遗漏变量作为被解释变量的实证结果:遗漏变量作为被解释变量的实证结果:p 根据回归结果,根据回归结果,230.0056,2.2316bb=-=-320.002562=22332()0.0114Eabb=+-1-13 2.2
7、包含不相关变量偏误:过度拟合包含不相关变量偏误:过度拟合 采用包含不相关解释变量的模型进行估计带采用包含不相关解释变量的模型进行估计带来的偏误,称为包含无关变量偏误(来的偏误,称为包含无关变量偏误(including irrelevant variable bias)。)。设设 为正确模型为正确模型 (*)但却估计了但却估计了 (*)如果如果 b b3=0,则则(*)与与(*)相同,因此,可将相同,因此,可将(*)式视为以式视为以 b b3=0 为约束的为约束的(*)式的特殊形式。式的特殊形式。vXY+=221aaubbb+=33221XXY1-14由于所有的经典假设都满足,因此对由于所有的经
8、典假设都满足,因此对 (*)式进行式进行OLS估计,可得到无偏且一致的估计量。估计,可得到无偏且一致的估计量。但是,但是,OLS估计量却不具有最小方差性。估计量却不具有最小方差性。中中X2的方差的方差:中中X2的方差的方差:当当X2与与X3完全线性无关时完全线性无关时:否则:否则:注意:注意:包含不相关变量偏误的后果包含不相关变量偏误的后果)()(22abVarVar)()(22baVarVar=ubbb+=33221XXY-=)1()(2222232xxirxvarvarsbvXY+=221aa=2222)(ixvarvarsaubbb+=33221XXY30b=3()0Eb=哪种错误更严重
9、?哪种错误更严重?1-152.3 错误函数形式的偏误错误函数形式的偏误p 当选取了错误函数形式并对其进行估计时,当选取了错误函数形式并对其进行估计时,带来的偏误称错误函数形式偏误带来的偏误称错误函数形式偏误(wrong functional form bias)。)。p 容易判断,这种偏误是全方位的。容易判断,这种偏误是全方位的。p 例如,如果例如,如果“真实真实”的回归函数为的回归函数为bbeXAXY2121=却估计线性式却估计线性式显然,两者的参数具有完全不同的经济含义,且显然,两者的参数具有完全不同的经济含义,且估计结果一般也是不相同的估计结果一般也是不相同的。ubbb+=33221XX
10、Y1-16例例11-3(精要(精要 表表 11-1)U.S.expenditure on imported goods and personal disposable income,1968-1987.1-17例例11-3(精要(精要 表表 11-1)线性形式回归结果:线性形式回归结果:对数线性形式回归结果:对数线性形式回归结果:1-18第三节第三节 模型设定偏误的检验模型设定偏误的检验 p 3.1 检验是否含有不相关变量检验是否含有不相关变量 可用可用t 检验与检验与F检验完成。检验完成。检验的基本思想检验的基本思想:如果模型中误选了无关如果模型中误选了无关变量,则其系数的真值应为零。因此,
11、只须变量,则其系数的真值应为零。因此,只须对无关变量系数的显著性进行检验。对无关变量系数的显著性进行检验。t t检验检验:检验某检验某1 1个变量是否应包括在模型中;个变量是否应包括在模型中;F F检验检验:检验若干个变量是否应同时包括在模检验若干个变量是否应同时包括在模型中。型中。1-19例例11-4(精要表(精要表11-2,原始数据,原始数据 表表13-6)生命预期模型生命预期模型1-20例例11-4(精要表(精要表11-2,原始数据,原始数据 表表13-6)Eviews 演示:演示:冗余变量检验冗余变量检验 遗漏变量检验遗漏变量检验1-213.2 变量遗漏或函数形式设定偏误检验变量遗漏或
12、函数形式设定偏误检验 3.2.1 残差图示法残差图示法iuiuiu1-22例例11-3(精要(精要 表表 11-1)线性形式回归结果:线性形式回归结果:去掉时间趋势回归结果:去掉时间趋势回归结果:1-23例例11-3(精要(精要 图图 11-2)S1:去掉时间趋势:去掉时间趋势(11.20)残差残差;S2 加时间趋势加时间趋势(11.13)残差残差1-24 残差序列变化图残差序列变化图(a)趋势变化)趋势变化:模型设定时可能遗模型设定时可能遗漏了一随着时间的漏了一随着时间的推移而持续上升的推移而持续上升的变量变量 (b b)循环变化:)循环变化:模型设定时可能遗模型设定时可能遗漏了一随着时间的
13、漏了一随着时间的推移而呈现循环变推移而呈现循环变化的变量化的变量 1-25p 模型函数形式设定偏误时,残差序列呈现正模型函数形式设定偏误时,残差序列呈现正负交替变化负交替变化 图例:图例:一元回归模型中,真实模型呈幂函数一元回归模型中,真实模型呈幂函数形式,但却选取了线性函数进行回归。形式,但却选取了线性函数进行回归。残差序列变化图残差序列变化图1-263.2.2 一般性设定偏误检验:一般性设定偏误检验:RESET 检验检验p 更准确更常用的判定方法是拉姆齐更准确更常用的判定方法是拉姆齐(Ramsey)于于1969年提出的所谓年提出的所谓RESET 检验(检验(regression error
14、 specification test)。)。p 基本思想:基本思想:如果事先知道遗漏了哪个变量,只需将此变量引入模如果事先知道遗漏了哪个变量,只需将此变量引入模型,估计并检验其参数是否显著不为零即可;型,估计并检验其参数是否显著不为零即可;问题是不知道遗漏了哪个变量,需寻找一个替代变量问题是不知道遗漏了哪个变量,需寻找一个替代变量Z,来进行上述检验。,来进行上述检验。RESET检验中,采用所设定模型中被解释变量检验中,采用所设定模型中被解释变量Y 的的估计值估计值 的若干次幂来充当该的若干次幂来充当该“替代替代”变量。变量。1-27 例如,先估计例如,先估计 Y=a a1+a a2X2+v
15、得得 再根据前面介绍的再根据前面介绍的增加解释变量的增加解释变量的F检验检验来判断是来判断是否增加这些否增加这些“替代替代”变量。变量。若仅增加一个若仅增加一个“替代替代”变量,可通过变量,可通过t t 检验检验来判断。来判断。3.2.2 一般性设定偏误检验:一般性设定偏误检验:RESET 检验检验uggbb+=3221221YYXYiuiu221XYaa+=1-28回到例回到例11-3(精要(精要 图图 11-3,数据,数据11-1)S4:残差:残差 YFF:Yhat1-29回到例回到例11-3(精要(精要 图图 11-3,数据,数据11-1)RESET检验结果检验结果演示演示Eviews1
16、-30 例如,例如,在一元回归中在一元回归中,假设真实的函数形式是非线,假设真实的函数形式是非线性的,将其近似地表示为多项式:性的,将其近似地表示为多项式:p RESET检验用来检验函数形式设定偏误的问题检验用来检验函数形式设定偏误的问题 bbbb+=313212110XXXY 因此,如果设定了线性模型,就意味着遗漏了相因此,如果设定了线性模型,就意味着遗漏了相关变量关变量X12、X13,等等。,等等。在一元回归中,可通过检验在一元回归中,可通过检验(*)式中的各高次幂式中的各高次幂参数的显著性来判断是否将非线性模型误设成参数的显著性来判断是否将非线性模型误设成了线性模型。了线性模型。(*)3.2.2 一般性设定偏误检验:一般性设定偏误检验:RESET 检验检验1-31p 对多元回归对多元回归,非线性函数可能是关于若干个,非线性函数可能是关于若干个或全部解释变量的非线性,这时可或全部解释变量的非线性,这时可按遗漏变量的按遗漏变量的程序进行检验程序进行检验。p 例如,例如,估计估计 Y=b b0+b b1X1+b b2X2+但却怀疑真实的函数形式是非线性的。但却怀疑真实的函数形式是非线性