《第3章回归分析的性质和基本概念.ppt》由会员分享,可在线阅读,更多相关《第3章回归分析的性质和基本概念.ppt(62页珍藏版)》请在优知文库上搜索。
1、第三章第三章 回归分析的基本概念回归分析的基本概念 学习目的学习目的 理解回归分析的性质和双变量回归分析的一些基本概念。第三章第三章 回归分析的基本概念回归分析的基本概念第一节第一节 回归分析释义回归分析释义第二节第二节 经济变量之间的关系经济变量之间的关系第三节第三节 符号术语数据符号术语数据第四节第四节 总体回归函数总体回归函数第五节第五节 随机干扰项随机干扰项第六节第六节 “线性线性”一词的含义一词的含义第七节第七节 样本回归函数样本回归函数“回归回归”的历史溯源:的历史溯源:“回归回归”一词最先由弗朗西斯一词最先由弗朗西斯高尔顿(高尔顿(Francis GaltonFrancis Ga
2、lton)提)提出。出。高尔顿发现一个趋势:高尔顿发现一个趋势:父母高,儿女也高;父母矮,儿女也矮。但给定父母的身高,父母高,儿女也高;父母矮,儿女也矮。但给定父母的身高,儿女辈的平均身高却趋向于或者儿女辈的平均身高却趋向于或者“回归回归”到全体人口的平均身到全体人口的平均身高。换言之,尽管父母都异常高或异常矮,但儿女的身高却有高。换言之,尽管父母都异常高或异常矮,但儿女的身高却有走向人口平均身高的趋势。换句话说,尽管父母都异常矮或异走向人口平均身高的趋势。换句话说,尽管父母都异常矮或异常高,但儿女的身高却有走向人口总体平均身高的趋势。常高,但儿女的身高却有走向人口总体平均身高的趋势。普遍回归
3、定律(普遍回归定律(law of universal regressionlaw of universal regression)一、概述一、概述第一节第一节 回归分析释义回归分析释义 高尔顿的朋友卡尔高尔顿的朋友卡尔.皮尔逊皮尔逊(Karl Pearson)(Karl Pearson)证实证实了他的观点,它收集了了他的观点,它收集了10001000名成员的身高记录发名成员的身高记录发现,对于一个父亲高的群体,儿辈的平均身高低现,对于一个父亲高的群体,儿辈的平均身高低于父辈的身高;而对于一个父亲矮的群体,儿辈于父辈的身高;而对于一个父亲矮的群体,儿辈的平均身高则高于其父亲的身高。用高尔顿的话的
4、平均身高则高于其父亲的身高。用高尔顿的话说,这是说,这是“回归到中等回归到中等”(regression to mediocrity)。回归的定义回归的定义 回归分析是关于研究一个叫做回归分析是关于研究一个叫做因变量因变量的变量的变量对另一个或多个叫做对另一个或多个叫做解释变量解释变量的变量的依赖关系,的变量的依赖关系,其用意在于通过后者(在重复抽样中)的已知或设其用意在于通过后者(在重复抽样中)的已知或设定值,去估计和(或)预测前者的(总体)均值。定值,去估计和(或)预测前者的(总体)均值。例 高尔顿的普遍回归定律高尔顿的普遍回归定律 现代的观点关心的是给定父辈身高的情形下找出儿辈平均现代的观
5、点关心的是给定父辈身高的情形下找出儿辈平均身高的变化。即,一旦知道父辈的身高,怎样预测儿辈的身高的变化。即,一旦知道父辈的身高,怎样预测儿辈的平均身高。平均身高。考虑如下考虑如下散点图(散点图(scatter diagramscatter diagram):对应于任一给定的父亲身高,都有儿子身高的一个分布范围。父亲身高增加,儿子的平均身高也增加。回归线 勾画一条通过这些散点图的直线,以表明儿子的平均身高勾画一条通过这些散点图的直线,以表明儿子的平均身高是怎样随父亲的身高增加而增加是怎样随父亲的身高增加而增加。这这条线叫做回归线条线叫做回归线(regression line)(regressio
6、n line)。如下图是不同年龄处测度的男孩身高的总体分布。身高随如下图是不同年龄处测度的男孩身高的总体分布。身高随着年龄增加而增加,通过给定年龄平均身高画一条线。着年龄增加而增加,通过给定年龄平均身高画一条线。例 菲利普斯曲线菲利普斯曲线 下图给出了历史数据所表现的散点图,图中的曲线是把货下图给出了历史数据所表现的散点图,图中的曲线是把货币工资变化率同失业率联系起来的菲利普斯曲线币工资变化率同失业率联系起来的菲利普斯曲线(Phillips(Phillips curve)curve)之一例。之一例。该散点图可预测在给定的某个失业率下货币工资的平均变化。例 通货膨胀率通货膨胀率 由货币经济学中得
7、知,其他条件不变,通货膨胀率由货币经济学中得知,其他条件不变,通货膨胀率 越高,越高,人们愿意以货币形式保存的收入比例人们愿意以货币形式保存的收入比例k k越低。如下图越低。如下图。可预。可预测测在各种通货膨胀率下人们愿意以货币形式保存的收入比例。在各种通货膨胀率下人们愿意以货币形式保存的收入比例。经济学家想研究个人消费支出对可支配个人收入的依经济学家想研究个人消费支出对可支配个人收入的依赖关系。这种分析有助于估计边际消费倾向(赖关系。这种分析有助于估计边际消费倾向(MPCMPC),),也就是实际收入每元价值的变化所引起的消费支出的也就是实际收入每元价值的变化所引起的消费支出的平均变化平均变化
8、。一位能设定价格或产出的垄断商,想知道产品需求对一位能设定价格或产出的垄断商,想知道产品需求对价格变化的实际反应,通过定价实验能估计出产品需价格变化的实际反应,通过定价实验能估计出产品需求的价格弹性(求的价格弹性(price elasticityprice elasticity),即产品需求对价),即产品需求对价格变化的灵敏程度,从而有助于确定最有利可图的价格变化的灵敏程度,从而有助于确定最有利可图的价格。格。其 他 例 子其 他 例 子 公司的销售部主任想知道人们对公司产品的需求与广告公司的销售部主任想知道人们对公司产品的需求与广告费开支的关系。这种研究在很大程度上有助于计算出相费开支的关系
9、。这种研究在很大程度上有助于计算出相对于广告费支出的需求弹性,即广告费预算每变化百分对于广告费支出的需求弹性,即广告费预算每变化百分之一时需求变化的百分比。有助于制定之一时需求变化的百分比。有助于制定“最优最优”广告费广告费预算预算。农业经济学家想研究作物(如小麦)收成对气温、降雨农业经济学家想研究作物(如小麦)收成对气温、降雨量、阳光量和施肥量的依赖关系。这种依赖关系分析能量、阳光量和施肥量的依赖关系。这种依赖关系分析能使他对给定的解释变量进行信息预测或预报作物的平均使他对给定的解释变量进行信息预测或预报作物的平均收成。收成。计量经济研究是对经济变量之间关系的研究,针对某一具体计量经济研究是
10、对经济变量之间关系的研究,针对某一具体经济问题展开研究时,首先需要考察的就是相关经济变量之间有经济问题展开研究时,首先需要考察的就是相关经济变量之间有没有关系、有什么样的关系。没有关系、有什么样的关系。确定的函数关系确定的函数关系 不确定的相关关系不确定的相关关系 经济变量之间的关系经济变量之间的关系 第二节第二节 经济变量之间的关系经济变量之间的关系函数关系函数关系 指某一经济变量可直接表示为其他经济变量的确定的函数,指某一经济变量可直接表示为其他经济变量的确定的函数,函数表达式中没有未知参数。函数表达式中没有未知参数。1)某一商品的销售收入某一商品的销售收入Y与单价与单价P、销售数量、销售
11、数量Q之间的关系之间的关系Y=PQ 2)某一农作物的产量某一农作物的产量Q与单位面积产量与单位面积产量q、种植面积、种植面积S之间的关系之间的关系 Q=q S例如例如:相关关系相关关系 指不同经济变量的变化趋势之间存在某种不确定的联系,某一或指不同经济变量的变化趋势之间存在某种不确定的联系,某一或某几个经济变量的取值确定后,对应的另一经济变量的取值虽不能唯某几个经济变量的取值确定后,对应的另一经济变量的取值虽不能唯一确定,但按某种规律有一定的取值范围。一确定,但按某种规律有一定的取值范围。居民消费居民消费C与可支配收入与可支配收入Y之间的关系,可支配收入的取值确定后,之间的关系,可支配收入的取
12、值确定后,消费的取值虽不能唯一确定,但有一定的取值范围,消费的取值虽不能唯一确定,但有一定的取值范围,0 C Y,遵,遵循边际消费倾向递减的规律。居民消费循边际消费倾向递减的规律。居民消费C与可支配收入与可支配收入Y之间的关系之间的关系可表示为可表示为C=+Y,、为待估参数。为待估参数。例如例如:相关关系的表达式一般表示为含有未知参数的函数形式,需要进行参数估计。相关关系的表达式一般表示为含有未知参数的函数形式,需要进行参数估计。第三节第三节 符号术语数据符号术语数据因变量(Dependent variable)解释变量(Explanatory variable)被解释变量(Explained
13、 variable)自变量(Independent variable)预测子(Predicted)预测元(Predictor)回归子回归子(Regressand)回归元(回归元(Regressor)响应(Response)刺激变量(Stimulus)内生(Endogenous)外生(Exogenous)结果(outcome)共变(Convariate)被控变量(Controlled variable)控制变量(Control variable)如果我们研究一个变量对一个解释变量的依从关系,如消费如果我们研究一个变量对一个解释变量的依从关系,如消费支出对实际收入的依赖,则称这种研究为支出对实际收
14、入的依赖,则称这种研究为简单(简单(simple)或双)或双变量回归分析变量回归分析(two-variable regression analysis)。如果我们研究一个变量对多个解释变量的依赖性,如农作物如果我们研究一个变量对多个解释变量的依赖性,如农作物收成依赖降雨、气温、阳光和施肥一例,则称它为收成依赖降雨、气温、阳光和施肥一例,则称它为复回归分析复回归分析(multiple regression analysis)。换句话说,在双变量回归中只有一个解释变量,在复回归换句话说,在双变量回归中只有一个解释变量,在复回归中则有多于一个解释变量。中则有多于一个解释变量。符号符号 字母字母Y一律
15、指因变量,而一律指因变量,而 一律一律指解释变量。指解释变量。Xk代表第代表第k个解释变量。个解释变量。Xki 指对变量指对变量Xk 的第的第i次观测值。次观测值。N或或T指总体中的观测值的总个数,指总体中的观测值的总个数,n或或t指样本中观测值总个数。指样本中观测值总个数。惯例:惯例:将下标将下标i用于用于横截面数据横截面数据(cross-sectional data)(即(即在一个时间点上收集的数据)在一个时间点上收集的数据);将小标将小标t用于用于时间序列数据时间序列数据(time series data)(即在即在一段时间点上收集的数据一段时间点上收集的数据)。数据1)时间序列数据;)
16、时间序列数据;2)横截面数据;)横截面数据;3)面板数据;)面板数据;1)时间序列数据;)时间序列数据;Table I.1Data on Y(Personal Consumption Expenditure)and X(Gross Domestic Product),1982-1996)all in 1992 billions of dollars19823081.54620.319833240.64803.719843407.65140.119853566.55323.519863708.75487.719873822.35649.519883972.75865.219894064.6606219904132.26136.319914105.86079.419924219.86244.419934343.66389.6199444866610.719954595.36742.119964714.16928.4特点:可以在有规则的时间间隔收集特点:可以在有规则的时间间隔收集Example:每日(股票价格)、每周(联邦储备委员会提供的货币供:每日(股票价格)、每周(联邦储备委员会提供的货