搜索
您的当前位置:首页第五章计量经济学

第五章计量经济学

来源:乌哈旅游
 第五章 多元线性回归

第一部分 学习目的和要求

本章主要介绍了多元线性回归模型的内容。需要掌握并理解以下问题: (1)掌握经典多元线性回归的概念及模型、线性模型的假设条件。 (2)掌握参数的最小平方估计法。 (3)了解向量函数微分的概念。

(4)掌握参数,2的估计量的分布及其性质。

(5)了解概率极限的概念及性质。

(6)掌握参数的无偏估计,极大似然估计,一致估计。

(7)掌握参数的假设检验方法,包括单一线性约束的显著性检验和一般线性假设的检验。

(8)掌握参数的区间估计方法,包括参数向量的区间估计,单个参数的区间估计,几个参数的区间估计。

(9)掌握总体均值的预测,包括点预测和区间预测。掌握总体特定值的预测和区间预测。

第二部分 练习题 一﹑术语解释

1.多元线性回归模型

2.多元线性回归的Gauss-Markov定理 3.概率极限

4.多元线性回归的极大似然估计 二﹑问答

1.多元线性回归模型的假设条件是什么? 2.求系数的最小二乘估计时,是否需要多元线性模型的假设条件? 3.参数和的最小二乘估计是什么?

4.参数和的极大似然估计是它们的无偏估计吗? 5.概率极限与通常所说的极限有什么不同? 三、计算证明题

1.建立一个多元线性回归模型:yi12x2i3x3iui ①

对其中的自变量x2i建立另外一个多元线性回归模型:x2i12x3iui' ②

''*得到回归残差u,最后建立回归模型:yiui3x3iui ③

2

2

'i'1'2 证明:222.对模型yi01x1i2x2ikxkii应用最小二乘法,得到回归方程:

' 1

xxx yi011i22ikkiyi不相关,即 证明:残差iyiyi与yii0

3.设有模型yi01x1i2x2ikxkii,应用OLS法,得回归方程:

xxx yi011i22ikkiy 证明:yt8.5620.364P0.004P 4.考虑以下方程(括号内为估计标准差)Stt1 (0.080) (0.072)

n=19,R2=0.873;

其中:St年的销售量 Pt年的广告费用 请回答下列问题:

(1)对销售量估计的斜率系数进行假设检验。

(2)讨论Pt1在理论上是否正确,对本模型的正确性进行讨论。Pt1是否应从方程中删除?为什么?

5.已知线性回归模型YXU式中U(0,2I),n13且k3(n为样本量,k为参数个数),由二次型(YX)(YX)的最小化得到如下线性方程组:

'4262123411022318; 121621223请回答以下问题:

(1)把问题写成矩阵向量的形式,用求逆矩阵的方法求解。

。 (2)如果YY106,求'2的方差协方差矩阵。 (3)求出6.为了确定对空调价格的影响因素,B.T.katchford根据19个样本数据得到的回归结果如下:

i Y68.260.0X22i319.X3i7292R,X47.6530.84 i se (0.005) (8.992) (3.082)

其中:Y空调的价格/美元 X2空调的BTU比率

2

X3能量效率 X4设定数

(1)解释这个回归方程式的回归结果。 (2)该回归结果是否有经济意义?

7.根据美国1965-ⅠQ至1983-ⅡQ数据(n26),James Doti与Esmael Adibi得到下面的回归方程以解释美国个人的消费支出(PCE):

t10.960.93X2.09X Y2t3t2(249.06) (-3.09) R0.999 6t(-3.33)

F93753.7

其中:Y个人消费支出/亿美元 X2可支配(税后)收入/亿美元 X3银行支付的主要利率(%)

(1)求边际消费倾向(MPC)--每额外增加1美元个人可支配收入所增加的消费支出的数

量。

(2)解释模型的经济意义。

(3)通过计算检验下述零假设:MPC显著不为1。 (4)检验零假设:b3显著不为零。 (5)检验假设:R0。 (6)计算每个系数的标准差。

8.设模型为y01x12x2,y,x1,x2的观察值如表一,试用OLS法对该模型进行多元线性回归分析。

y x1 3 1 8 3 5 3 1 5 2 4 2x2 5 4 6 4 6

第三部分 参考答案 一﹑术语解释

1.多元线性回归模型:

3

设f(x1,x2,,xk)是x1,x2,,xk的线性函数,则模型为:

y01x12x2kxk (1)其中,为随机变量。

0为常数项,它反映了度量原点的选定。称i(i1,2,,k)为回归系数,它反映了

xi(i1,2,,k)变动一个单位时y的改变量。给定(y;x1,x2,,xk)的n次观察值:

y1y2ynx11x21x ,,,n1,

x1kx2kxnk其中,xij是变量xj的第i次观测值,

yi01xi12xi2kxiki,i1,2,,n,其中i表示随机误差项在第i次观

1x111x21察中所取的值。记X1xn1x12x1k11x22x2k22,,,则多元线性回

xn2xnkkn归模型有矩阵形式:YX。

2.多元线性回归的Gauss-Markov定理:

在满足多元线性回归模型的基本假设条件下,该基本假设条件包括Gauss-Markov假定,即① D(i)2In,i1,2,,n,0,称i具有方差齐性;② cov(i,j)0,

2ij,i,j1,2,,n,这称i没有序列相关。在满足上面假定下,在的所有线性无偏

的方差最小,即OLS估计的是的最优线性无偏估计估计类中,其OLS估计的(BLUE),这称为多元线性回归的Gauss-Markov定理。 3.概率极限:

(n)(n){}设是参数的一个估计值,如果limP{||}1,即对任意小的正数n(n)(n)及存在一样本容量n0,当nn0时,有P{||}1,则称依概率收敛(n)(n)(n)于,即是的概率极限,也可以说,是的一致估计,记为:Plim。

4.多元线性回归的极大似然估计:

多元线性回归模型YX,E()0中参数向量的极大似然估计,记2In, 则y1,

y2,,yn的联合概率密度函数为:

4

1f(y)(2)1/2||1/2exp{(yX)'1(yX)}

2 (2)n2nexp{122(yX)'(yX)}

n2即似然函数为:L(y1,y2,,yn,,)(2)22nexp{212'(YX)(YX)} 2,)maxL(x,,2)成立,使L(x,与与按照参数极大似然估计的定义,取则称(X'X)1X'Y2 为及2的极大似然估计。解得21'een二﹑问答题

1.多元线性回归模型的假设条件是什么? 答:多元线性回归模型的基本假定是:

(1)关于矩阵X的假定:X是确定的k1列数值矩阵,矩阵X的秩k1n。 假设X是确定的k1列数值矩阵有两层含义:①x1,x2,,xk是非随机变量或是可观测变量,更一般的要求是与x1,x2,,xk不相关,即E(i|X)0,从而cov(i,X)0。它们所取的值是可以控制的,②X是确定的数值,在变量x1,x2,,xk是y误差的唯一来源。中没有遗漏重要的变量也没有包含不相干的变量。关于矩阵X的秩,因为矩阵X的秩为k1,所以X的列向量线性无关,因而没有一个变量可以由其他变量表示,此时秩

(X'X)k1,即X'X非奇异。且当k1n时,待估参数的个数小于观测次数。

(2)关于随机扰动项的假定:服从均值为0﹑协方差矩阵为2In的多维正态分布,即N(0,2In)。该式有两层含义:① E()0即每一个随机扰动项的期望都为0; ② D()2In,它包括Gauss-Markov假定,即D(i)2In,i1,2,,n,

02,称i具有方差齐性; cov(i,j)0,ij,i,j1,2,,n,这称i没有

序列相关。

2.求系数的最小二乘估计时,是否需要多元线性模型的假设条件?

(X'X)1X'Y可答:对系数的最小二乘估计时,需要多元线性模型的假设条件。由 知,有关矩阵X的假定:X是确定的k1列数值矩阵,矩阵X的秩k1n需要满足,

'。此时系数的估计值有且仅有唯一解。若(XX)k1,即XX奇异,不能得到估计量

' 5

3.参数和的最小二乘估计是什么?

2

(,,,)',称 答:给定线性模型YX,记未知参数变量的估计量为12k2为估计的残差向量,则残差平方和为SE我们的目的是寻找的ei2e'e,eYXi1n,使得残差ee达到最小。由于残差是非负的,故存在最小值,且由极值存在的必估计量'

e'eX'Y,要条件,有通过矩阵微分运算可以解得X'X称该式为正规方程组。|0,

(X'X)1X'Y,称此估计量为的最小二乘估计量。2的最小又因为XX可逆,所以'2二乘估计为e'e。

nk14.参数和的极大似然估计是它们的无偏估计吗?

答:多元线性回归模型YX,E()0中参数向量的极大似然估计,记

2

2In,则y1,y2,,yn的联合概率密度函数为:

1f(y)(2)1/2||1/2exp{(yX)'1(yX)}

2 (2)n2nexp{12'(yX)(yX)} 2即似然函数为:L(y1,y2,,yn,,)(2)2n2nexp{122(YX)'(YX)}

222与按照参数极大似然估计的定义,取与使L(x,,)maxL(x,,)成立,则称(X'X)1X'Y2,可见的MLE估计和OLS估计为及2的极大似然估计。解得21'een2相同。由于e'e222是有偏的,其中是的无偏估计量,可见的MLE估计nk1eyiyi。

5.概率极限与通常所说的极限有什么不同?

6

(n)(n)答:概率极限的意义是:设{}是参数的一个估计值,如果limP{||}1,

n即对任意小的正数及存在一样本容量n0,当nn0时,有P{|(n)(n)则称依概率收敛于,即是的概率极限。

(n)|}1,

(n)(n)通常意义下的极限是指:设{}是参数的一个估计值,如果lim,即对任

n意小的正数存在一样本容量n0,当nn0时,有|(n)|,则称(n)

的极限是。

对比通常意义下的极限定义和概率极限的定义可以看出,概率极限的定义是建立在概率

基础之上。 三、计算证明题

1.证明:由②式的回归模型:x2i12x3iui',对其进行回归估计得:

i'x12x,代入最后的模型③ y''ui''xu*,得: u2i3ii1233ii*'yi(x2i12x3i)3x3ii

'1'2*'''''()x()x i 12122i3223i。 将这个结果与模型① yi12x2i3x3iui相比可知:22'原因是i代表的是与x3i无关的x2i部分,所以x3i的回归系数不受影响。

'2.证明:将该回归方程两边乘以i再求和得:

yiii0i1x1ii2x2iikxkii

由多元线性回归模型的基本假设可知:

xx1ii2iixkii0

所以有:

yiiyi不相关。 0,即i与3.证明:由回归方程知:

yx1x2xk 因为012k 将0代入回归方程得:

(xxi)(xx2)(xxk) yiy11i2k2ikix y11i2x2ikxki

对该式两端分别求和:

7

其中

xx1i2iki0 x1yiy n(pt1) + 0.056 不显著 所以有

yiny 即 y4.答:(1)对给定在5%的显著水平,可以进行t检验得到结果如下表:

系数 假设符号 T值 5%显著水平  (pt)+ 4.55 显著 (2)由于Pt1不显著,可以将其从方程中删去,此时由于时滞短了一年,主成分可能正确,但时滞长度不正确。在这样的情况下,利用同样的数据检验许多不同的时滞,可能不是

个好方法,但如果可以建立另外一个数据集,这样检验也许是有用的。 5.答:(1)方程组的矩阵向量形式可以写成:

24216X'Y, ;即(X'X)4102182221216311242634102181,即(X'X)1X'Y; 2322121622(2)(TSSRSS)/(nk)

(10636118216)/(133) 3.8

的方差协方差矩阵: (3)6.5352.4750.6752422)(X'X)13.841022.4751.1250.225Vcov( 0.6750.2250.61922126.答:(1)该模型的回归结果表明空调价格与BTU比率、能量效率、设定数有关,相关系

数分别为0.023,19.729,7.653。

(2)该回归结果的经济意义在于揭示了影响空调价格的因素,表明空调价格与BTU比率、能量效率、设定数有关,相关系数分别为0.023,19.729,7.653。 7.答:(1)MPC=0.93

(2)美国个人消费与个人收入和银行利率相关。 (3)H0:B21,H1:B21

8

1 t0.9310.93/249.0618.7467,d.f.=23时,p值=0.000

∴可以拒绝假设H0:B21 ∴MPC不显著为1。

(4)∵t3.09,可知p值位于0.001与0.005之间,很小。 ∴b3显著不为零。 (5)H0:R20,H1:R20 d.f.=2.23,F=93753.7

显然F值高度显著,可以拒绝H0:R20 (6)se(b1)10.96/3.333.2913 se(b2)0.93/249.060.0037 se(b3)2.09/3.090.6764 8.答:由表一得:

313511114Y8 X562 31241 5146501;其中Y是5×1矩阵,X是5×3矩阵,是5×1矩阵,是3×1矩阵。2则有矩阵形式表示为:YX

第一步,计算所有变量观察值的和,平方和以及交叉乘积和: x1i15 x2i25

Yi20

x21i55

x22i129 y2i108

x1ix2i81

x1iyi76

yix2i109

第二步,计算参数估计值:

9

x1ix2iX'X521i2ix1ixx1ix x2ix1ix2ix22i52 15155585258111 298逆矩阵:(X'X)126.74.54.511.581.52.5 yi又有:X'Y20x1iyi76

yix2i1094于是:(X'X)1X'Y2.5 1.5第三步:计算参数估计量的标准差估计值:

Y'Yy2i108

'X'Y106.5 'Y'YX'Y1.5 '2u20.75

V(0)2u(X'X)100155.025 V(21)u(X'X)1110.75 V(2)2u(X'X)1221.875

S(0V0)12.45 S1V(1)0.87 SV2(2)1.37 第四步:方差分析和拟和优度:

回归平方和RSS'X'Yny2106.58026.5

10

剩余平方和ESS1.5

2(y)iX'Y10R20.9464 2(y)Y'Yi10''可见,拟合比较好。 第五步,回归分析结果:

yi42.5x1i1.5x2i

第六步,预测:

预测当x13,x24时y的值,则y42.531.545.5即为E(y)的无偏估计量。

 11

因篇幅问题不能全部显示,请点此查看更多更全内容

Top