您的当前位置：首页第五章计量经济学

第五章计量经济学

来源：乌哈旅游

第五章多元线性回归

第一部分学习目的和要求

本章主要介绍了多元线性回归模型的内容。需要掌握并理解以下问题：（1）掌握经典多元线性回归的概念及模型、线性模型的假设条件。（2）掌握参数的最小平方估计法。（3）了解向量函数微分的概念。

（4）掌握参数,2的估计量的分布及其性质。

（5）了解概率极限的概念及性质。

（6）掌握参数的无偏估计，极大似然估计，一致估计。

（7）掌握参数的假设检验方法，包括单一线性约束的显著性检验和一般线性假设的检验。

（8）掌握参数的区间估计方法，包括参数向量的区间估计，单个参数的区间估计，几个参数的区间估计。

（9）掌握总体均值的预测，包括点预测和区间预测。掌握总体特定值的预测和区间预测。

第二部分练习题一﹑术语解释

1．多元线性回归模型

2．多元线性回归的Gauss-Markov定理 3．概率极限

4．多元线性回归的极大似然估计二﹑问答

1．多元线性回归模型的假设条件是什么？ 2．求系数的最小二乘估计时，是否需要多元线性模型的假设条件？ 3．参数和的最小二乘估计是什么？

4．参数和的极大似然估计是它们的无偏估计吗？ 5．概率极限与通常所说的极限有什么不同？三、计算证明题

1．建立一个多元线性回归模型：yi12x2i3x3iui ①

对其中的自变量x2i建立另外一个多元线性回归模型：x2i12x3iui' ②

''*得到回归残差u，最后建立回归模型：yiui3x3iui ③

'i'1'2 证明：222．对模型yi01x1i2x2ikxkii应用最小二乘法，得到回归方程：

' 1

xxx yi011i22ikkiyi不相关，即证明：残差iyiyi与yii0

3．设有模型yi01x1i2x2ikxkii，应用OLS法，得回归方程：

xxx yi011i22ikkiy 证明：yt8.5620.364P0.004P 4．考虑以下方程（括号内为估计标准差）Stt1 （0.080）（0.072）

n=19，R2=0.873；

其中：St年的销售量 Pt年的广告费用请回答下列问题：

（1）对销售量估计的斜率系数进行假设检验。

（2）讨论Pt1在理论上是否正确，对本模型的正确性进行讨论。Pt1是否应从方程中删除？为什么？

5．已知线性回归模型YXU式中U(0,2I)，n13且k3（n为样本量，k为参数个数），由二次型(YX)(YX)的最小化得到如下线性方程组：

'4262123411022318； 121621223请回答以下问题：

（1）把问题写成矩阵向量的形式，用求逆矩阵的方法求解。

。（2）如果YY106，求'2的方差协方差矩阵。（3）求出6．为了确定对空调价格的影响因素，B.T.katchford根据19个样本数据得到的回归结果如下：

i Y68.260.0X22i319.X3i7292R，X47.6530.84 i se （0.005）（8.992）（3.082）

其中：Y空调的价格/美元 X2空调的BTU比率

X3能量效率 X4设定数

（1）解释这个回归方程式的回归结果。（2）该回归结果是否有经济意义？

7．根据美国1965-ⅠQ至1983-ⅡQ数据（n26），James Doti与Esmael Adibi得到下面的回归方程以解释美国个人的消费支出（PCE）：

t10.960.93X2.09X Y2t3t2（249.06）（-3.09） R0.999 6t（-3.33）

F93753.7

其中：Y个人消费支出/亿美元 X2可支配（税后）收入/亿美元 X3银行支付的主要利率（%）

（1）求边际消费倾向（MPC）--每额外增加1美元个人可支配收入所增加的消费支出的数

量。

（2）解释模型的经济意义。

（3）通过计算检验下述零假设：MPC显著不为1。（4）检验零假设：b3显著不为零。（5）检验假设：R0。（6）计算每个系数的标准差。

8．设模型为y01x12x2，y,x1,x2的观察值如表一，试用OLS法对该模型进行多元线性回归分析。

y x1 3 1 8 3 5 3 1 5 2 4 2x2 5 4 6 4 6

第三部分参考答案一﹑术语解释

1．多元线性回归模型：

设f(x1,x2,,xk)是x1,x2,,xk的线性函数，则模型为：

y01x12x2kxk （1）其中，为随机变量。

0为常数项，它反映了度量原点的选定。称i(i1,2,,k)为回归系数，它反映了

xi(i1,2,,k)变动一个单位时y的改变量。给定(y;x1,x2,,xk)的n次观察值：

y1y2ynx11x21x ,,,n1，

x1kx2kxnk其中，xij是变量xj的第i次观测值，

yi01xi12xi2kxiki，i1,2,,n，其中i表示随机误差项在第i次观

1x111x21察中所取的值。记X1xn1x12x1k11x22x2k22，，，则多元线性回

xn2xnkkn归模型有矩阵形式：YX。

2．多元线性回归的Gauss-Markov定理：

在满足多元线性回归模型的基本假设条件下，该基本假设条件包括Gauss-Markov假定，即① D(i)2In,i1,2,,n,0,称i具有方差齐性；② cov(i,j)0，

2ij，i,j1,2,,n，这称i没有序列相关。在满足上面假定下，在的所有线性无偏

的方差最小，即OLS估计的是的最优线性无偏估计估计类中，其OLS估计的（BLUE），这称为多元线性回归的Gauss-Markov定理。 3．概率极限：

(n)(n){}设是参数的一个估计值，如果limP{||}1，即对任意小的正数n(n)(n)及存在一样本容量n0，当nn0时，有P{||}1，则称依概率收敛(n)(n)(n)于，即是的概率极限，也可以说，是的一致估计，记为：Plim。

4．多元线性回归的极大似然估计：

多元线性回归模型YX，E()0中参数向量的极大似然估计，记2In，则y1,

y2,,yn的联合概率密度函数为：

1f(y)(2)1/2||1/2exp{(yX)'1(yX)}

2 (2)n2nexp{122(yX)'(yX)}

n2即似然函数为：L(y1,y2,,yn,,)(2)22nexp{212'(YX)(YX)} 2,)maxL(x,,2)成立，使L(x,与与按照参数极大似然估计的定义，取则称(X'X)1X'Y2 为及2的极大似然估计。解得21'een二﹑问答题

1．多元线性回归模型的假设条件是什么？答：多元线性回归模型的基本假定是：

（1）关于矩阵X的假定：X是确定的k1列数值矩阵，矩阵X的秩k1n。假设X是确定的k1列数值矩阵有两层含义：①x1,x2,,xk是非随机变量或是可观测变量，更一般的要求是与x1,x2,,xk不相关，即E(i|X)0，从而cov(i,X)0。它们所取的值是可以控制的，②X是确定的数值，在变量x1,x2,,xk是y误差的唯一来源。中没有遗漏重要的变量也没有包含不相干的变量。关于矩阵X的秩，因为矩阵X的秩为k1，所以X的列向量线性无关，因而没有一个变量可以由其他变量表示，此时秩

(X'X)k1，即X'X非奇异。且当k1n时，待估参数的个数小于观测次数。

（2）关于随机扰动项的假定：服从均值为0﹑协方差矩阵为2In的多维正态分布，即N(0,2In)。该式有两层含义：① E()0即每一个随机扰动项的期望都为0； ② D()2In，它包括Gauss-Markov假定，即D(i)2In,i1,2,,n,

02,称i具有方差齐性； cov(i,j)0，ij，i,j1,2,,n，这称i没有

序列相关。

2．求系数的最小二乘估计时，是否需要多元线性模型的假设条件？

(X'X)1X'Y可答：对系数的最小二乘估计时，需要多元线性模型的假设条件。由 知，有关矩阵X的假定：X是确定的k1列数值矩阵，矩阵X的秩k1n需要满足，

'。此时系数的估计值有且仅有唯一解。若(XX)k1，即XX奇异，不能得到估计量

' 5

3．参数和的最小二乘估计是什么？

(,,,)'，称答：给定线性模型YX，记未知参数变量的估计量为12k2为估计的残差向量，则残差平方和为SE我们的目的是寻找的ei2e'e，eYXi1n，使得残差ee达到最小。由于残差是非负的，故存在最小值，且由极值存在的必估计量'

e'eX'Y，要条件，有通过矩阵微分运算可以解得X'X称该式为正规方程组。|0，

(X'X)1X'Y，称此估计量为的最小二乘估计量。2的最小又因为XX可逆，所以'2二乘估计为e'e。

nk14．参数和的极大似然估计是它们的无偏估计吗？

答：多元线性回归模型YX，E()0中参数向量的极大似然估计，记

2In，则y1,y2,,yn的联合概率密度函数为：

1f(y)(2)1/2||1/2exp{(yX)'1(yX)}

2 (2)n2nexp{12'(yX)(yX)} 2即似然函数为：L(y1,y2,,yn,,)(2)2n2nexp{122(YX)'(YX)}

222与按照参数极大似然估计的定义，取与使L(x,,)maxL(x,,)成立，则称(X'X)1X'Y2，可见的MLE估计和OLS估计为及2的极大似然估计。解得21'een2相同。由于e'e222是有偏的，其中是的无偏估计量，可见的MLE估计nk1eyiyi。

5．概率极限与通常所说的极限有什么不同？

(n)(n)答：概率极限的意义是：设{}是参数的一个估计值，如果limP{||}1，

n即对任意小的正数及存在一样本容量n0，当nn0时，有P{|(n)(n)则称依概率收敛于，即是的概率极限。

(n)|}1，

(n)(n)通常意义下的极限是指：设{}是参数的一个估计值，如果lim，即对任

n意小的正数存在一样本容量n0，当nn0时，有|(n)|，则称(n)

的极限是。

对比通常意义下的极限定义和概率极限的定义可以看出，概率极限的定义是建立在概率

基础之上。三、计算证明题

1．证明：由②式的回归模型：x2i12x3iui'，对其进行回归估计得：

i'x12x，代入最后的模型③ y''ui''xu*，得： u2i3ii1233ii*'yi(x2i12x3i)3x3ii

'1'2*'''''()x()x i 12122i3223i。将这个结果与模型① yi12x2i3x3iui相比可知：22'原因是i代表的是与x3i无关的x2i部分，所以x3i的回归系数不受影响。

'2．证明：将该回归方程两边乘以i再求和得：

yiii0i1x1ii2x2iikxkii

由多元线性回归模型的基本假设可知：

xx1ii2iixkii0

所以有：

yiiyi不相关。 0，即i与3．证明：由回归方程知：

yx1x2xk 因为012k 将0代入回归方程得：

(xxi)(xx2)(xxk) yiy11i2k2ikix y11i2x2ikxki

对该式两端分别求和：

其中

xx1i2iki0 x1yiy n(pt1) + 0.056 不显著所以有

yiny 即 y4．答：（1）对给定在5%的显著水平，可以进行t检验得到结果如下表：

系数假设符号 T值 5%显著水平  (pt)+ 4.55 显著（2）由于Pt1不显著，可以将其从方程中删去，此时由于时滞短了一年，主成分可能正确，但时滞长度不正确。在这样的情况下，利用同样的数据检验许多不同的时滞，可能不是

个好方法，但如果可以建立另外一个数据集，这样检验也许是有用的。 5．答：（1）方程组的矩阵向量形式可以写成：

24216X'Y，；即(X'X)4102182221216311242634102181，即(X'X)1X'Y； 2322121622（2）(TSSRSS)/(nk)

(10636118216)/(133) 3.8

的方差协方差矩阵：（3）6.5352.4750.6752422)(X'X)13.841022.4751.1250.225Vcov( 0.6750.2250.61922126．答：（1）该模型的回归结果表明空调价格与BTU比率、能量效率、设定数有关，相关系

数分别为0.023，19.729，7.653。

（2）该回归结果的经济意义在于揭示了影响空调价格的因素，表明空调价格与BTU比率、能量效率、设定数有关，相关系数分别为0.023，19.729，7.653。 7．答：（1）MPC=0.93

（2）美国个人消费与个人收入和银行利率相关。（3）H0:B21,H1:B21

1 t0.9310.93/249.0618.7467，d.f.=23时，p值=0.000

∴可以拒绝假设H0:B21 ∴MPC不显著为1。

（4）∵t3.09，可知p值位于0.001与0.005之间，很小。 ∴b3显著不为零。（5）H0:R20,H1:R20 d.f.=2.23,F=93753.7

显然F值高度显著，可以拒绝H0:R20 （6）se(b1)10.96/3.333.2913 se(b2)0.93/249.060.0037 se(b3)2.09/3.090.6764 8．答：由表一得：

313511114Y8 X562 31241 5146501；其中Y是5×1矩阵,X是5×3矩阵,是5×1矩阵,是3×1矩阵。2则有矩阵形式表示为：YX

第一步，计算所有变量观察值的和，平方和以及交叉乘积和： x1i15 x2i25

Yi20

x21i55

x22i129 y2i108

x1ix2i81

x1iyi76

yix2i109

第二步，计算参数估计值：

x1ix2iX'X521i2ix1ixx1ix x2ix1ix2ix22i52 15155585258111 298逆矩阵：(X'X)126.74.54.511.581.52.5 yi又有：X'Y20x1iyi76

yix2i1094于是：(X'X)1X'Y2.5 1.5第三步：计算参数估计量的标准差估计值：

Y'Yy2i108

'X'Y106.5 'Y'YX'Y1.5 '2u20.75

V(0)2u(X'X)100155.025 V(21)u(X'X)1110.75 V(2)2u(X'X)1221.875

S(0V0)12.45 S1V(1)0.87 SV2(2)1.37 第四步：方差分析和拟和优度：

回归平方和RSS'X'Yny2106.58026.5

剩余平方和ESS1.5

2(y)iX'Y10R20.9464 2(y)Y'Yi10''可见，拟合比较好。第五步，回归分析结果：

yi42.5x1i1.5x2i

第六步，预测：

预测当x13,x24时y的值，则y42.531.545.5即为E(y)的无偏估计量。

 11

因篇幅问题不能全部显示，请点此查看更多更全内容

查看全文