![伍德里奇《计量经济学导论》(第5版)笔记和课后习题详解](https://wfqqreader-1252317822.image.myqcloud.com/cover/896/27050896/b_27050896.jpg)
5.2 课后习题详解
一、习题
1.在满足假定MLR.1到MLR.4的简单回归中,我们证明了斜率估计量是
的一致估计。
利用证明:
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image744.png?sign=1739366200-gdJFPG187sQhb465Roiz9Cv0i2AH7kSo-0-2e9d2d04b53e27dec6a4bfd5cd0d8890)
[你在使用的同时,还需要使用
的一致性和大数定律。]
证明:简单模型为:
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image746.png?sign=1739366200-KnuxC5PKyMFIokn507zQUksKOE0Jb8y5-0-023b0a6fec86c76f3fad8f482d79a298)
期望值是
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image747.png?sign=1739366200-rybl6tEhyQFuMxVwqatc90loeBPudU1D-0-23b54a722b5eef43d28b2b2a5bf32fe8)
因为,
,
,故
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image751.png?sign=1739366200-gqLLZdtPTKaXIf3EWmbyVSuF7CZHoMFe-0-c34844016761a7c17e1a6831c869300e)
移项可得
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image752.png?sign=1739366200-UMr5qlYxvqVk8kbI3dKU66qN5c8co15p-0-ab5e631509c6b95bc1c5a2ab096343f4)
则有
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image753.png?sign=1739366200-q5xvvmNZ3WG9DwYfE92K6zGDvDCdB063-0-c0763916b37c2f94e7386abd1a5f3f09)
根据大数定律
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image754.png?sign=1739366200-CC2vgNZGeyN2QcbAJWrrGgxS64Sl9vNu-0-a90075d9e60e97038cff055d3090cb51)
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image755.png?sign=1739366200-bjZK2hJ1y6mFlaoOhOIoxndR17aVevCI-0-551f7324a27124f302fff9d12a4d0931)
又
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image756.png?sign=1739366200-C5r5avx1hc4L0QiL47Is1IT6BXOLWxPs-0-41cb3a1c2fb788915aa15b8a3c1c74dc)
则对等式两边同时取概率极限得:
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image758.png?sign=1739366200-GGShBme4W3HeRVG2xuTW3zOMaqHkzxNP-0-0fe71879c5c6e50e0feead6f0fde5f4a)
2.假设模型
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image759.png?sign=1739366200-vAZDMU77mKYxMcvEGKIhHlGZYprZv1am-0-c009d0dc1efc92c0bca8144c3016f4a3)
满足前四个高斯—马尔科夫假定,其中,pctstck表示工人养老金投资于股票市场的百分比,funds表示工人可以选择的共同基金的个数,而risktol表示对风险承受能力的某种度量(risktol越大,则表明这个人对风险的承受能力越强)。如果funds和risktol正相关,pctstck对funds简单回归的斜率系数有怎样的不一致性?
答:对风险的承受能力越强,就更愿意在资本市场上投资,因此。假定可供选择的共同基金的个数与个人承受风险的能力是正相关的,使用公式5.5
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image760.png?sign=1739366200-cj4k0QPV4qoEyiLS4Rh3CrQ4sSFVgsQi-0-76eacaf77e879feb88bbffc4bf030790)
因此有一个正的不一致性(渐进偏误)。这个结论是有意义的,如果省略个人对风险的承受能力这一变量,而它与可选择的共同基金个数相关,因此估计出来的funds对pctstck的影响实际上包括了risktol对pctstck的影响。
3.数据集SMOKE.RAW包含美国成人个人随机样本在抽烟行为和其他变量方面的信息。变量cigs为(平均)每天抽烟的数量。你是否认为在美国这个总体中,cigs具有正态分布?试做解释。
答:在美国这个总体中,cigs不具有正态分布。大多数人不抽烟,因此对一半以上的美国人而言,cigs=0,故正态分布随机变量的概率大于零并没有特殊的意义。另外,cigs的分布是左偏的,而正态分布随机变量是对称的。
4.在简单回归模型教材(5.16)中,我们在前4个高斯—马尔科夫假定下证明了,形如教材(5.17)的估计量是斜率的一致估计量。给定这样一个估计量,定义
的一个估计量为
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image761.png?sign=1739366200-hNzoH9lJ3AIyD2oeDJTq8OVhc6gPekrL-0-654c04e8dfba516d60928628adc4369b)
证明
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image762.png?sign=1739366200-M9CNiuCtAgOe2lNVw9vqHUL6NlzDYTYc-0-ba54a9c9fa88e41cfa3da114d80676e3)
证明:简单回归模型为:
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image763.png?sign=1739366200-VCHgBJgMJocKmw60F8l7psFRaVf4F8oU-0-e5c30ae585f0c618ba9b38296aa8c2eb)
则其期望值是:
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image764.png?sign=1739366200-YqhXn8Dd6iZvAhscz1LqBAJqRuC1KnKe-0-90c7fe0e138ee6c2d4c0c1d0313123e1)
或
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image765.png?sign=1739366200-jHVmzjSpbg8vCJylTWOOmrOOWq1oGln9-0-3eb917eadc00cb9ad32a7df4c8c87795)
因为,则
,
。因此
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image766.png?sign=1739366200-bTskmq1UJs6oTMhvZgueFs0tkFGUut96-0-eb15e86fd963fb438249cffe1c22bc18)
则
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image767.png?sign=1739366200-t9MhCZlYUHcEvhxU3hNyoHVlUN7moTZC-0-8e5ede793ddffd5fdf8edf295eafaf99)
现在
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image768.png?sign=1739366200-22CHilJZk63OJydUEqluGJnu2OYg16rx-0-ef6233b6229800e46d5bc20af20c1823)
可得:
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image769.png?sign=1739366200-ikGRIt9eZzExruqiYiky0RC4SxiwqBi6-0-895a354a7b9a66a0145fc6945cad2d66)
根据大数定律可知:
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image770.png?sign=1739366200-rAX1gcGoT8ukxzwZgJ0Zkey8k7xqkwEH-0-8d2d2647a970fe5ecc13198c193267c2)
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image771.png?sign=1739366200-Ch4mCLQUwiOlcPtoLQXjt3FqFUhNs2pJ-0-db89845ffffae51d1ec5b83606dca21e)
因此
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image772.png?sign=1739366200-6ZO1zrI1nWUa5lLzpCLKPIygGEWsLZZE-0-7401d84bb5150fa36e954a539d817c91)
二、计算机练习
C1.本题使用WAGE1.RAW中的数据。
(i)估计方程
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image773.png?sign=1739366200-wUlIWiINTyvkGgwCoYcJXRtf9f9uMOcE-0-7d70a2a21fa09932265b91cc4632ba9f)
保留残差并画出其直方图。
(ii)以log(wage)作为因变量重做第(i)部分。
(iii)你认为是水平值—水平值模型还是对数—水平值模型更接近于满足假定MLR.6?
答:(i)估计模型为:
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image774.png?sign=1739366200-R8jMGR1d4gFgLCKazlyFZhuZM6rUda7c-0-29ff2a11484620abea7f31a1673c0908)
526个残差,
的直方图如图5-1所示,根据STATA手册中的公式对526个观测值在直方图中使用了27个排序格,通过对比正态分布是适合图中描绘内容的数据分布。
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image776.jpg?sign=1739366200-bLNBcijpJnkU9fRxw7L4kkQOe91eNU2y-0-89ba5c8c160e413ba753047b62b23bb1)
图5-1
(ii)log(wage)作为因变量的估计方程为:
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image777.png?sign=1739366200-3rTbKfezT78tpyIz3nxubkfDNqEstNNY-0-cdfff4e536cdc69992e1a11f1f887ea7)
从方程中推出的残差直方图,以及最合适的正态分布重叠图如图5-2所示:
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image778.jpg?sign=1739366200-sXH413NHS51JxOcozBBMlwib2Yo1vTiU-0-6eff15c2f4ac808adf4eda20adb14852)
图5-2
(iii)log(wage)回归的残差看起来更符合正态分布,第(ii)部分的直方图的分布密度比第(i)部分直方图更好。wage残差直方图是显著左偏的。在wage的回归中,存在一些很大的残差(甚至等于15),这是基于残差平均值等于0的标准估计误差()很难支持的。在对数—水平值模型中残差不等于0并没有造成太大的问题,因此,对数—水平值模型更接近于满足假定MLR.6。
C2.本题使用GPA2.RAW中的数据。
(i)使用所有4137个观测,估计方程
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image780.png?sign=1739366200-5ZsszplHHZpf0VuzJN3CYmNQQ6FTfAVS-0-ab49a818827a73fc24838b3215a7105d)
并以标准形式报告结论。
(ii)使用前2070个观测再重新估计第(i)部分中的方程。
(iii)求出第(i)部分与第(ii)部分所得到的标准误的比率。并将这个比率与教材(5.10)中的结论相比较。
答:(i)4137个观测值的回归模型为:
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image781.png?sign=1739366200-i31jVNeQHGtRPwrPZHV5JnUnt5oD9Rvx-0-25908d25f7c2a649369ffa49c8b99144)
(ii)使用开始的2070个观测值的回归模型为:
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image782.png?sign=1739366200-iRxku0D2qpQMJO1M0XqFPc1YkObtgL0z-0-27ea793dba4c319ba5d5c63ae17a1393)
(iii)使用2070个观测值的标准误与使用4137个观测值的标准误的比率为1.31。根据教材5.10的经验法则,预期标准误的收缩速度为样本容量平方根的倒数。本题中,大于真实标准误的比率,即标准误的收缩速度略慢于样本容量变化速度。
C3.(i)根据第4章的计算机练习C6在第(i)部分中的等式:
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image784.png?sign=1739366200-fciN3KBH8Zd5VRMl3c4HOCouK94DNzya-0-084103c5f0a77034c6daccd768498a2d)
获得对于原假设为的LM统计量。
(ii)对于第(i)部分中的检验获得(渐进的)p值。
答:(i)首先进行约束模型的回归,然后将约束回归所得残差对所有变量进行回归为:
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image787.png?sign=1739366200-Um6n0TJ9om5sIAGKkmsBKtkSBSaxqNg4-0-cd12ceb7d24a3bf16e5760ff4b99a8fd)
构造LM统计量:
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image788.png?sign=1739366200-irSUUWYIA8z5tpWT7wtPeqeqWOZU4SOU-0-7a9d806da6d1ec16682c7d9fdcb665d0)
因为q等于2,故,置信水平为95%的临界值为7.378。即LM统计量大于临界值,可以拒绝原假设,认为
不同时为零。
(ii)LM=21.4相对应的p值为0.0002254。