![伍德里奇《计量经济学导论》(第5版)笔记和课后习题详解](https://wfqqreader-1252317822.image.myqcloud.com/cover/896/27050896/b_27050896.jpg)
第一篇 横截面数据的回归分析
第2章 简单回归模型
2.1 复习笔记
一、简单回归模型的定义
1.简单线性回归模型
一个简单的方程是:
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image028.png?sign=1739365624-5xHV5OQ2ybkqV9MA0fgQwbgPhrL9uoaU-0-3079d529cd5ab997dc297238264bd0b9)
假定方程在所关注的总体中成立,它便定义了一个简单线性回归模型。因为它把两个变量x和y联系起来,所以又把它称为两变量或者双变量线性回归模型。变量u称为误差项或者干扰项,表示除x之外其他影响y的因素。就是y与x的关系式中的斜率参数,表示在其他条件不变的情况下,x变化一个单位y平均变化。
被称为截距参数,在一般的模型中除非有很强的理论依据说明模型没有截距项,否则一般情况下都要带上截距项。
2.回归术语
表2-1 简单回归的术语
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image031.jpg?sign=1739365624-0p3PChiqpM8GmuRIRp8Y1CbGbA8rEEdv-0-2260476c5e81e68f886633c7eaa8d8d7)
3.零条件均值假定
(1)零条件均值
u的平均值与x值无关。可以把它写作:
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image032.png?sign=1739365624-vwy0RN1d61JlqPTuT5HzUZApeTJ58LEm-0-195309e3a86c6ba661706b279ffa9696)
当方程成立时,就说u的均值独立于x。
(2)零条件均值假定的意义
①零条件均值假定给出的另一种非常有用的解释。以x为条件取期望值,并利用
,便得到:
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image034.png?sign=1739365624-KuzGUQo2yHcRwieYU6EK5YnaP8JOxUgX-0-5db805b281687c9d93e98c587eaff419)
方程表明,总体回归函数(PRF)是x的一个线性函数,线性意味着x变化一个单位,将使y的期望值改变
。对任何给定的x值,y的分布都以
为中心。
就是斜率参数。
②给定零条件均值假定,把方程中的y看成两个部分是比较有用的。一部分是表示
的
,被称为y的系统部分,即由x解释的那一部分,另一个部分是被称为非系统部分的u,即不能由x解释的那一部分。
二、普通最小二乘法的推导
1.最小二乘估计值
从总体中找一个样本。令表示从总体中抽取的一个容量为n的随机样本。
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image038.png?sign=1739365624-Zv8HfjeB85jlJOKw0jJhAaeFSxmY3OWE-0-badf635fbb8305f269bfc1219adcb5e7)
在总体中,u与x不相关。因此有:
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image039.png?sign=1739365624-06N7oQgYwVut1mFqFB9bNMtRWRKbVJdq-0-b3dfd7a8cdc124282cb3548463d29ab7)
用可观测变量x和y以及未知参数和
表示为:
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image040.png?sign=1739365624-V6GKGKdGaI3jgrX4NZk3b5b63K4phQtK-0-b60a478b83e357d9d0419047185bd37b)
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image041.png?sign=1739365624-JSFyPDyJMRFlNHVY1npg3rZTiR7lCKiz-0-45834f41c498fe4d6f5accf991eb9ea6)
得到
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image042.png?sign=1739365624-clnSezndmJHBRnbND1Xq1YwDQurbMgpx-0-b103066b9145d889441973f18b8302c3)
和
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image043.png?sign=1739365624-Lf7uUQMO8sRYG3FIVEPGFmF9cZPagCu1-0-09aebc3e7e3980fb243eb45c1848931a)
这两个方程可用来解出和
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image046.png?sign=1739365624-LjYheWgMxqxjuAWepKAJkKruTDAEKGGa-0-ff3311daebbe519ee917dbe5fc6d098d)
则
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image047.png?sign=1739365624-mVe3fMGnX8pYKEzUsf2fFGKAQpPn3Fjo-0-4d5f3263f15222d33f22b32abef597d6)
一旦得到斜率估计值,则有:
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image048.png?sign=1739365624-L1AtUjYsgwviLSWfNPG8gnjD9l13Gidu-0-b39c1df92ff8d43cb0e685535d9a0f70)
整理后便得到:
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image049.png?sign=1739365624-lNaqJdLP18OrruBL1X5NVVHsNGcf36Uq-0-370af179cf7271a2b070e21522f8358e)
根据求和运算的基本性质,有:
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image050.png?sign=1739365624-jQSb3VmKzEfdCXfr8nIwWIsimDUkWHiJ-0-9229ba7b1b59a729da2eb93ec8fd08b4)
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image051.png?sign=1739365624-f5ZT2i7QEdBhFVDihdqY2SZBKv1VsnBt-0-a8fcc8a2e9debd8fae7e32600fa6a488)
因此,只要有
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image052.png?sign=1739365624-nH7VOjKL1rFs5jHI83XqKrfn2rnBj5Qn-0-968bcd9db1b5a534c7c54962d65c69d3)
估计的斜率就为:
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image053.png?sign=1739365624-Hzd3iIyBOPtCbUFdWA9JMvNiqEJ1dTxU-0-646ed57e6ab5cd652a3f04754211ceda)
所给出的估计值称为和
的普通最小二乘(OLS)估计值。
2.普通最小二乘估计的合理性
已知
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image054.png?sign=1739365624-7N8uiEBY9r0jFvW4xHaRavkIFYAB06FK-0-ebbdbedef8b163a199f5b40cbe131541)
第i次观测的残差是yi的实际值与其拟合值之差:
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image055.png?sign=1739365624-FbABmLkmhlRxg3gRly46Lb43VghptjYG-0-800755ad55b8aa0b2362698c81af47e3)
选择和
最小化残差平方和:
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image056.png?sign=1739365624-pnjPCdNAEMFBCCp7sKzNte8uj9buPNfz-0-72b4870caa733e5f1cc39e1b6fd7d750)
“普通最小二乘法”之所以得名,就是因为这些估计值最小化了残差平方和。求得和
使得残差平方和最小,就是用上式对
和
分别求偏导,OLS估计的一阶条件为:
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image057.png?sign=1739365624-qzZyKH86mJu5tduzCuIFjvMAT52ZabbL-0-dae35b8509f2c02773cc931dc8b78d23)
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image058.png?sign=1739365624-sAt1u2ZDT6W9U1djO0KfiK0aCjDSFXJt-0-34b239b77498d869a900ca6ad907ef3c)
一旦确定了OLS截距和斜率估计值,就能够建立OLS回归线:
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image059.png?sign=1739365624-Q1mHD26lJOxerCYXdy7Ni9HbTabW6ytK-0-c5aa304f487658e5fcff06f775ac34f3)
方程又被称为样本回归函数(SRF),因为它是总体回归函数的一个样本估计。总体回归函数是固定而又未知的。而样本回归函数则是来自一组给定的数据样本,所以利用不同的样本将使得方程中产生不同的斜率和截距。
三、OLS的操作技巧
1.拟合值和残差
假定从给定数据样本中得到截距和斜率的估计值和
。给定
和
,能够获得每次观测的拟合值
。根据定义,
的每个拟合值都在OLS回归线上。
与第i次观测相联系的OLS残差是
与其拟合值之差。若
为正,则回归线低估了yi;若
为负,则回归线高估了yi。第i次观测最理想的情况是
,但在大部分情形中,并非每个残差都等于零。换言之,实际上没有一个数据点必须在OLS线上。OLS的思想就是使得这些数据点尽可能接近于OLS回归线。
2.OLS统计量的代数性质
(1)OLS残差和及其样本均值都为零。数学表述为:
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image065.png?sign=1739365624-uwC1QUeCUn8OQ5DjdNH3DOAWqJUpPCpw-0-a36171b1a5c5fe40ceeabfa068408076)
(2)回归元和OLS残差的样本协方差为零。
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image066.png?sign=1739365624-A1hDhhpDDQyv4608b0wCNblr1lJDE9VX-0-f872f165377ce1e3faadf139e7527bdb)
(3)点总在OLS回归线上。
3.定义总平方和(SST)、解释平方和(SSE)和残差平方和(SSR)
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image068.png?sign=1739365624-lxki1vsk3NL5rQYUFEG3IezWIcoQoeeM-0-388f39505d48268a87abde1c00f82f28)
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image069.png?sign=1739365624-8l6HDPvPQvW2s4HvmrfVox3u5ygRLw7b-0-e98539f3e1cc0948c7c710818e4e007d)
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image070.png?sign=1739365624-7T7cXRqPQgbJHbCQ0oKisF8Ktn6Tiv4u-0-0f052f47e7ccf6c241094b9e57ff493e)
SST度量了yi中的总样本变异;这就是说,它度量了yi在样本中的分散程度,称为总平方和。SSE度量了yi的样本变异,即样本的变异中能由回归方程所能解释的部分,因此称为解释平方和。SSE度量了ui的样本变异,即不能由回归线解释的部分,称为残差平方和。y的总变异SST总能表示成解释了的变异SSE和未解释的变异SSR之和,即有:
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image071.png?sign=1739365624-WADGZhGqio9zseUc0vp9cfwyXHCpiehm-0-5b5e64f1280ef60b703b9da86a345ab3)
不能把残差平方称为“误差平方和”,因为误差和残差是不同的两个量。
4.拟合优度
拟合优度R2,有时又称为判定系数,被定义为
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image072.png?sign=1739365624-ZjzEg0hp05LQPsDRVV1ABmThRfYtjU02-0-4ee568edc3b60cc0d3e8c9bcb1a2790a)
R2是解释变异与总变异之比,因此被解释成y的样本变异中被x解释的部分。因为SSE不可能大于SST,所以R2的值总介于0和1之间。
R2的值越接近于1表示回归线对样本数据拟合的越好,因此R2可以用来作为评价一个模型拟合好坏的标准,但是不能仅仅根据R2的大小来选择一个模型,因为在社会科学中,回归方程中的R2过低是很正常的,对于横截面分析来说,一个看似很低的R2值,并不意味着OLS回归方程没有用。
四、度量单位和函数形式
1.改变度量单位对OLS统计量的影响
(1)当因变量的度量单位改变时,很容易计算出截距和斜率估计值的变化。若因变量乘以一个常数c(意味着样本中的每个数据都乘以c),则OLS截距和斜率的估计值都扩大为原来的c倍。
(2)若自变量被除以或乘以一个非零常数c,则OLS斜率系数也会分别被乘以或者除以c。
(3)一般地,仅改变自变量的度量单位,不会影响截距估计值。
(4)模型的拟合优度不依赖于变量的度量单位。利用R2的定义可知,R2事实上不因y或x的单位变化而改变。
2.在简单回归中加入非线性因素
一个给出百分比影响(近似)为常数的模型是:
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image073.png?sign=1739365624-94IKAJa793Vlr8PscfS2QpYCOi5Rrb0O-0-16117f936c2906a1628834eae3c188ae)
特别地,若,则
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image075.png?sign=1739365624-gCXoSGeR7FJh9ifBKFHccFo9yVKaTrNL-0-4d327b82da5d399335d6da35e2d5827c)
自然对数的另一个应用,是得到一个常弹性模型:
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image076.png?sign=1739365624-C9xoKeNJ1lLM5fxsyL4woIaGUZ5HJmWq-0-158f9c5e2662f14be7ce41aff10c31dd)
定义因变量为
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image077.png?sign=1739365624-QkJmwBccFX7yjPUUNbWT6U00M9zEgjsO-0-fa870b13954f761b728b6ca48c583d8f)
自变量为
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image078.png?sign=1739365624-GV76pgv3FLJ5wYyFAcVID7rUEUkIhoW0-0-efc63ff832054929ead7d2c2b2261970)
这个模型就变成了简单回归模型。双对数回归模型的斜率参数表示x为对y的弹性。
3.含对数的函数的几种形式
表2-2 含对数的函数形式总览
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image079.jpg?sign=1739365624-ch2at3opVvkRMoJgMN56Dpi2ny66elUa-0-1f717f4927a1d99c30959da9b2a5f538)
4.“线性”回归的含义
一般线性模型同样允许非线性关系的存在。“线性”的含义是对参数为线性,即方程中的参数和
是线性形式的,至于被解释变量和解释变量是什么形式,并没有限制,可以是线性的也可以是非线性的。
五、OLS估计量的期望值和方差
1.OLS的无偏性
(1)相关假定
①假定SLR.1(线性于参数)
在总体模型中,因变量y与自变量x和误差(干扰)u的关系如下:
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image080.png?sign=1739365624-bpME3NEVCIk2FNcYKIwHKxbsODc8w8Ma-0-c4f99471b7c6754bed5e16dfff70a68e)
其中,和
分别表示总体的截距和斜率参数。
②假定SLR.2(随机抽样)
具有一个服从总体模型方程的随机样本,其样本容量为n。
③假定SLR.3(解释变量的样本有变异)
x的样本结果即不是完全相同的数值。
④假定SLR.4(零条件均值)
给定解释变量的任何值,误差的期望值都为零,。
(2)与
的差异
斜率估计量为
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image083.png?sign=1739365624-7yomSODCEsAJQOXmreVSoAFNxXYWcLIx-0-b0a6e40f89d4127e1f84976d93b3c138)
将代入,分子变为
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image085.png?sign=1739365624-9fscO7vFAz1iTHH67Vr4OYhIlyIJcGrh-0-0e61f59d911d35dc5db535a5953b2b6b)
因为,所以
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image087.png?sign=1739365624-rGVWfoJhcHl5OcjHwuzlW7djAJZ6b1UK-0-9365244800e0dd6920f395456f5c16df)
故上式可转换为:
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image088.png?sign=1739365624-myG8DVQ2TZAeBEr67CkU4uYu8iqs1ZYT-0-64c8791b113c9bed3e97cdc863c3f6f9)
其中
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image089.png?sign=1739365624-3nlePOJm0ki4IKkrnMfRgBpX3d9ZSXko-0-8685f38a11d7faa7b14594dc59c3902d)
可以看到,的估计量等于总体斜率
加上误差
的一个线性组合。以xi的值为条件,
的随机性完全来自于样本中的误差。这些误差一般都不为零的事实,正是
与
有差异的原因。
(3)定理2.1:OLS的无偏性
利用假定SLR.1~SLR.4,对任意和
,
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image091.png?sign=1739365624-J9e42EtO9SpeqNTAr5UxRNhKWRq8g027-0-69297cf81f5d10dcbf7c39e535341e01)
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image092.png?sign=1739365624-ijGPmFQWZGWFjNZh9bfMI7SP4qOiPCzK-0-3c599b34edb40bcc75a1bd34c2a0e163)
成立,即对
、
对
而言是无偏的。
(4)证明OLS的无偏性
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image093.png?sign=1739365624-posONEbZTitjUFoEbDjzj5LTnEMUk2SM-0-a79eed6d757b4f521c9ff2bb8ef9eb37)
根据假定SLR.2和SLR.4有,故以xi的值为条件,有:
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image095.png?sign=1739365624-ddDso9eMXMrQWHKqW0cOnXqyHUF0DjD4-0-ee1cfc01bf71c9a8a029956e5318ea75)
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image096.png?sign=1739365624-TnM69Os3rlP4Te3UcDDP4s8yXZoMFMUN-0-420ad77626b14d01cc0fe2e6979fbf0f)
由OLS的无偏性有,即
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image098.png?sign=1739365624-5QeGwqqgwDNRfczugCckHTYX8wau8aQd-0-2cdf441735bf7acb92a46b487d673ec5)
因此
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image099.png?sign=1739365624-yDpG0FF3WGa7NI7fZ4TqeKHKy9OjPgSF-0-786b4bcbb46a9c68356ce78ec30f82d7)
2.OLS估计量的方差
(1)相关假定
假定SLR.5(同方差性)
给定解释变量的任何值,误差都具有相同的方差
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image100.png?sign=1739365624-qT1ttqbRPOOuxVYcGzKv8NqPooBE2A2j-0-83f4fb3a2265ef0a89e75995349e0408)
(2)定理2.2:OLS估计量的抽样方差
在假定SLR.1~SLR.5下,以样本值为条件,有
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image102.png?sign=1739365624-RpdIIaRTRDGpevyUfHT70mkYQCzGs3YU-0-5f845b1231e0189fd4781c9b064fadb2)
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image103.png?sign=1739365624-pYOQF5VXWKaYHkqWnJqIGf9nPKLGNNS5-0-f5ac763bccbb6f1f406865bc748d757f)
(3)证明
因为只是一个常数,而且以xi为条件,所以SSTx和di=xi-x也是非随机的。而且,ui在i上(根据随机抽样)是独立的随机变量,故和的方差就是方差的和。所以:
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image104.png?sign=1739365624-DsANvpgtbNq4xl6G07MZBchrVFrdByma-0-6317dcc563845039c7377c73de30edd8)
3.误差方差的估计
(1)误差与残差的区分
利用随机样本观测把总体模型写成
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image105.png?sign=1739365624-m0bSELB6mKVBVbq3l6S8MDh9DqJS5oz2-0-b8de9bad649faf4c039ffec0661e3db6)
其中ui是第i次观测的误差。还可以将yi用其拟合值和残差表示出来:
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image106.png?sign=1739365624-ZkPPFXhKYUHrlbfivrkzRX3bM1nrTZIn-0-5885e1af4676dbb9e0220d96891d8735)
比较这两个方程可知,误差出现在包含总体参数和
的方程中,残差则出现在使用
和
的估计方程中。由于总体参数未知,误差是无法观测的,但残差却可以从数据中计算出来。
把残差写成误差的函数:
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image107.png?sign=1739365624-laOdUVaNyCPcLYRVIzIBzGVX9mTezYTF-0-7f916a57a1b52548f14af55296b8c46a)
或者
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image108.png?sign=1739365624-gRZqE8wK0RWIvgYHRoiD2tkzwwVAgd8k-0-5c21c532d41c7f779a9e100ce944c591)
尽管的期望值等于
,
的期望值也等于
,
却不等于ui。但二者之差的期望值为零。
(2)的无偏估计量
对自由度进行调整:
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image110.png?sign=1739365624-z3euxfoNRrUi7WiMdw0egusqYkRT2oY8-0-ef56db08315d9ab7a341267e07c81018)
(3)定理2.3:的无偏估计
在假定SLR.1~SLR.5下,有
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image111.png?sign=1739365624-Nq80VJ2BfuszHW3rGvaCQFJYcuicWq9N-0-c0afc6fc0a8325be96fa018852fa3993)
证明:如果把方程对所有i进行平均,并利用OLS残差均值为零的结论,便得到
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image113.png?sign=1739365624-tO1R5gmiI7hhStyUROdf8OwIqXnGp6nn-0-e5ba05e7a8f0a732611c870c74895439)
从原方程中减去它,则得到:
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image114.png?sign=1739365624-7U0DnptxcLUge0G3g6VlShensr6mSncn-0-fbf27a3d5eaebd4ca730bb1c222ab85b)
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image115.png?sign=1739365624-wQvYYoWv2R0RQVFaSdHUYGfCs4m9AtIZ-0-aeb100afefb1ff4c3f84e467cc0fb414)
对所有i求和,又得到:
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image116.png?sign=1739365624-zcIbIjrbRET9gy4kBHiJwZ13tm6RWjIl-0-088dc8dbb6c7665dbc6f92c7a8586fcc)
等式右边第一项的期望值是。第二项的期望值是
,第三项的期望是
,则有:
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image119.png?sign=1739365624-HS2MafW32PyGtKeXsvNcFP7RDg54bn7J-0-67ce0849febfa4638e1328cd8013c2fd)
因此
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image120.png?sign=1739365624-7IRdlUSdbEEYvyW07C9fUORvDyzKiRvW-0-e4418f2b0181a868b11ae3bd8d8f23dc)
的自然估计量为:
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image122.png?sign=1739365624-uGNuNPKjgsy56gCUofdB3YlOlBSAUYR7-0-ca0364e969b506a5d13920ce90825b15)
并被称为回归标准误差(SER)。尽管不是
的无偏估计量,但能够证明它是
的一致估计量。
的标准误差为:
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image124.png?sign=1739365624-texSVTVQkDHAEMUQHAMxd5U6dzY46GHr-0-4acb308a8ef4d9b9c93e579e8cdb6da5)
六、过原点回归及对常数回归
规范地,选择一个斜率估计量(称之为)和如下形式的一条线
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image126.png?sign=1739365624-gbAzIym8YLGd4ySiIy1jnsDzpWMsIq6P-0-d895aa97070639966cb13b807ef8be5e)
因为直线经过点,
,所以得到的方程又被称为过原点回归。
使用普通最小二乘法,此时最小化的残差平方和为
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image129.png?sign=1739365624-Qmzzseo1bR8oKYScK79UAssRVD7f0dOF-0-0a61288719dc695560962b3e3d0d2e8d)
利用一元微积分可以证明,必须满足一阶条件
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image130.png?sign=1739365624-dFeKb8VuhPSNWgpDXcVQYwPY7KwH1qAb-0-c7d3f867e1d0ac5117f5aa626d34721c)
从而解出为:
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image131.png?sign=1739365624-J5KwxsmsrgBFyYosVWtEwfXMW5XQEIEB-0-f4458062c619895eccf4c71ad65ddc67)
当且仅当时,这个估计值与带截距项的OLS估计量才是相同的。
过原点回归的R2是通过得到的,即在计算SST时不消除yi的样本均值。分子部分作为残差平方和是有意义的,而分母部分在已知y的总体均值为零时成立。
如果通过常规方法,即来计算R2,则结果有可能为负值。
如果为负值,意味着用样本均值
来预测yi的拟合优度高于过原点回归。
由上述讨论引出的问题是对常数回归。将y只对一个常数回归即设定斜率为零并只估计截距项,由于使方差最小的常数必为样本均值,因此估计的截距项必为yi样本均值。式的符号可以看作过原点回归和对常数回归之间的比较。