2.2 因果关系和相关关系
不幸的是,即使是基于大型数据集的分析也可能具有误导性。以我们之前提到的教育回报模型为例。基于有关工资和受教育年限的大数据集,我们已经看到,平均而言人们每多接受1年教育,工资大概会增加10%。这是不是意味着只要你在学校多待1年,就一定会让你未来的工资增加10%?不一定。让我们通过一个例子来思考为什么情况并非总是如此。
红色广告的故事
假设有一家百货商场聘请你担任顾问。你提出了一条关于广告活动的假说:在广告活动中使用红色能更好地吸引人们的眼球。为了验证你的假说,你从过往的广告活动中搜集证据,包括这些广告活动的主色调以及活动期间商场的销售额变化。
结果,你的实证研究证实了自己的假说!在使用了大量红色图片的广告活动期间,商场的销售额上升了25%;在使用了大量蓝色图片的广告活动期间,商场销售额只上升了5%。你跑到CEO那里报告这一非凡结果。你真是一个天才!
不幸的是,CEO当场解雇了你。他注意到了什么被你遗漏的东西?
红色主题的广告活动大部分集中在圣诞季,而蓝色主题的广告活动则分布于一年中的其余任意时间。正如这位CEO所说:“并不是在广告活动中使用红色使我们的收入增加,而是圣诞季使我们的收入增加。是因为圣诞季,我们才在广告活动中更多地使用红色。即使我们在圣诞季推出蓝色主题的广告活动,我们的收入仍会上升约25%。”
这是一个真实的故事,当然出于保护这位朋友的目的,我们修改了故事的细节,并且隐去了这家商场的名字。在本章附录中,我们还会讲一个相关的故事,那个故事中的CEO并不像这个故事中的CEO这样敏锐。
因果关系与相关关系
如同上述案例中错误的广告分析一样,人们经常会把相关关系误以为是因果关系。当一件事直接影响另一件事时,就会产生因果关系。你可以把因果关系看成从原因到结果的路径:打开炉灶一段时间就会使水壶里的水沸腾。
科学家把变化的因素或特征称为变量,比如烧水壶里水的温度。科学家称,当一个变量(例如在炉灶上天然气的燃烧量)引发另一个变量(例如烧水壶里水的温度)改变时,就会产生因果关系。
相关关系意味着两个变量趋向于同时改变——当一个变量改变时,另一个变量也会改变。它们之间存在某种关系。这种关系可能是因果关系,即使不存在因果关系,也可能存在相关关系。例如,上音乐课的学生在SAT(美国高中毕业生学术能力水平考试)测验中的得分高于不上音乐课的学生。于是,一些音乐教育家很开心地由此得出因果关系的结论:学生多上音乐课能够提升SAT成绩。
但是,请不要着急给你的弟弟妹妹买乐器。这个因果关系缺少足够证据,而且上音乐课和SAT成绩的相关关系还有很多其他可能的解释。
从原因到结果。炉灶上的火焰烧热了水壶里的水,导致水沸腾和蒸发。但蒸发的水不会导致火焰在炉灶上燃烧。
慢跑能使人们变得更健康吗?良好的健康状况会使人们去慢跑吗?事实上,这两种因果关系同时成立。
例如,学音乐的学生往往家境富裕,他们的父母可以通过聘请家教来提升孩子的SAT成绩。在这种情况下,因果路径是从财富到SAT家教再到更高的SAT分数。上音乐课并不能让你在SAT考试中获得高分。是家长有钱才让孩子去上音乐课,同样也是因为家长有钱,他们的孩子才在SAT考试中取得高分(通过家教这个渠道)。
若两个变量相关,则意味着可能存在因果关系,因此需要进一步探究——但这往往只是分析的开始。有趣的是,当研究者试图寻找音乐课和高认知能力之间的因果关系时,他们总是以失败告终。[1]因此,如果一个年轻的小号手弄断了手指并因此退出音乐课,并不必然导致其未来的SAT成绩下滑。总而言之,尽管上音乐课和SAT成绩具有相关性,但上音乐课似乎并不会促使SAT成绩提升。
你能想到其他把相关关系和因果关系混淆的情况吗?加入高中运动队是否会让你的人生更加成功(例如,在30岁时有更高的收入)?在15岁时吸烟是否会让你以后更有可能对非法毒品上瘾?这些是因果关系吗?还是只是相关关系?
相关关系可分为三类:正相关关系、负相关关系和零相关。正相关关系意味着两个变量倾向于朝着相同的方向变动。例如,调查表明,收入相对较高的人比收入相对较低的人更有可能已婚。在这种情况下,我们可以说收入和婚姻状况这两个变量呈正相关关系。负相关关系意味着两个变量倾向于朝着相反的方向变动。例如,受教育程度高的人失业的可能性相对较低。在这种情况下,我们说受教育程度和失业这两个变量呈负相关关系。当两个变量没有关联时,我们称其为零相关。你的朋友数量和你住在街道的哪一边没有关系。
相关关系不意味着因果关系的情况
我们不应贸然认定两个变量之间的相关关系必然意味着某种特定的因果关系,这主要出于以下两个原因:
(1)遗漏变量;
(2)反向因果关系。
遗漏变量是指那些研究中被忽略,但如果将其纳入便能够解释两个变量为何相关的因素。前面提到,红色广告元素的数量和商场的销售额增长率正相关。但是,红色广告元素并不必然带来商场的销售额增长。是圣诞季的来临促使商场使用更多红色广告元素,同时使其月度销售额不断增长。因此,圣诞季是一个遗漏变量,它解释了为什么红色广告元素往往和销售额增长出现在同一时间(见图2.3)。
图2.3 遗漏变量的一个例子
注:商场中红色广告元素的数量与销售额增长呈正相关。也就是说,当广告以红色为主题时,商场销售额的按月环比增速往往更快。但并不是红色广告元素的使用带来商场收入的增长,而是圣诞季的来临促使商场使用了更多红色广告元素,同时使商场的销售额上升。圣诞季是一个遗漏变量,它解释了红色广告元素与销售额按月环比增长之间的正相关关系。
是否也存在一个遗漏变量,可以解释为什么受教育程度和收入存在正相关?一个可能的因素是个人努力工作的意愿。或许那些特别努力的人在大学课堂上的表现就比其他学生更好?也许经常熬夜写学期论文得以让勤奋的学生在课业上取得好成绩,而这也使得他们愿意继续留校学习。同样的因素也使得这些人的收入比其他人更高,因为他们往往工作到很晚,或者经常周末加班。是这种狂热的努力使你收入更高(同时让你从大学毕业而没有辍学),还是说接受高等教育这件事本身使你收入更高?什么是因?什么是果?我们将在本章稍后解开这个谜团。
反向因果关系是困扰我们区分相关关系和因果关系的另一个问题。当我们混淆原因和结果的方向时,就会产生反向因果关系。例如,考虑到相对富裕的人往往也相对健康,一些社会科学家便得出结论:拥有更多财富会给人们带来更好的健康状况,因为有钱人可以负担得起好的医疗服务。但是,这两者也可能存在反向因果关系:更好的健康状况也许能给人们带来更多的财富。例如,和不太健康的人相比,健康的人可以更努力工作,可以延迟退休,并且医疗支出更少。事实证明这两种因果关系都存在:更多的财富能够带来更好的健康状况,更好的健康状况也能够带来更多的财富。
在我们的教育回报分析中,是否也有反向因果关系在起作用?也就是说,30岁时更高的工资能否让你在20多岁时接受更多的教育?我们可以从逻辑上排除这种可能性。除非你拥有时光机,否则你30岁时的工资不可能让你在20多岁时接受更多的教育。所以,在教育回报的例子中,反向因果关系不太可能存在。但是,在很多其他分析中,如在财富和健康之间的关系上,反向因果关系是一个关键的考虑因素。
选择与结果
先花后付?
昂贵的婚礼会导致离婚?还是有什么其他因素在起作用?
● 两位经济学家——安德鲁·弗朗西斯—谭和雨果·米亚隆基于美国的调查数据计算了婚礼支出和离婚率之间的实证关系。[2]他们发现,在结婚典礼或者订婚戒指上花费更多的夫妻,有更高的离婚率(在其他因素保持不变的情况下)。例如,在他们的样本中,婚礼花费超过2万美元的新婚女性,其每年离婚的可能性是婚礼花费在5 000美元到1万美元之间的女性的3.5倍。
● 这是一个有趣的实证证据。这种相关关系是否证明保持长久婚姻的关键是举行一个小型婚礼,甚或是干脆来一场私奔?在婚礼上支出较多真的会导致夫妻离婚吗?或者是有什么遗漏变量在其中发挥作用?什么遗漏变量会促使人们举办一场豪华的婚礼,也会导致他们最终离婚?虚荣心?自尊心?物质主义?
● 或者昂贵的婚礼可能会给新婚夫妇带来经济压力,而这些压力可能会导致离婚。所以,可能存在一条从婚礼支出到离婚率的因果路径。
● 事实上,这篇论文的作者没有声称自己证明了昂贵的婚礼会导致离婚。他们明白,相关关系并不意味着必然有因果关系。考虑到这种复杂的例子,我们能否确定什么是相关关系,什么是真正的因果关系?经济学家已经为识别因果关系开发了一整套丰富的工具,我们会在之后讨论其中的一些工具。
实验经济学和自然实验
确定因果关系的一种方法是进行实验。实验是一种调查变量之间因果关系的受控方法。虽然你可能不会在报纸上读到太多关于经济实验的报道,但关于医学实验的头条新闻却很常见。例如,美国食品药品监督管理局(FDA)要求在新疫苗获批供公众使用之前,制药公司必须通过精心设计的实验来证明这些疫苗的有效性。在我们撰写本书时,数十种新冠疫苗正在经历这一严格的测试过程。
为了进行实验,研究人员通常需要找到目标人群,之后将其分为实验组(测试组)和对照组。实验组会被暴露于某种新奇体验之下,例如给他们注射一种有效性和安全性尚待评估的新型疫苗。相比之下,对照组没有得到任何不同寻常的对待。对照组可能接受安慰剂疫苗注射,比如注射没有任何已知益处的生理盐水。实验参与人员会被随机分配到实验组或者对照组。随机化是指以随机方式而非人为选择的方式将受试者分配到实验组或对照组。实验组和对照组被对待的方式在其他方面完全相同,只在某一特定维度故意存在差别。实验的最终目的是确定这一差别所产生的影响。
如果想要知道一种备受期待的新疫苗是否有助于避免受试者感染新冠病毒,我们可以找1 000名受试者,随机将其中500人归入实验组,这些人将接受新疫苗注射。另外500人则归入对照组,接受安慰剂疫苗(生理盐水)注射。然后对所有受试者进行随访,监测他们的新冠病毒感染率。这项实验的目的是检验如下因果关系假说:注射真正的疫苗比注射生理盐水更能预防新冠病毒感染。
现在,考虑一项经济学实验。假设我们想知道大学学历能够产生什么影响。我们可以找到1 000名负担不起大学费用但又想上大学的高中生(如果免费的话),随机选择其中500人归入实验组,为他们支付所有上大学的费用。其他500名学生则被归入对照组。然后我们会跟踪所有1 000名学生,包括那500名因为负担不起学费而未能上大学的学生。我们将对他们成年之后的生活进行定期调查,并观察受过大学教育群体和没受过大学教育群体的工资水平。这项实验将检验大学教育会促使工资上涨这一假说。
实验成本有时会非常昂贵。例如,我们刚刚所描述的大学入学实验将耗资数千万美元,因为研究人员需要为500名学生支付上大学的费用。
另一个问题是,实验不能立即为一些重要的问题提供答案。例如,要想知道受更多教育对整个职业生涯工资水平的影响,需要耗费数十年的时间。
还有一个问题是实验有时候运行不佳。例如,如果医学研究人员没有真正随机分配病人接受治疗,那么这个实验可能根本没有教给我们任何东西。再例如,如果去前沿研究型医院的患者恰好是那些获得新疫苗的患者,那么我们就无法确定因果关系;我们无法了解患者的病情好转到底是因为疫苗还是因为这些重点医疗中心的其他什么东西。在一个精心设计的实验中,谁接受新疫苗注射和谁不接受注射,完全是随机决定的。
如果研究设计得很糟糕,经济学家便对其结论持怀疑态度。糟糕的研究方法会导致无效的研究结论,这就是我们经常说的“废料进,废品出”。
如果我们没有预算或时间来进行实验,或者没有能力进行真正的随机化实验,我们还能用什么方法来确定因果关系?一种方法是研究由自然实验产生的历史数据。自然实验是一种实证研究,在这种研究中,一些不受实验者控制的过程会以随机或近乎随机的方式将受试者分配到对照组和实验组。
在很多情况下,自然实验是我们唯一能从中得出结论的实验方法。例如,将军们不会随机选择村庄投掷炸弹——如果这样做了,他们会被送上军事法庭。但有时,随机因素会导致一些村庄遭到轰炸,而其他村庄则得以幸免。梅丽莎·戴尔是一位经济学家,她曾荣获享有盛誉的贝茨·克拉克奖。为了确定越南战争期间不同轰炸政策的影响,她对一次这样的自然实验进行了探究。[3]大多数自然实验在伦理方面远没有那么复杂。稍后,我们将讨论一项自然实验——在这个例子中,义务教育法的改变使得一些孩子多获得了一年的教育。
经济学家发现并利用自然实验来回答许多重大问题。这种方法有助于为我们手头的问题提供更明确的答案:你从教育中得到了什么?
循证经济学
教育能带来什么回报?
● 1个世纪之前,义务教育法的执行远没有现在这么严格,青少年高中未毕业便可以辍学。菲利普·奥雷普卢斯研究了义务教育法的变化所引发的一项自然实验。[4]在1947年之前,英国允许孩子在年满14岁时便可辍学。但在1947年,英国将允许辍学的年龄提高了1岁,即必须年满15岁方可辍学。在1947年前,多数英国孩子都会在14岁辍学。但在1947年之后,几乎再没有人这么做。
● 在这项自然实验中,这些在1946年年满14岁的孩子就变成了在1948年年满14岁孩子的“对照组”(后者被强制要求多上1年学)。奥雷普卢斯将1946年年满14岁孩子的终生劳动力市场收入同1948年年满14岁孩子的终生劳动力市场收入进行了对比。[5]利用这一自然实验,奥雷普卢斯估算出多上1年学的回报大约为10%。换句话说,他的分析表明,多上1年学的因果效应是可以让你在劳动生涯的每一年都多挣10%。
● 自然实验是实证经济学中一个非常有用的数据来源。在很多问题中,它们帮助我们把相关关系和因果关系区分开来。在教育回报这个问题上,自然实验的结果证明受教育年限和高收入之间的相关性并不仅仅是因为存在某些遗漏变量,也体现了教育的因果影响。由此可见,教育回报模型得到了强有力的数据支持。每多接受1年教育会使你未来的收入提升10%,这个结论有没有让你想多上几年学?
[1] Samuel A. Mehr, Adena Schachner, Rachel C. Katz, and Elizabeth S. Spelke, “Two Randomized Trials Provide No Consistent Evidence for Nonmusical Cognitive Benefits of Brief Preschool Music Enrichment,”PloS ONE 8(12): 2013, e82007. https://www.ncbi.nlm.nih.gov/pubmed/24349171
[2] Andrew Francis-Tan and Hugo M. Mialon,“‘A Diamond Is Forever’ and Other Fairy Tales: The Relationship between Wedding Expenses and Marriage Duration,” Economic Inquiry 53(4): 2015, 1919–1930. http://ssrn.com/abstract=2501480.
[3] Dell, Melissa, and Pablo Querubin. “Nation Building through Foreign Intervention:Evidence from Discontinuities in Military Strategies.” The Quarterly Journal of Economics 133(2): 2018, 701–764.
[4] Philip Oreopoulos, “Estimating Average and Local Treatment Effects of Education When Compulsory Schooling Laws Really Matter,” American Economic Review 96(1): 2006, 152–175.
[5] 分别在1946年和1948年年满14岁的人,可能面临不同的历史背景,从而决定了其将来面临不同的收入,这是一个遗漏变量。——审校注