第02讲 为什么要研究因果关系
一般而言,经济学可以分为微观经济学和宏观经济学,经济学家也就此两分,类似于厨师可以分成红案和白案,横跨两界的人才非常罕见。当然,还有一部分经济学家在研究更为高深的数学理论,为微观经济学家和宏观经济学家提供新的武器,他们的数量就更少一些。大多数经济学家在研究微观经济学或宏观经济学。
这两类经济学家的数量也不对等,微观经济学家的数量更多。微观经济学家的数量和宏观经济学家相比,可能是七三开,甚至八二开。我可以负责地说,除了少数微观经济学家在进行理论研究之外,大多数微观经济学家在研究因果关系。
随手打开一本经济学杂志,我们看到的论文题目大多数是这样的:《看电视会导致孩子学习能力下降吗?》《更好的公司治理结构是否能够改善公司价值、公司创新或者股利政策?》《紧缩财政一定会阻碍经济复苏吗?》这些论文都是在讨论A因素是否影响B因素。这些论文作者深知这些研究未必是普遍适用的真理,所以一般会加上限定条件,比如源于印度证据、基于中国家庭金融调查数据等。
这是一类最典型的经济学八股文,但它讨论问题的方式非常重要,也是我们积累经验性知识的一种重要方式。
我们从最简单的例子开始讨论。比如,看电视会导致孩子学习能力下降吗?孩子的学习能力与其考上大学的概率相关,与其积累人力资本的方式有关,所以这是典型的经济学命题。我们可以用随机抽样的方式,比如搜集1000个孩子的统一考试成绩,同时了解他们每天在家里看电视的时间。我们把这两组数据放在一起,就可以进行回归分析。
确实有一些经济学家这么做了。他们发现,每天看电视超过3小时的孩子的成绩,比看电视少于1小时的孩子的成绩要低。结论似乎很清楚:看电视会影响孩子的学习成绩。但是,我们要进一步讨论,到底是“孩子看电视导致学习能力下降”,还是“学习能力差的孩子看电视时间更长”。这是两种完全不同的解释,前者是一种因果关系,而后者只是一种相关性。我们不能说因为孩子学习能力差,所以他喜欢看电视,这种逻辑说不通。所以,后者只能说明两者之间具有相关性,而相关性不能说明任何问题。两个独立事件看似有关,其实只是“纯属巧合”,这样的例子有很多。
两个变量的变化趋势碰巧相似,这种现象在统计学上称作“伪相关”。有些无聊的经济学家搜集过不少伪相关的例子,比如“美国某影星一年参演电影的部数”与“美国每年在游泳池溺死的人数”之间的相关性。
除了伪相关,还有一种影响我们分析因果关系的情形,叫作遗漏变量。举个例子,有经济学家发现,人们家中打火机的数量与个人罹患肺癌的概率之间存在显著的相关关系。如果这种逻辑关系成立,那将是一个重要发现。我们可以建议大家把家里的打火机都扔掉,这样就能提高健康水平。但是,这在逻辑上说不通。
我们在这个例子里很容易想到,打火机主要用来点烟。像我不抽烟,所以家里可能连打火机都找不到。而经常抽烟的人,可能有好几个打火机,家里放一个,办公室里放一个,包里再放一个。所以,最终影响罹患肺癌概率的因素应该是抽烟数量,而不是打火机数量。
这个例子还比较简单,我们很容易从打火机联想到抽烟,从而找到真正影响肺癌的变量。但在更多复杂研究中,要找到这些遗漏变量就没那么容易,这样会导致我们错误地判断因果关系。
我们再来讨论第三种情形,也是最复杂的情形,叫作逆向因果关系或反向因果关系。有些研究发现,一个地区警察数量与罪犯数量之间存在高度的相关性,这一点非常令人困扰。表面上看,我们可以简单得到一个结论:警察越多,罪犯越多,警察治理成为孕育罪犯的温床。可仔细想想,这个结论非常荒唐。
我们之所以会根据数据得到这个结论,是因为我们忽略了一种非常可能的反向因果关系:如果一个地区的罪犯多,犯罪活动猖獗,就会引起地方政府的担忧,从而招募或者安排更多警察。所以,罪犯越多是警察越多的原因,而不是结果。这个例子非常有名,被很多经济学教科书引用。
在经济学家严肃的实证研究中,警察数量和罪犯数量之间的关系远比我们想象的复杂。犯罪经济学有一个基本假设:警察应该具有威慑作用,也就是警察越多,罪犯越害怕。罪犯担心自己犯罪被抓住,所以会减少犯罪次数,最终抓获的罪犯数量或犯罪次数会减少。但现实是,美国很多地区警察数量和罪犯数量不断增多,这是一个不正常的现象。
这里我们需要讨论一下芝加哥大学史蒂芬·D. 列维特(Steven D. Levitt)教授的研究工作。他写过一本畅销书——《魔鬼经济学》(Freakonomics),这是一本非常好看、值得一读的经济学科普著作。
列维特是研究犯罪经济学的大师。研究犯罪经济学的最大困难,就是罪犯数量和警察数量之间相互影响的关系,人们不容易分清楚到底谁影响谁,两者有点像“鸡生蛋”和“蛋生鸡”的关系。经济学家给这种鸡和蛋的关系起了一个专业名称,即“内生性”。微观经济学家在研究中的一项重要任务,就是消除这种内生性。
最常用的消除内生性的方法是工具变量法。工具变量就是找到一种只与内生的解释变量相关而与被解释变量不直接相关的变量,把原先两者纠缠不清的内在关系一刀切断。工具变量只可能通过影响解释变量来影响被解释变量。所以,通过回归估计被解释变量与工具变量的关系,我们就能有效推断两者之间的因果关系。
简单来说,工具变量就是一种过滤器,只能筛选一个方向的因果关系,而把反向的因果关系隔离在外。回到我们关心的犯罪经济学,列维特认为,警察数量毫无疑问与美国的政治选举周期有关。大选之年,执政的地方政府为了拉选票,一定会把更多资源投向警察。但是我们不能说,犯罪数量与政治选举年份有关。所以,工具变量就成立了。列维特设计了一系列精巧的工具变量,主要运用选举年份消除罪犯数量和警察数量之间的内生性。消除内生性以后,列维特证明,警察对罪犯确实存在威慑效应。
列维特的这项研究于1997年发表在《美国经济评论》上。但是,有人重新验算了列维特的结果,发现他的运算存在一些小的瑕疵。列维特不得不重新算一遍,并发文章回应。他首先承认错误,其次表明改正错误以后,警察对罪犯的威慑效应还是存在的,自己的这种工具变量研究法仍然可行。
双方你来我往,各有道理,但大家始终觉得列维特的这项研究没有那么可靠。2009年,几位意大利经济学家在另一份顶级学刊——芝加哥大学的《政治经济学杂志》上发表了一篇论文,利用一次机会难得的自然实验研究了犯罪经济学中的威慑效应,引来学界一片喝彩。
2006年,在教皇保罗二世的不断敦促下,意大利的法律制定者通过了一项法律,那就是释放全部剩余刑期不到三年的罪犯,大约有40%的在押罪犯被释放。但是他们被告知,如果再次因犯罪被抓获,那么他们的刑期中需要加上这次没有服完的刑期。
如此一来,每个被释放罪犯就面临不同程度的“威慑效应”。更重要的是,这些威慑是外生的,或者说对于罪犯是偶然的,他们并不可能预料到这项措施。
作者研究了这些罪犯被释放后重新犯罪的概率与他们所面临的“潜在刑期”的关系,发现罪犯对此十分敏感。潜在刑期长的人,犯罪的概率明显低。所以,这就证明威慑效应确实存在。
这种研究不存在内生性问题,不存在反向因果关系,比之前的工具变量方法更有说服力。但是,这种“自然实验”的机会是可遇不可求的,在没有自然实验的时候,经济学家只能从现有数据里分析挖掘因果关系。
参考文献
[1] Levitt S D. Using Electoral Cycles in Police Hiring to Estimate the Effect of Police on Crime[J]. The American Economic Review,1997,87(3):270-290.
[2] Drago F,Galbiati R,Vertova P. The Deterrent Effects of Prison:Evidence from a Natural Experiment[J]. Journal of Political Economy,2009,117(2):257-280.