比较.第109辑
上QQ阅读APP看书,第一时间看更新

疏忽之罪与经济学的现状*

乔治·阿克洛夫**

1.引言

本文关注“硬研究”与“软研究”之间的区分。经济学作为一门学科鼓励硬研究,而轻视软研究,这种偏向造成了一种“疏忽之罪”(sins of omis-sion),即忽略了若干难以用“硬方法”加以分析的重要课题与疑问。笔者因此建议重新检讨经济学领域的出版与晋升制度。

2.硬研究与软研究

自康德(1853)以来,人们普遍把科学研究按照“软硬”阶梯排序,物理学居于顶端,社会学、文化人类学和历史学等排在底层。[1]

这一分层是根据研究的精确性,它既适用于整个学科,也可用于描述其中的分支领域。[2]以经济学中的实证研究方法为例,与定性研究相比,定量研究被视为更硬的领域。而在定量研究内部,因果关系研究比相关关系研究更为精确,因此关注识别问题的实证研究被视为特别过硬。与采用文字描述相比,用数学模型表述的经济学理论更硬;如果能用数学更准确地描述基本思想或概念,这样的模型就硬上加硬。

3.疏忽之罪:一个简化模型

本节将沿用埃利森(Ellison, 2002a)的思路,以一个简化模型来讨论所谓的“疏忽之罪”。

一位研究型学者需要在若干潜在课题中做选择,这些课题可以按两个维度来评估:一是软硬度,也就是做出精确研究成果的难易程度;二是重要性。[3]该学者对软硬度和重要性都很关心,但在软硬度和重要性之间权衡取舍时,他给前一维度赋予的权重可能导致从社会角度看非最优的最终结果。从这个意义上讲,他带有偏向性。偏向性的成因稍后再议,这里姑且作为给定条件。

图 1 描述了该学者的问题求解结果。当他在课题“边界”做出选择时,他的选项不同于社会最优解。相比社会最优的课题B,该学者选择的课题A硬度更高,而重要性更低。

假如把所有学者的行为加总起来,我们将得到一个该领域的全部学者可能关注的课题集合。鉴于有若干较为重要但硬度不够的课题无人问津,整个学界对硬研究的偏向就会造成一种“疏忽之罪”。

4.偏向硬研究的原因

那么问题在于:为什么经济学家偏向于做硬研究?我认为有如下三种可能的原因,至少能部分解释为什么这种偏向性会与日俱增。

图 1 研究课题的软硬度取舍

注:在研究课题的边界线上对课题的软硬度做取舍决策,实现个人效用最大化的选择是A点,实现社会福利最大化的选择是B点。

原因之一在科学阶梯上的地位。福尔卡德等人(Fourcade、 Ollion and Algan, 2015)在《经济学家的优越感》(The Superiority of Economists)一文中谈到,经济学家“自视位居社会科学研究阶梯中顶端或接近顶端的位置”。[4]他们非常骄傲地认为自己的学科在“所有社会科学中最具科学性”,并因为社会学家和政治学家的“分析工具不够强大”而轻视对方。[5]在我看来,争取科学阶梯地位的愿望是偏向硬研究的一个主要动机。

原因之二评价过程。被学术期刊接受投稿等奖励通常由委员会分配,例如学术期刊的委员会是由编辑和审稿人组成。当奖励较为稀缺时,争取奖励需要得到委员会中大多数甚至全体成员的首肯。

精确性相对而言是有着清晰定义的概念,因此人们对研究的硬度较容易达成一致意见。相比之下,重要性更为含糊,关于重要性的看法容易产生分歧。加上人们习惯于夸大自己工作的重要性,而贬低其他人的工作,对研究议题重要性的意见分歧会变得愈加突出。

于是,委员会的评价将偏向于硬研究。而且奖励资源越是稀缺,这种偏向性可能越严重。

原因之三职业选拔。学术界内部并非一个模样。某个专业对硬研究的偏向性越强,就越有可能把本身喜好这一偏向的人选拔进该领域。例如曼昆曾建议经济学博士项目的潜在申请人“尽量多选修数学,直到痛苦不堪”(Man-kiw, 2006)。当然曼昆后面又委婉地补充说,他本人认为这样的标准过分严厉,如果担任录取委员会的成员,他“或许会反对同行……对数学能力的过分偏爱”。[6]

正如奖励会影响选拔一样,某个职业的人员类型构成也会影响奖励分配。当做硬研究的人成为主流时,他们会占据更多有权威的专业职位,包括学术期刊的编辑等。在这些重要职位上,他们会扭曲奖励分配,例如挑选更具研究硬度的论文发表。当然,对职位晋升也会造成同样的扭曲。[7]

经济学领域的研究在近年来变得越来越硬,正是因为这种消极的反馈闭环。奖励的偏向性导致学界本身更加看重硬研究,对硬研究赋予的这种内在价值又进一步加剧奖励的偏向性。

5.硬研究偏向性的某些后果

本节将探讨硬研究偏向性的三种后果。

后果之一不利于新理念的倾向。在前文中,我们按照“软硬度”和“重要性”对研究课题做了分类,还有一个分类维度则是课题的“新旧度”,或者借用库恩的说法,是带来“常规性”研究,还是“革命性”研究(Kuhn, 2012)。并非所有新课题都是重要课题,但显然,最重要的课题确实是创新课题。对硬研究的偏向性至少会从两个方面压制对新课题的接纳度。

首先,老的课题或范式有各种研究工具来提高其精确性,例如现成的术语、概念体系和实证研究方法等。存在硬研究偏向性时,在老范式框架内开展研究的学者具有优势,可以借用现成的工具精确表述自己的思想。相比之下,试图阐述新理念的学者处境不利,因为他们必须发展出自己的分析工具。如弗雷(Frey, 2003,第 212 页)所述:“新理念的表述不如成熟理念规范……可能因为欠缺严谨而遭到拒绝。”对精确性(研究硬度)的要求以这种方式妨碍了新理念的引入。

其次,对硬研究的偏向性压制了挑战现有范式的能力。按照经济学乃至一般科学研究的通行程序,旧理念只有在测试中表现得弱于新理念时才会被否定。自从弗里德曼(Friedman, 1953)的经典论述以来,大家已几乎一致认定,新理论必须推导出可检验的预测。这一观念看似没有恶意,但事实上却轻视对理论做较为软性的检验,例如根据假设和结论的定性分析评估理论模型。尤其是,该观念会排斥案例研究中得到的证据,而此类详细证据可以提供有关经济活动背景和动机的相当丰富的信息。[8]利用统计数据所做的硬检验固然可以作为“黄金标准”,而人为限制可接受的检验则会(很可能大幅)制约理论检验的能力。于是,对硬研究的偏向性会使我们整个业界太容易接受现有理论,而削弱自我批判精神。

后果之二过度专业化。对硬研究的偏向性还会鼓励过度专业化。通才型学者需要在多个领域满足精确性标准,而专业型学者只需要满足一个狭窄领域。因此专业型学者更容易做出硬研究。对硬研究的偏向性越强,我们理应看到经济学研究的专业性越突出。

就现实而言,我们业界的专业性似乎确实在强化。一个表现是,院系日益分化为各个分支领域,且都有自己的系列研讨课程。各分支领域的学术刊物大量兴起则是该趋势的另一个表现。[9]

后果之三前五大的诅咒Curse of the Top Five)。对硬研究的偏向性也是“前五大的诅咒”的成因之一。赫克曼与莫克坦(Heckman and Moktan,2017)指出,职称与晋升委员会越来越依赖学术期刊发表的成绩来做决策,给顶尖(前五大)期刊的发表赋予了特别的权重。

与业界的其他奖励一样,教职也是由委员会分配的。职称委员会采用的一个考评办法是评估候选人的成果质量,但为此展开的讨论可能并不顺利,特别是当学界细化为很多分支领域时。如之前所述,学者们对课题的重要性缺乏共识,并且在不同分支领域之间容易存在系统性的分歧。

为减轻这一问题,可以采用指标测度评估候选人。对于学术期刊的质量比较容易达成共识,尤其是引起普遍关注的、各分支领域均有文章发表的期刊。因此,在经济学教职评定过程中赋予权重最高的期刊(前五大)都是综合类期刊,也就并不奇怪了。[10]另有学者观察到,利用期刊发表作为考评指标还有个好处,即方便偷懒(Casadevall and Fang, 2014a)。

6.经济学界的现状

有一幅统计图显示,研究型经济学家、尤其是年轻人,身处很容易导致疏忽之罪的环境中,因为有强大的遵从压力要求大家加强硬研究,而忽略重要性。研究型大学中的助理教授没有太多底气对抗学术期刊提出的要求,尤其是当排名前五的期刊在教职授予中占据超强地位的时候(Heckman and Moktan,2017)。

期刊的要求其实只是学术遵从传统的漫长系列中的一环,此类要求可能从高中乃至更早期就已出现。例如,以高中的表现争取被大学录取;获得足够好的成绩、推荐信和GRE考分,以进入研究生院;获得博士学位;凭借研究生院的良好记录获得进入教职系列的职位,等等。虽说所有这些遵从传统有效地逼迫经济学家精通了现有的学术研究范式,希望弥补理论缺失部分的学者却对现有范式有独特的见解。假如对遵从传统的要求过多,也可能造成过犹不及,使一些重要议题被忽略,因为议题本身或者最适合的研究方法被排除在学术期刊能够接受的框架之外。

有关期刊投稿采纳情况的统计显示,学者尤其是面临教职申请压力的人,需要顺从学术期刊的要求。对期刊来说,拒稿是常态。有研究指出,影响力最大的前五大期刊在 2010 年前后的接受率仅为 6%(Card and DellaVigna, 2013),与大约 30 年前的水平(15%)相比下降了近 60%。

如此低的接受率不仅发生在排名前五的期刊。即使最优秀的经济学院系,其博士毕业生中也仅有一小部分能在毕业后 6 年里完成一定数量的学术发表。有学者(Conley and Önder, 2014)统计了美国 1986—2000 年的历届博士学位获得者在所谓“AER级别”(《美国经济评论》级别)期刊上的发表情况,他们发现“就算对最优秀的五个经济系而言,其后一半学生在经济学研究方面也难言成功。这几个院系的学生在截至毕业后第六年的‘AER级别’论文发表数的中位值均不足 0.1,大多数实际上是 0”。[11]此外,除普林斯顿大学(1.01)和罗切斯特大学(1.14)以外,所有经济学博士毕业生中排名第 80百分位的人的“AER级别”发表数均低于 1。[12]这些数据不止表明毕业生的论文发表率之低,还呈现随时间快速递减的趋势。截至毕业后第六年的“AER级别”论文发表数在 1987—1999 年各届下降了约 40%,而且对排名第 99、95、90、85、80、75 和 50 百分位皆如此(Conley et al. ,2013,表 3,第 1263页)。上述发现还得到了另一项针对 1996—1997 学年美国博士毕业生的 10 年期跟踪调查的印证(Stock and Siegfried, 2014)。[13]该调查显示,对于在毕业之初即获得“持续性学术职位”(即教职系列岗位)的大约一半受访者来说,在排名前 50 的经济学期刊的发表数中位值仅为 1,平均值仅为 2.0。[14]

面临教职申请压力的学院派年轻经济学家没有多少选择。即使有某些不同于编辑和审稿人的观点,他们也必须遵从现实。首先,甚至在落笔之前,他们就要考虑最终成果能否被期刊接受。接下来他们还必须考虑如何设计,例如,是准备一篇“AER风格”的论文,还是一篇“REStud风格”(《经济研究评论》)的论文。我们对此缺乏统计数据,关于能否被学术期刊接纳的顾虑会如何影响初始研究决策。不过埃利森(2002b)收集的统计资料表明,学术期刊如何在另外一个方面日益增强了对论文作者的影响力。

埃利森(2002b,第 984 页)发现,在 20 世纪 60 年代之前,“修订并重新提交”的现象相当罕见。即使出现此类情况,作者也会很快重新提交修订版,极少被拒稿。然而,他收集的系列数据表明,从论文提交到最终被接受的时间跨度出现大幅增加,对经济学和其他学科均是如此。有数据可查的 9 种经济学期刊的评审时间跨度平均延长了 185%,从 1970 年的 6.1 个月到 1999 年的17.3 个月。[15]

艾利森进一步分析了不同学术期刊的审稿期延长的构成:从投稿到获得初次评审意见,以及从首次要求修订和重新提交到最终接受。他总结说,“审稿期延长中约有 1 /4 是由于期刊需要更长的时间完成初次评审”。[16]由此意味着剩余 3 /4 的延时是源于修订和重新提交的要求增加。而这一过程基本上是响应评审人提出的意见,要求可能被录用的论文提高研究精确性。该证据显然是硬研究日益受到重视的一个表现,另外也说明,对研究硬度的要求增加很大程度上来自学术期刊本身的要求。

埃利森另外提到一个指标:每篇论文的篇幅。他指出,经济学期刊上发表的文章有了更详细的简介、更多样的结论推广以及更冗长的参考文献(Elli son, 2002a,第 994—995 页)。所有这些自然都与本文所谈的研究硬度加强有关。就排名前五的期刊而言,每篇论文的篇幅在 1970 年到 2010 年几乎增长了3 倍。[17]

总之,尤其对年轻学者来说,整个经济学界具有高度的竞争性,而且竞争强度仍在快速加剧。学术研究的市场——经济学期刊——给学者留下的选择极为有限,只能提前揣测编辑与审稿人的偏好,甚至从论文构思阶段就得着手。他们还必须顺从编辑与审稿人的反馈意见,尤其是在有幸得到修订和重新提交的机会之后。这些统计数据揭示了我这个年龄的几乎每个研究型经济学家从自身经历中得到的感受:随着时间推移,学术期刊的这些要求变得越来越偏执,越来越强调研究的硬度。

另外,对硬研究的偏向性可能会牺牲课题的重要性。针对经济学毕业生开展的一项调查发现,仅有 3%的经济学家认为对自己成功“非常重要”的是“掌握完善的经济学知识”,相比之下,有 65%的人认为“擅长于问题求解”非常重要(Colander and Klamer, 1987,表 4,第 100 页)。在要求受访者回顾自己博士研究生阶段的培养重点时,来自两个不同群组的毕业生中有超过一半人认为自己的项目“不够重视理论在现实世界中的应用”(Stock and Hansen,2004,第 267 页,表 1)。此类看法说明,由于偏重研究的硬度,而忽视课题的重要性,存在诱导疏忽之罪的氛围。

7.疏忽之罪的案例

本节将介绍几个与我本人的近期研究有关的疏忽之罪的案例,下节还将探讨这些案例带来的启示。

关于未能成功预见金融危机

2008 年金融危机之后,公众质疑经济学界为什么无人做出预测,或者说做出较符合现实的预测。拉詹曾回应说,原因在于做这种预测要求对多个分支研究领域的理论和制度有深入了解,包括金融、房地产以及宏观经济学等(Rajan, 2011)。

有意思的是,在 2008 年之前,上述分支领域对后来被视为本轮危机爆发根源的各种因素都做过细致分析。[18]相关的学术成果包括:把可疑资产用作抵押品造成资产价格恐慌抛售和暴跌的可能性;其他尾部风险来源;住房市场泡沫;抵押贷款标准的严重削弱;证券发行人给评级机构付费带来的利益冲突;宏观经济与金融体系的相互作用等。[19]所有因素都被分析过,却只有拉詹一人勉强跨越了全部必要的分支领域边界,对危机做出了较为属实的预测(Rajan, 2005)。

学者们有动力解答谜题的关键组成部分,但缺乏将其拼接起来的动力。按照卡瓦列罗(Caballero, 2010)的说法,对经济学理论而言,面面俱到的模型已不再能得到发表机会。此类模型会被视为过分远离精确的简要理念,如简化版新凯恩斯主义模型或动态随机一般均衡模型(DSGE)背后的理念,因此太缺乏研究硬度,没有发表的价值。[20]

至于从实证研究中得出的预测,关键数据可能存在错误,尾部风险的数据可能关系重大。即使一位经济学家非常幸运或者睿智地获得了必要数据,并认识到其中的含义,他也还有一道障碍需要跨越。例如,即使这位学者发现美国国际集团(AIG)对价值 5330 亿美元的信用违约掉期(CDS)等证券做了保险承诺,他依然需要将其转化为一篇可发表的论文的基础。[21]金额如此庞大的尾部风险足以给整个金融体系造成巨大冲击,却也只是个单独的数字,不属于实证经济学论文中通常依赖的统计学类型的证据。

对研究的这一硬标准导致疏忽之罪的案例在危机过去十余年的今天依然具有意义。莱因哈特与罗高夫(Reinhart and Rogoff, 2009)告诉我们“这次不一样”,其实是说没有什么不同。[22]如今,为防止金融危机再现,政策制定者需要预测下次崩溃可能发生在何时何地以及会以何种形式,正如他们在 21 世纪头 10 年早期迫切需要此类研究一样。当时,对学术发表的硬标准造成学者们没有激励做此类预测,而今并无二致。

关于动机问题

在传统经济学理论中,动机来自关于人们希望把什么目标最大化的先验假设。但还有一个局限性小得多、更具普遍意义的对若干可能动机的概括:人们在做决策的时候,往往受到自己所讲故事的推动。[23]也就是说,鉴于人们的思考能通过讲故事来描述,就意味着人们是通过自己讲述的故事来赋予动机的。[24]社会学与文化人类学的研究核心是人种志(ethnography),其目标正是发现和诠释人们给自己讲的故事。然而,这一领域采用的案例研究的解释方法被认为太缺乏硬度。

之前的逻辑表明,通常而言,不利于软研究和新观念的偏向性会导致行为解释方法在经济学中被压抑。该逻辑同时表明,我们采用的行为研究模型依然有较大的局限性,未能充分吸收强调故事作用的社会学与人类学中的理念。

案例研究能帮助我们看清什么才是理论模型需要的出色假设,并显示出行为模型相比传统模型的优势。经济学家当前采用的弗里德曼式方法回避了对模型的假设基础的检验,让我们远离案例研究。对疏忽之罪的一个良好弥补是关注人们自己讲述的故事,但这不在经济学家先验性地视为“效用”基础的范围之内。下文包含四个案例,都显示了故事在经济活动中未受重视的作用。

案例 1:苏联[25]对苏联经济的分析揭示了中央计划体制的失败。[26]可是这一分析忽略了另一个或许同样关键的负面特征。布尔什维克宣传的故事说,有计划的强制工业化会快速创建经济天堂,因此对计划的哪怕极微小的干扰也需要施加最严厉的惩罚。[27]

这种故事给实施残酷手段提供了合法性。根据苏联的第一个五年计划,工业会向农业提供拖拉机,以生产粮食;农业则会向工业提供粮食,以生产拖拉机。但根据故事的说法,当乌克兰提供的粮食未达到计划目标时,责任不在计划本身。产量缺口必须归咎于破坏分子,这些人很快被作为富农找出来,然后正当地被驱逐出去,某些被送到西伯利亚。强制人口驱逐进而导致粮食供应继续减少,特别是因为较为富裕的农民给计划目标贡献的份额其实更高。最终,乌克兰的农民被强制加入集体农庄,去那里使用据说将由工业提供的拖拉机。这一行动使当地的灾难再度恶化,因为农民把牛马带入农庄或许是个巨大的负担,很可能让自己被划入富农行列。于是当拖拉机并未出现或者难以运转时,粮食产量继续下跌,乌克兰大饥荒随之而来。在这一悲剧的每个步骤中,“故事”都发挥着关键作用,它使暴力措施合法化,以推行破坏性的计划。

案例 2吸烟与健康。关于吸烟的经济学研究文献不少,例如有研究测算了烟草税对香烟需求量的效应。[28]不过,在吸烟与健康方面,经济学家很大程度上忽视了另一类做得非常成功的公共政策。美国医务总监(Surgeon General)路德·特里(Luther Terry)于 20 世纪 60 年代早期组织了一个顾问委员会来整理对这个问题的已有认识。其最终成果《吸烟与健康:美国公共卫生署医务总监顾问委员会的报告》改变了对吸烟问题的正统观点。[29]以此为基础,美国政府给出了官方说法:“吸烟是件蠢事”。[30]由此驳斥了烟草产业关于吸烟与健康的关系没有定论的辩解。接下来,禁烟运动者利用这一故事推动了重大行动,促成广播和电视禁播烟草广告,并在后来确立了禁止在室内公共场所吸烟的规范。室内禁烟令的效果极为突出:烟民在室外每吸一口烟时的表情都给路人传递着“吸烟是件蠢事”的第一手信息。[31]从医务总监的报告发表至今,美国成年人的吸烟率从 42%剧减至 15.5%。[32]故事讲述在吸烟经济学研究中只扮演了一个龙套角色,但假如没有不利于软理论和软证据的约束,这个故事本应该是经济学舞台上的明星。[33]

案例 3全球变暖。在全球变暖议题的正统经济学研究中,故事同样缺位。其实除气候变化本身的现实问题之外,还有人们不愿面对的第二个真相。在美国公众当中,不止有部分人把全球变暖视为彻底的骗局,[34]还有更多人没有意识到问题的迫切性。[35]年复一年,那些为迟迟不采取行动而辩护的故事,与全球变暖的现实一样发挥着作用。[36]与作为气候变化经济学核心议题的限额与交易制度和碳税相比,这些故事如何编写,如何改变,其影响同样重要。

案例 4:宏观经济学。相当长时间以来,希勒一直在强调叙事对经济学研究的意义(Shiller, 2005)。他在美国经济学会所做的题为“叙事经济学”的主席演讲提供了更多例子(Shiller, 2017)。其中包括自大萧条以来货币供给(M)与名义国民收入(Y)维持近乎稳定的比率,或许并不像弗里德曼与施瓦茨(Friedman and Schwartz, 1963)宣称的那样表明M导致Y。[37]希勒指出,实际情况可能是当萧条来临、收入下降时,人们给自己讲述的故事会减弱他们持有货币的意愿。因此,他认为弗里德曼与施瓦茨关于货币供给作用的结论其实忽略了一个变量:人们给自己讲述的故事。

8.对几个疏忽之罪案例的看法,以及它们尚未引起质疑的原因

从上节介绍的几个案例中,我们还能看到经济学研究中如此多疏忽之罪仍未受到质疑的原因。

库恩的《科学革命》( Scientific Revolutions,Kuhn, 2012)认为:当“常规科学”在普遍接受的现有范式下发现“异常”时,科学进步就会发生。接下来将由“科学革命”对不断积累的矛盾做出解释,形成更好的新理论范式。然而,库恩对科学进步的这一乐观主义观点没有考虑到经济学特有的一种可能性。假如理论范式不只是描述某个领域的主题,还关系到该领域适用的方法论,此时,如果与现有范式相抵触的观察现象同时违背了既有的方法论,它们可能会被弃之不顾。硬研究的标准会把这些现象当作不可采信的证据。

我们还可以换一种方式来表达上述观点。韦伯英语词典给“经济学”提供了两种定义,第一种是以研究主题来描述的:“主要描述和分析产品与服务的生产、分配及消费的一门社会科学”。[38]第二种定义则是:“经济学的理论、原则及其实践等”,这对应于经济学博士生项目讲授的内容。按克雷黑德(Craighead, 2010)的说法,“经济学博士生项目试图把学生训练成高产出的研究者,而不是教他们理解经济”。也就是说,博士生所学的其实是做经济研究的硬方法,即数学建模与统计分析。

对上节案例的简要回顾表明,按照对经济学的第二种方法论定义,它们都不符合“疏忽之罪”的说法,因为每个案例都需要研究生院通行课程之外的研究方法或证据采信。通过卡瓦列罗的论述,我们看到对暴跌的理论分析需要超越现有的经济学研究方法论,其中的实证预测则需要探讨尾部风险,而这方面的证据不太可能符合统计模式。还有,“故事”在这四个案例中的作用从方法论定义看都不能归入疏忽之罪,因为这些故事都难以用统计方法观测。然而,从经济学的第一个定义,即研究主题来看,此类案例均属于疏忽之罪。金融崩溃显然属于经济学研究的主题;四个“故事”的缺失都涉及具有相当重要性的经济问题的分析。

9.综述和结论

在介绍本文分析的启示之前,有必要强调一下已提及和未提及的内容。通过硬研究标准取得的现代经济学理论和实证成就理应值得庆贺,但这些标准不能一刀切地适用于所有经济问题,特别是,不能适用于那些会因为这些标准而过分受到局限的问题:缺乏数据证据的问题,或动机与标准经济学假设有所不同的问题。不同的领域需要不同的工具,帆船对跨越沙漠没有帮助,骆驼则无法横渡海洋。

关于该如何开展经济学研究的规范应该提倡方法论上的灵活性,而非固执于方法上的纯粹性,虽然这种纯粹性对某些重要问题可能非常适合,却让其他问题和方法遗失在经济学研究范围之外。

在历史上,这些理论范式,即经济学研究应如何开展以及“经济学研究”由哪些要素构成的规范,是通过演化过程发展起来的。无论是某个领域所得结论的最优化,还是经济研究最终形成的制度,都不能视为理所当然。[39]在学术期刊里,哪些论文应该或不应该发表的规范,对编辑和审稿人的遴选以及这些人的表现,都应该成为反思的对象。同样,大学也应该反思职称评定和晋升的程序。正如著名的 1910 年《弗莱克斯纳报告》曾对美国医学界带来深刻影响那样(Starr, 2008),在经济学界的出版与晋升方面,如今也需要一份类似的报告。

此类报告应包含两个单独部分。第一部分分析与学术期刊编辑及审稿人扮演的角色有关的规范,如前文所述,从投稿到接受的时间过分漫长(Ellison,2002a, b),按照编辑和审稿人的口味,作者及其思想受制于时常重复的修订和再提交的要求。

把论文的所有权还给作者,不仅是代表对他们的更大尊重,也符合前五大期刊中的两家的明确宗旨:《美国经济评论》与《经济研究评论》都在刊名中包含“评论”(Review,意指评审、复查)字样。按我的理解,“评论”的含义是说一家期刊接到投稿后,决定接受哪些,拒绝哪些。意思是让编辑和审稿人把自己视为助手,而非像独裁者一般,在最终接受投稿前向作者勒索赎金。

报告的第二部分应该介绍与晋升的标准和方法相关的恰当规范是什么样的。需要反思的具体内容应包括:基于学术发表而设计的评分指标是否恰当(例如在前五大期刊上发表的论文篇数),以及在国际上,过分强调在美国期刊上的论文发表甚至美国的相关数据是否恰当等。

这些改革建议可以减轻过分强调硬研究造成的疏忽之罪。此外,尽管没有解决新入行者面临的过度竞争问题,改革仍能给他们带来某些安慰,鼓励他们做自己最擅长的工作。另外,对全体经济学家而言,这能让我们从自己内心出发,以最好的方式表达自己的真实思想。

(余江 译)

参考文献

Akerlof, George, and Pascal Michaillat. 2017.“Beetles: Biased Promotions and Persistence of False Belief. ”NBER Working Paper 23523.

Akerlof, George A. ,and Robert J. Shiller. 2015. Phishing for Phools: The Economics of Ma-nipulation and Deception. Princeton: Princeton University Press.

Akerlof, George A. ,and Dennis J. Snower. 2016.“Bread and Bullets.”Journal of Economic Behavior and Organization 126 (2B):58-71.

Akerlof, Robert J. 2017.“Value Formation: The Role of Esteem.”Games and Economic Be-havior 102 (1):1-19.

Bernanke, Ben S. ,and Mark Gertler. 1995.“ Inside the Black Box: The Credit Channel of Monetary Policy Transmission.”Journal of Economic Perspectives 9 (4):27-48.

Brandt, Allan M. 2007. The Cigarette Century: The RiseFalland Deadly Persistence of the Product That Defined America. New York: Basic Books.

Brock, William A. ,and Steven N. Durlauf. 1999.“ A Formal Model of Theory Choice in Science.”Economic Theory 14 (1):113-30.

Caballero, Ricardo J. 2010.“Macroeconomics after the Crisis: Time to Deal with the Pretense-of-Knowledge Syndrome.”Journal of Economic Perspectives 24 (4)85-102.

Card, David, and Stefano DellaVigna. 2013.“ Nine Facts about Top Journals in Economics.” Journal of Economic Literature 51 (1):144-61.

Casadevall, Arturo, and Ferric C. Fang. 2014a.“Causes for the Persistence of Impact Factor Mania.”MBio 5 (2):e00064-14.

Casadevall, Arturo, and Ferric C. Fang. 2014b. “Specialized Science.”Infection and Immu-nity 82 (4):1355-60.

Colander, David, and Arjo Klamer. 1987.“The Making of an Economist. ”Journal of Eco-nomic Perspectives 1 (2):95-111.

Cole, Stephen. 1983.“The Hierarchy of the Sciences?”American Journal of Sociology 89(1):111-39.

Collier, Paul. 2016.“The Cultural Foundations of Economic Failure: A Conceptual Toolkit. ”Journal of Economic Behavior and Organization 126 (2B):5-24.

Comte, Auguste. 1853. The Positive Philosophy of Auguste Comte,Freely Translated and Con-densed by Harriet Martineau. London: J. Chapman.

Conley, John P. ,Mario J. Crucini, Robert A. Driskill, and Ali Sinaönder. 2013.“ The Effects of Publication Lags on Life-cycle Research Productivity in Economics.”Economic Inquiry 51(2):1251-76.

Conley, John P. ,and Ali Sina Önder. 2014.“The Research Productivity of New PhDs in E-conomics: The Surprisingly High Non-success of the Successful. ”Journal of Economic Perspectives 28 (3):205-15.

Craighead, William D. 2010.“Grad School Advice: Considering Graduate School in Economics?”Accessed May 15,2018. https://sites.google.com/site/wdcraighead/grad-school-advice.

DeCicca, Philip, Donald Kenkel, and Alan Mathios. 2002.“ Putting out the Fires: Will Higher Taxes Reduce the Onset of Youth Smoking?”Journal of Political Economy 110 (1):144-69.

DeCicca, Philip, Donald Kenkel, Alan Mathios, Yoon-Jeong Shin, and Jae-Young Lim. 2008.“Youth Smoking, Cigarette Prices, and Anti-smoking Sentiment. ”Health Economics 17 (6):733-49.

Edwards, Franklin R. 1999.“Hedge Funds and the Collapse of Long-Term Capital Manage-ment. Journal of Economic Perspectives 13 (2):189-210.

Ellison, Glenn. 2002a.“Evolving Standards for Academic Publishing: A q-r Theory.”Jour-nal of Political Economy 110 (5):994-1034.

Ellison, Glenn. 2002b. “The Slowdown of the Economics Publishing Process.”Journal of Political Economy 110 (5):947-93.

Ericson, Richard E. 1991.“ The Classical Soviet-Type Economy: Nature of the System and Implications for Reform.”Journal of Economic Perspectives 5 (4):11-27.

Financial Crisis Inquiry Commission. 2011. The Financial Crisis Inquiry Report: Final Report of the National Commission on the Causes of the Financial and Economic Crisis in the United States. New York: Public Affairs.

Flyvbjerg, Bent. 2006.“ Five Misunderstandings about Case-Study Research. ”Qualitative Inquiry 12 (2):219-45.

Fourcade, Marion, Etienne Ollion, and Yann Algan. 2015.“The Superiority of Economists.”Journal of Economic Perspectives 29 (1):89-114.

Freeman, Richard B. 1999.“ It’s Better Being an Economist (But Don’t Tell Anyone) .”Journal of Economic Perspectives 13 (3)139-45.

Frey, Bruno S. 2003.“ Publishing as Prostitution? Choosing between One’s Own Ideas and Academic Success.”Public Choice 116 (1-2):205-23.

Friedman, Milton. 1953.“The Methodology of Positive Economics.”In Essays in Positive E-conomics,3-43. Chicago: University of Chicago Press.

Friedman, Milton, and Anna Jacobson Schwartz. 1963. A Monetary History of the United States1867-1960 . Princeton: Princeton University Press.

Garai, Laszlo. 2017. Reconsidering Identity Economics: Human Well-being and Governance.New York: Palgrave Macmillan US.

Gramlich, Edward M. 2007. Subprime Mortgages: America’s Latest Boom and Bust. Washington,DC Urban Institute Press.

Healy, Paul M. ,and Krishna G. Palepu. 2003.“The Fall of Enron.”Journal of Economic Perspectives 17 (2):3-26.

Heckman, James J. ,and Sidharth Moktan. 2017.“Publication and Promotion in Economics:The Curse of the Top Five.”Slides presented at the 2017 Institute for New Economic Thinking (IN-ET) Conference, Edinburgh.

Inhofe, James M. 2012. The Greatest Hoax: How the Global Warming Conspiracy Threatens Your Future. Washington, DC: WND Books.

Jiang, John Xuefeng, Mary Harris Stanford, and Yuan Xie. 2012.“Does It Matter Who Pays for Bond Ratings? Historical Evidence.”Journal of Financial Economics 105 (3):607-21.

Kiyotaki, Nobuhiro, and John Moore. 1997.“Credit Cycles.”Journal of Political Economy 105 (2):211-48.

Kuhn, Thomas S. 2012. The Structure of Scientific Revolutions. 4th ed. Chicago: University of Chicago Press.

Leland, Hayne, and Mark Rubinstein. 1988.“Comments on the Market Crash: Six Months After.” Journal of Economic Perspectives 2 (3):45-50.

Lowenstein, Roger. 2000. When Genius Failed: The Rise and Fall of Long-Term Capital Manage-ment. New York: Random House.

Mankiw, N. Gregory. 2006.“ Why Aspiring Economists Need Math. ”Greg Mankiw’s Blog,September 15. Accessed May 15,2018. https://gregmankiw.blogspot.com/2006/09/why-aspiring-economists-need-math.html.

McCloskey, Deirdre. 2014.“What Economics Is on the Wrong Track. ”In Economics of E-conomists: Institutional SettingIndividual Incentivesand Future Prospects,edited by Alessandro Lanteri and Jack Vromen, 211-42. Cambridge: Cambridge University Press.

Morson, Gary Saul, and Morton Schapiro. 2017. Cents and Sensibility: What Economics Can Learn from the Humanities. Princeton: Princeton University Press.

Partnoy, Frank. 2003. Infectious Greed: How Deceit and Risk Corrupted the Financial Markets. London: Profile Books.

Rajan, Raghuram G. 2005.“ Has Financial Development Made the World Riskier?”Paper presented at the Federal Reserve Bank of Kansas City Economic Policy Symposium, Jackson Hole.

Rajan, Raghuram G. 2011.“ Why Did Economists Not Foresee the Crisis?”Project Syndi-cate, February 7. Accessed May 15,2018. https://www.project-syndi-cate.org/commentary/why-did-economists-not-fore-see-the-crisis?barrier=accessreg.

Reinhart, Carmen M. ,and Kenneth S. Rogoff. 2009. This Time Is Different: Eight Centuries of Financial Folly. Princeton: Princeton University Press.

Shiller, Robert J. 2005. Irrational Exuberance. 2nd ed. Princeton: Princeton University Press.

Shiller, Robert J. 2012. The Subprime Solution: How Today’s Global Financial Crisis Happenedand What to Do about It. Princeton: Princeton University Press.

Shiller, Robert J. 2017.“ Narrative Economics.”American Economic Review 107 (4 ):967-1004.

Shleifer, Andrei, and Robert Vishny. 2011.“Fire Sales in Finance and Macroeconomics.”Journal of Economic Perspectives 25 (1):29-48.

Smith, Laurence D. ,Lisa A. Best, D. Alan Stubbs, John Johnston, and Andrea Bastiani Archibald. 2000.“Scientific Graphs and the Hierarchy of the Sciences: A Latourian Survey of In-scription Practices.”Social Studies of Science 30 (1):73-94.

Starr, Paul. 2008. The Social Transformation of American Medicine: The Rise of a Sovereign Profession and the Making of a Vast Industry. New York: Basic Books.

Stock, Wendy A. ,and W. Lee Hansen. 2004.“Ph. D. Program Learning and Job Demands: How Close Is the Match?”American Economic Review 94 (2)266-71.

Stock, Wendy A. ,and John J. Siegfried. 2014.“Fifteen Years of Research on Graduate Edu-cation in Economics: What Have We Learned?”Journal of Economic Education 45 (4):287-303.

US Centers for Disease Control and Prevention. 2017.“Current Cigarette Smoking among A-dults in the United States.”https://www.cdc.gov/tobacco/data_statistics/fact_sheets/adult_da-ta/cig_smoking/index.htm (accessed May 15,2018).

US Department of Health, Education, and Welfare. 1964. Smoking and Health: Report of the Advisory Committee to the Surgeon General of the Public Health Service. Washington, DC: Public Health Services.

US Department of Health, Education, and Welfare. 1979. Appendix: Cigarette Smoking in the United States1950-1978 . Washington, DC: US Public Health Services Office on Smoking and Health.

White, Lawrence J. 2010.“ Markets: The Credit Rating Agencies.”Journal of Economic Perspectives 24 (2):211-26.

本文已被如下文章引用:James J. Heckman, Sidharth Moktan. 2020. Publishing and Promo-tion in Economics: The Tyranny of the Top Five. Journal of Economic Literature 58:2,419-470.

*George A. Akerlof,伯克利加州大学经济学教授,2001 年诺贝尔经济学奖得主。原文“Sins of Omission and the Practice of Economics”发表于Journal of Economic Literature 2020,58 (2),第405—418 页。感谢作者和原期刊的授权。原文网页链接与作者声明参见:https://doi.org/10.1257/jel.20191573。

**本文基于作者同Pascal Michaillat的联合研究成果,见G. Akerlof and Michaillat (2017)。特别感谢如下人士:Robert Akerlof、 Hui Tong和Robert Johnson;以及在 2017 年 1 月召开的美国经济学会研讨会(Publishing and Promotion in Economics: The Curse of the Top Five?)上各位讨论者:James Heckman (主持人)、 Angus Deaton、 Drew Fudenberg以及Lars Hansen。感谢加拿大高等研究院(Canadian Institute for Advanced Research)提供的资助。

[1] Cole (1983).

[2] Smith et al. (2000).

[3] 在Ellison (2002a)的模型里,研究人员面临如下取舍:在研究的q质量上投资(相当于重要性),还是在r质量上投资(相当于研究硬度)。他认为,对于给q质量和r质量赋予不同权重的领域,会出现不同的主流习俗。

[4] 此处的引文对原文略有调整。“自视”在原文中加了重点下划线。

[5] 由Fourcade、 Ollion and Algan (2015)转引自Freeman (1999,第 141 页)。

[6] Mankiw (2006).

[7] Brock and Durlauf (1999)以及Akerlof and Michaillat (2017)的论文指出,当某个科学领域的参与者产生遵从的需要时,该业界的理念会趋同。Brock and Durlauf认为,科学家在持续调整各自的理念,以缩小彼此之间在思考和信念上的差距。我和Michaillat则认为,对教职申请者做评价的学者更喜欢与自己理念接近的人,而远离持不同理念者。在以上两种情形下,理念都在趋同。而且这种趋同未必是更靠近真理或者最优实践。相反,由于本文所谈的原因之一(硬研究对科学阶梯上的地位的影响)和原因之二(对硬研究容易达成共识),按照我与Michaillat提出的比较静态均衡分析,这些趋同的理念很可能也带有对硬研究的偏向性。对于一般情况下理念趋同的上述理论发现与库恩的观点基本一致,他认为科学家的研究通常是基于共同接受的范式(Kuhn, 2012),这些理论范式不仅涉及研究主题,还包括对相关领域适用何种研究方法的信念。

[8] 关于案例研究的优点,参见Flyvbjerg (2006)。

[9] 与本文主题相关的是,生物学领域中已经对过分专业化和强调研究硬度产生了反弹,可参见Casadevall and Fong (2014b)。

[10] 以期刊重要性因子给发表成绩赋予权重,是另一种达成共识的机制。

[11] 参见Conley and Önder (2014,第 212 页)。“为 0”意味着四舍五入为 0,而非 0.1;0.1 意味着四舍五入为 0.1。

[12] 当然他们的发现也并非全无亮点:尽管顶尖经济学院系整体表现强于排名靠后的学校,但不具有压倒性的优势。

[13] 当然,该调查的回复率很低,表明对这些发现的解释需要保持谨慎。在当年的 950 名有记录的毕业生里,仅有 207 位对调查做出了回复。调查是在授予学位的 10 年后开展的。

[14] 对于幸运地从初始就职机构获得教职系列职位的约1 /3 的受访者而言,在排名前50 的期刊的发表数中位值更低,仅为 0 (原因或许是所在学校的标准要求太低),平均值则为 1.8 (Stock and Siegfried, 2014,表 4,第 297 页)。

[15] Ellison (2002b,表 1,第 953 页)。

[16] Ellison (2002b,第 958 页)。

[17] 有学者测算出,从 20 世纪 70 年代早期到 2011—2012 年,前五大期刊发表的论文的平均篇幅从 16 页增加到 45.5 页(Card and DellaVigna, 2013,第 150 页,第 151 页图 4)。这里谈的论文长度“根据密度做了调整”。

[18] 可参阅美国金融危机调查委员会关于危机爆发的各种原因的报告(Financial Crisis Inquiry Commission,2011)。

[19] 在危机爆发后对之前发表的文章的评论表明,危机的每个重要方面都曾是经济学家研究的主题。例如,关于恐慌性抛售导致的崩盘,参见Shleifer and Vishny (2011),Kiyotaki and Moore(1997);关于加大尾部风险的现期利润误计,参见Healy and Palepu (2003 ),Partnoy(2003);关于住房市场,参见Gramlich (2007),Shiller (2012);关于给评级机构付费带来的利益冲突问题,参见White (2010),Jiang、 Stanford and Xie (2012);关于宏观经济与金融体系的相互作用,参见Bernanke and Gertler (1995)等。

[20] Caballero (2010)以此解释为什么宏观经济学家没有预测到危机。他把宏观模型分为“核心类”和“边缘类”。核心模型属于DSGE模型或标准凯恩斯主义模型,另外还有相当多边缘类研究文献探索对核心理论的偏离,但每次只探讨一种偏离。他对这种建模策略给出了方法论上的解释:边缘类模型是为了探讨特殊机制,它们会围绕这些机制的根源做特定的假设,以消除可能干扰信息的不需要的效应(Caballero, 2010,第 91 页)。他提出,此类理论模型被允许对标准凯恩斯主义模型或DSGE模型每次有一个偏离,然而预测危机需要多个偏离,这不在学术发表的考虑范围之内。

[21] Financial Crisis Inquiry Commission (2011,第 141 页)。

[22] 2008 年之前的另两次事件也凸显了现代经济对金融冲击的脆弱性,甚至早于 21 世纪头 10 年早期的抵押贷款支持证券泡沫。关于长期资本管理公司(LTCM)破产带来的威胁,参见Ed-wards (1999)和Lowenstein (2000)。关于投资组合保险与 1987 年崩盘的研究,参见Lelandand Rubinstein (1988)。

[23] 这一普遍性远远超越目前行为经济学研究的范围。

[24]关于故事在经济学研究中的意义,参见Akerlof (2017)和Collier (2016)。类似的是,Mor-son and Schapiro (2017)的著作Cents and Sensibility同样强调了故事在经济学家的动机思考中的缺位。McCloskey (2014)也在近期总结“经济学出了什么问题”时提到叙事的作用。

[25] 本案例基于Akerlof and Snower (2016)。

[26] 对此的分析参见Ericson (1991)等。

[27] 关于苏联共产主义体制下的认同作用的解释,参见Garai (2017)。

[28] 有关参考资料,参见DeCicca、 Kenkel and Mathios (2002)等。

[29] US Department of Health, Education, and Welfare (1964)。

[30] 对此及之后情形的解释,参见Akerlof and Shiller (2015,第 8 章)。

[31] Brandt (2007,第 267 页、第 288 页)。

[32] 1964 年的吸烟率为 42%,参见US Department of Health, Education, and Welfare (1979,表 2,第A-10 页)。2017 年的吸烟率为 15.5%,参见US Centers for Disease Control and Prevention(2017)。

[33] 有研究显示(DeCicca、 Kenkel and Mathios, 2002; DeCicca et al. ,2008),如果在反吸烟情绪更强烈的各州,立法者不愿意投票支持提高烟草税,吸烟的需求弹性会被高估。这些研究对于把“吸烟是件蠢事”带入吸烟经济学研究很有帮助。然而“反吸烟情绪”不需要只作为自变量来看待(DeCicca et al. ,2008),为理解它的完整作用,必须也作为因变量来看待。这样还会给反吸烟政策增加一个被忽略的政策变量。

[34] 参见Inhofe (2012) 等

[35] 2017 年 3 月的盖洛普环境问题调查中,45%的美国人说,他们对全球变暖“非常担忧”,参见:http://www.gallup.com/poll/206030/global-warming-concern-three-decade-high.aspx。然而,在与他们感到“非常担忧”的其他议题一起排序时,全球变暖通常被列在底部或接近底部。在2015 年 3 月的调查中,全球变暖被排在 15 个议题的最末一位,此前一年是第 14 位。参见:http://www.gallup.com/poll/182018/worries-terrorism-race-relations-sharply.aspx。

[36] 还有,公众对碳税的厌恶是另一个阻碍气候变化应对政策的古怪故事。

[37] Shiller (2017,第989 页)。(《叙事经济学》中文版,见中信出版集团2020 年版。——编者注)

[38] https://www.merriam-webster.com/dictionary/economics.

[39] 进化过程可能带来的非最优结果,参见Brock and Durlauf (1999 ),Akerlof and Michaillat(2017)。