· 发现噪声
判断永远不可能完美,但可以尽量准确
测量,在日常生活中的含义与其作为科学术语时的含义是一样的,就是使用测量工具给某个对象或事件在一定标尺上赋值。比如,你可以使用卷尺测量地毯的长度,也可以使用温度计来测量温度——无论是华氏还是摄氏度。
判断与此类似。法官为罪犯量刑就是依据罪行程度为刑期赋值,核保员会为每一项风险设定一个值(用金额表示),医生做出的诊断也是如此。需要指出的是:判断结果并不一定是数字,“排除合理怀疑”“黑素瘤晚期”“建议手术”等也是判断。
因此,我们可以将“判断”描述为使用人类大脑作为工具的一种测量。测量这一概念隐含着准确性的目标——逼近真实值和使错误最小化。做出判断不是为了让人印象深刻,不是想表明立场,也不是为了说服他人。需要注意的是:此处的“判断”源自专业心理学文献,比日常语境中该词的含义要窄得多。判断不等同于思考,“做出准确判断”也不等同于“拥有良好的判断力”。
根据我们的定义,判断是可以用一个单词或一个短语总结出的结论。如果情报分析师写了一篇很长的报告,得出某国政权不稳定的结论,那么只有这个结论才是判断。判断就是测量,既与做出判断的心理活动相关,也与这项心理活动的结果相关。在英语中,“judge”除了表示“判断”,也指代做出判断的人,而这个人并不一定是法官。
虽然判断力求准确,但即使是在科学测量中,也不可能完美地达到这一目标,更别提判断了。在判断中总会存在一些误差,其中一些是偏差,一些是噪声。
为了让你了解噪声和偏差是如何导致误差的,我们邀请你花不到一分钟的时间来玩一个游戏。如果你的智能手机上有带计时功能的秒表,那么利用它,你可以在不看显示器且无须暂停的情况下,测量连续的间隔时间。你的目标是在不看手机的情况下,让秒表连续记录5段10秒的时间。在开始之前,你最好先感受几次10秒有多长。
现在看一下你的手机上记录的每一段间隔时间。当然,手机难免也会存在一些误差,但这种误差很小。你会发现,手机上记录的每一段时间并非都是10秒,而且差距相当大。你试图精确地重现相同的时间,但根本无法做到。这种你无法控制的差异就是一个关于噪声的例子。
这一点都不奇怪,因为就人的生理和心理而言,噪声无处不在。毋庸置疑,不同的个体在生理上是存在差异的,这就像同一个豆荚中没有两颗完全相同的豌豆。在个体内部同样存在差异,比如,你的心跳不可能是完全规则的,你不可能完全准确地重复同一个姿势。如果有一个听力学家帮你检查听力,可能一些声音太小,你完全听不见;一些声音很大,你总能听见;然而,总有一些声音,你有时能听见,有时又听不见。
现在看看你手机上的5个数字。看出来一些规律了吗?例如,是每一段时间都短于10秒吗?如果是,那么这意味着你内心的钟表跑得太快了。在这个简单的任务中,偏差指的是你的平均时间与10秒之差(无论是正的还是负的)。噪声导致了结果的差异,其外在表现类似于我们之前看到的散点图。在统计学中,标准差是测量差异的最常见指标,我们将用标准差来测量判断中的噪声。
你可以把大部分判断,尤其是预测性判断与你刚刚做出的判断看成一回事,当做出预测时,我们在试图接近真实值。例如,经济分析师的目标是尽可能接近下一年国内生产总值增长的真实值,医生的目标是试图做出正确的诊断。(需要注意的是,本书中的“预测”一词并不是指对未来进行预测,在我们看来,对现有病情的诊断也是一种预测。)
我们会充分利用“判断”与“测量”之间的类比来帮你理解判断中的噪声。进行预测性判断的人就像瞄准靶心的射击手或试图测量粒子真实重量的物理学家,判断中的噪声则意味着误差。简而言之,当判断的目的在于获得真实值,两个不同的判断就不可能都对。就像测量一样,在某些特定任务中,有些人可能会由于技能水平不高或训练不足,比其他人产生更多的误差。当然,做出判断的人也同样远非完美。因此,我们需要了解和测量他们的误差。
当然,大部分专业判断比测量间隔时间要复杂得多。在第4章,我们会对不同类型的专业判断做出界定,并探究它们的目标。在第5章,我们将讨论如何测量误差,以及如何量化系统噪声对误差的影响。在第6章,我们会进一步分析系统噪声并分析其组成部分,即不同类型的噪声。在第7章,我们将探讨其中一种噪声:情境噪声。在第8章,我们将展示群体如何常常在判断中放大噪声。
通过这几章,我们会得出一个简单的结论:同所有测量工具一样,人类的大脑并不完美,其中同时存在偏差和噪声。为什么会这样?会有多少偏差和噪声?让我们一起来揭开谜底吧。