3 心理物理学方法
心理物理学的先驱者是G.T.Fechner(1801—1887)。作为一位哲学家,他始终关心心理与物理的关系问题,千方百计地企图在物理刺激与感觉之间发现某种定量的关系。据说,有一天他忽然发现,在日常生活中可以观察到这样一种数量关系,即感觉强度的增长同刺激的增长并不是1:1的关系——也许可以说感觉强度按算术级数增长,而与此形成对照的刺激的增长则是以几何级数为特征。如果一只铃在响,增加第二只铃响对我们造成的印象要比10只已经在响的铃加添一只铃强烈得多;假如4~5根蜡烛正在发光,加添另一根只能造成微乎其微的差别,而如果原来只有2根蜡烛,它所造成的影响就相当大。刺激的作用不是绝对的,而是相对的;即同已经存在的感觉量相关。
Fechner通过对感觉强度与刺激强度之间的数量关系的长期研究,发展出了测量感觉的基本方法。1860年,他出版了《心理物理学纲要》一书,为心理物理学研究方法的发展奠定了基础。他给心理物理学下的定义是:一门研究心身之间或心物之间的函数关系的精密科学。它的范围包括感觉、知觉、感情、行为、注意等。
一百多年来,心理物理学方法不断发展,但它的中心问题仍然是物理量(对身体各感官的刺激)与心理量(各种感觉或主观印象)之间的数量关系问题。
本章讨论两个问题:感觉阈限的测量以及阈限以上感觉的测量。
一、感觉阈限的测量
在讨论感觉阈限的测量之前,我们首先应当区分感觉及其刺激。我们先举几个例子。第一,设想在北京9月中你跳进郊外小河游泳,入水一刹那你会感觉很凉,但过了一会儿,你就觉得不那么凉了。河水的物理温度刺激(例如19℃)是一回事,你的主观感觉(温度感觉)又是另一回事。第二,如果有人问你,1kg棉花重还是1kg铅重?你也许会脱口说“铅重”。实际上它们的重量是一样的。但如果“重”是指重量感觉,那么,的确1kg铅会感觉比1kg棉花重些,这就是所谓形重错觉。有人曾在课堂上演示过,大学生通常把720g的枕头判断为与30~225g之间某种重量铅同样重。重量感觉与物体的重量是不一样的。第三,白天你去看电影稍迟了一会,电影厅灯光已关掉,刚进电影厅你会觉得什么都看不清,但1~2min后,你会看到座椅上的号码。在这里,电影厅残留的灯光(如出口的灯光等)亮度是一回事,你主观感觉到的明度又是一回事。
因此,我们必须把物理刺激及其引起的感觉区分开。物理刺激可以用仪器测量,如光线的亮度(luminance)用光度计(photometer)测;声音的强度或声压水平(sound pres-sure level)用声级计(sound level meters)测;物体的重量(weight)用秤(scale pans)测;物体的温度(temperature)用温度计(thermometer)测等。那么,对由上述物理刺激而分别引起的主观感觉即明度(brightness)、响度(loudness)、重量感觉(heaviness)以及温度觉(warmth)又该怎样测量呢?这可以说是整个心理物理学探讨的问题,这一节我们就来讨论感觉阈限的测量。
刚刚能引起感觉的最小刺激强度被叫作绝对阈限(absolute threshold),按照这种说法,低于绝对阈限的刺激强度我们是感觉不到的,而高于绝对阈限的刺激强度我们总是能感觉到的(见图3-1)。
图3-1表示,单位为4的某种刺激或4以上的刺激我们能100%地觉察。而低于4的刺激我们则永远也不能觉察。表3.1列出了某些近似的觉察阈限值。但是,这些觉察阈限值是否真的具有图3-1所示的性质呢?安静条件下,20ft31处的表声总是100%地能听到吗?不一定。实际情况是,由于测试环境的微小变化以及被试注意状态、情绪动机等的微小变化,20ft以外的表声有时仍能听到,而20ft以内的表声,有时却听不到,正好20ft处的表声有时能听到,有时不能听到。换句话说,绝对阈限并不是如图3-1所假设的那样,是一种100%地引起感觉,而低于它,则0%地引起感觉的刺激强度。实际上,从听到到听不到的感觉变化,对应于一系列强度由小到大的声音刺激,对强度小的声音刺激,我们听到的概率小些,对强度大的声音刺激,我们听到的概率大些,换句话来说,即绝对阈限不是一个单一强度的刺激,而是一系列强度不同的刺激。因此,人们就把绝对阈限定义为:有50%的次数能引起感觉;50%的次数不能引起感觉的那一种刺激强度。这种定义的图示见图3-2。
图3-1 绝对阈限示意图
图3-2 实测绝对阈限示意图
表3.1 某些近似的觉察阈限值*
从图3-2我们可以看到,同一个刺激有时能被感觉到,有时则不能被感觉到。例如,5个单位的刺激被感觉到的概率为75%,不被感觉到的概率为25%。对同一刺激有不同反应这一事实意味着阈限值是时时变动的。同样的道理,差别阈限是有50%的次数能觉察出差别,50%的次数不能觉察出差别的刺激强度的差别。例如,50g重量放在手掌上我们得到某种重量感觉,当50g重量增加1g时,我们如果有50%的次数感觉到51g刚好比50g重些,50%的次数感觉两者重量相同,那么1g就是差别阈限。差别阈限值也称最小可觉差(just noticeable difference, JND)。换句话来说,即1g重量是我们所能感觉到的最小的重量刺激增量。但是要注意,如果我们从100g重量开始,最小的刺激量增量就必须是2g,我们才会觉得100g重量与102g重量引起的两个重量感觉是不同的。所以,最小可觉差依赖原来不同的重量刺激值而不同,但它总是原先重量或称标准重量的2%。这个比例关系是由E.H.Weber(1795~1878)指出的,因此它被叫作Weber定律。Weber定律可以表示如下:ΔI/I=K,其中I是原先的强度(或称标准强度),ΔI是刚能够引起“较强”感觉的刺激强度增量,K为常数,不同感觉道的K值是不同的,请参见表3.2。表3.2感觉道一栏下面的数字代表测定时所用的标准强度。
表3.2 最优条件下各种感觉道的Weber比例
(一)测量感觉阈限的方法
测量感觉阈限的方法有3种,它们是最小变化法、恒定刺激法和平均差误法。学习者应特别注意这3种方法的实验程序和实验结果的统计处理。
1.最小变化法
表3.3的记录表格说明了最小变化法的实验程序和实验结果的计算方法。
表3.3 用最小变化法测音高的感觉阈限
总平均数=14.5;总平均数的标准差=0.45。
最小变化法的刺激由递减和递增两个系列组成,每次刺激后让被试报告他是否有感觉。刺激的增减应尽可能地小,目的是系统地探求被试由一类反应到另一类反应的转折点,即在多强刺激时,由有感觉变为无感觉,或由无感觉变为有感觉。例如,在第(一)个递减系列中,被试对24Hz的声音到15Hz的声音都报告有感觉,但是当刺激变为14Hz时,被试报告无感觉。因此,在这个系列中被试有感觉和无感觉的转折点就是在15Hz与14Hz之间,即14.5Hz,这也就是第一个系列所求得的这个被试的绝对听觉阈限。表3.3实验由第(一)个递减系列开始,按顺序做完10个系列。注意,递减、递增系列是交替进行的;每个系列的起始点也不一样,以免被试形成定势;当被试报告有感觉,用“+”表示;报告无感觉用“-”表示;被试不能肯定有无感觉时用“?”表示,“?”的意义与其前一个反应相反,如在第(二)系列中,“?”表示有感觉。在第(五)与第(九)系列中,“?”表示无感觉(武德沃斯等,1965)。
如前所述,每个系列的转折点就是该系列的绝对阈限,最后求得的绝对阈限14.5Hz是10个系列绝对阈限的算数平均值。初学者也许会感到奇怪,世界上没有14.5Hz这样一个声音刺激呀。对此我们应该记住,阈限值是多次试验后的统计值。下面我们根据结果再来谈一下阈限的定义:在50%的试验中引起感觉的刺激。如果我们把10个系列的转折点连成一条线,我们就会看到,连线以上的15Hz有8次报告有感觉,显然15Hz不是绝对阈限,因为它引起感觉的次数超过50%;连线以下的14Hz有8次报告无感觉,显然14Hz也不是绝对阈限,因为它引起感觉的次数达不到50%。根据计算,我们推测14.5Hz是50%的试验中引起感觉的刺激。
用最小变化法来测量差别阈限的方法如下。每一次试验中比较两个刺激:一个是标准刺激:一个是比较刺激。被试可以有3类反应,表示为“+”“=”“-”。表3.4是用最小变化法测量视觉的长度差别阈限的结果。第(一)个递增系列我们从57in4开始,让被试比较57in与64in(标准刺激),被试判断57in短,于是记为“-”,逐个比较到60in。当61in与64in比较时,被试判断两者相等即无法区分哪一个更长些,于是记为“=”。这时我们就有了一个从“-”到“=”的转折点,这个转折点被称为下限,继续逐个比较到66in。当67in与64in比较时,被试报告67in长于64in,于是记为“+”。这时我们就又有了一个从“=”到“+”的转折点,这个转折点被称为上限。上限与下限之间叫作不肯定间距(IU)或相等地带,因为被试不能判断哪一个更长。差别阈限(DL)等于1/2的不肯定间距。不肯定间距的中点被称为主观相等点(PSE),它的含义是,被试在做比较时,实际上是以62.75in为标准刺激,而不是以规定的64in为标准刺激,所以叫作主观相等点。主观相等点的例子在射击活动中更为具体形象。我们规定靶心是射击目标,靶心就相当于标准刺激,如果打了5枪,5枪都偏离靶心左边,那么我们可以说,对这个射手来说,标准刺激实际上不是靶心,而是离它左边某一点,这一点也就是这个射手的主观相等点,这个射手认为左边某一点就是实际的靶心。
差别阈限也是多次试验后的统计值。把6个系列的上限平均,下限平均,就可以求得差别阈限(见表3.4)。
这样求得的差别阈限(2.25in)叫绝对差别阈限,它是以64in为标准刺激时测得的,如果标准刺激变了,那么相对应的绝对差别阈限也会改变。绝对差别阈限和标准刺激的比例叫作相对差别阈限,在表3.4的例子中,它等于0.035(2.25/64),这也就是视觉长度的Weber比例(见表3.4)。
表3.4 用最小变化法测定视觉长度的差别阈限
(1)平均上限=65.0(2)平均下限=60.5
(3)不肯定间距=平均上限-平均下限=65.0-60.5=4.5
(4)差别阈限=1/2不肯定间距=2.25
(5)主观相等点=1/2(平均上限+平均下限)=62.75
(6)64为标准刺激
当用最小变化法来进行实验时,被试会产生习惯误差或期望误差。所谓习惯误差就是指被试因习惯于由原先的刺激所引起的感觉或感觉状态,而对新的刺激做了错误的判断。让我们结合图3-3来对此做一说明。在递增系列中,刺激由小变大,如果被试有习惯误差,他就会习惯于无感觉状态,所以当刺激增至a点时,他虽然已有感觉但仍认为无感觉,直至刺激增大至b点才报告有感觉,这样,习惯误差就导致递增系列的阈限增大;在递减系列中,刺激由大变小,如果被试有习惯误差,他就会习惯于有感觉状态,所以当刺激减至a点时,他虽然已无感觉但却仍认为有感觉,直到刺激减小到b点才报告无感觉,这样,习惯误差就导致递减系列的阈限变小。因此,当递增系列的阈限大于递减系列的阈限且差异显著时,我们就可以断定被试存在习惯误差。期望误差是指被试因过早期望将要来临的刺激而导致错误的判断。当递减系列的阈限大于递增系列的阈限且差异显著时,被试就有期望误差。为了消除习惯和期望误差,我们在用最小变化法来测阈限时,就不能只用一种系列的刺激,而必须同时应用递增和递减系列的刺激,而且二者的次数还应相等。
图3-3 递增、递减系列中的习惯误差
最小变化法是把有感觉与无感觉的转折点作为阈限,因此,它曾被认为很好地表达了感觉阈限的概念:在阈限以下人们一无所知。但是,阈下知觉(subliminal perception)的存在表明这种看法是不正确的,因而,最小变化法已被淘汰,现在人们使用QUEST法来进行感觉测量。
QUEST法是一种基于贝叶斯原理的阈限测量程序,由Watson和Pelli在1983年首次提出。与传统的阈限测量方式不同,QUEST法是一种“自适应”(adaptive)的阈限测量程序,它根据先前试验(trial)的刺激强度和被试判断的正确/错误情况来确定当前试验的刺激强度,因此具有较高的效率。
QUEST法的原理是基于这样的发现,即在对数坐标下,心理测量函数在所有条件下都具有相同的形状,这使得我们将每一次试验的刺激量(基于贝叶斯原理)放在当前最可能的阈限估计值上成为可能。此外,QUEST还假设:条件的变化只影响曲线在坐标轴上的位置,这个位置即为阈限(T,也用对数坐标表示),这个T作为心理测量函数的参数在整个试验过程中保持不变,每一次试验在统计上是独立的。QUEST法的核心是确立及不断调整阈限的概率密度函数(probability density function,简称p.d.f.),即总体分布中不同阈限的相对概率。
首先,我们需要依据先前的知识经验和研究假设确定一个初始的p.d.f.,我们称其为先验p.d.f.,一般来讲,这个函数应该符合Weibull函数分布5,其参数包括形状、尺度、位置等,它既包括分布形态的信息,也包括特定条件下阈限的信息,如函数分布的平均数,这个平均数可以理解为一个我们假想的阈限。然后,我们需要设置一系列试验的刺激强度,这一系列刺激强度是通过贝叶斯原理和先验p.d.f.信息的整合来确定的,确定后的新函数我们称为后验p.d.f.。后验p.d.f.中包括关于阈限的全部信息:研究假设、先验估计值和数据(刺激强度和与其相对应的被试的反应),它既是估计阈限的基础,也是设置下一次试验刺激的基础。在此,QUEST通常的做法是将下一次推荐刺激强度放在上一次p.d.f.峰值(即众数)的位置上,换句话说,当前的刺激强度,总是截止到目前阈限的估计值。实验按这样的顺序继续下去,直至达到一个先定的标准或先定的试验次数为止。当这个实验达到先定的标准或试验次数时,p.d.f.的峰值所对应的测量值(众数,一说平均数)就是所求的阈限。
图3-4(1)描述了用QUEST法求得阈限的过程。我们截取了第5次、第15次、第25次和第32次(最后一次)试验后的图示进行说明:
第5次试验之后,Weibull函数(即后验p.d.f.)形成完整的形态,此时,我们可以从中读到当前的阈限值、偏斜度、误差项等信息。此时的阈限值为0.41,这将是下一次试验的推荐刺激强度。15次试验之后,Weibull函数的分布有了很大的变化,阈限值也调整为-1.98,同时形成基于被试正确反应的次数分布。25次试验之后,Weibull函数又有变化,阈值调整为-0.23,基于被试正确反应的次数分布接近正态。32次试验之后,实验完成,此时确立的最终阈限为0.18。我们注意到,从第25次到第32次试验,QUEST给出的刺激强度变化已经很小了,局限在图中两个灰色竖条之间的范围内(95%置信限度),按照标准终止的规则,这应该是实验完成的标准。不过当前惯常采用的方法只是达到规定的次数,实验即可结束,这样做虽然牺牲了一定的精确性,但相对简便。我们还注意到,在整个实验过程中,Weibull分布的偏斜度值是固定的,都是3.5,这是我们在界定Weibull分布时规定的参数。
目前已有专门用于QUEST计算的工具包6,它可以根据反馈帮助我们确定每一次试验的刺激量并最终求得阈限。
让我们再来看一个实例:
图3-4(2)是用QUEST法测定听觉阈限所得的结果。图中纵坐标代表刺激的强度,以dB(分贝)为单位,横坐标表示试验的次数,在这个例子中,我们做了40次试验。
实验者首先假想一个关于阈限的先验p.d.f.,这个函数应该符合Weibull函数分布,包括平均数、标准差等信息。在图3-4(2)中,我们首先假想的阈限为-3dB, QUEST程序首先给出一个-2.6dB的推荐强度,我们向被试呈现这个刺激,被试报告感觉不到,我们将这一结果反馈给QUEST程序,程序将“记住”这一反馈,并经过计算,调整了概率密度函数分布的位置,形成后验p.d.f.,并给出下一个刺激强度的推荐值,即-1.4dB,此时,被试报告感觉到了,我们再一次将被试的反应反馈给QUEST程序,程序再次结合刺激量和被试的反应计算出下一次试验的推荐刺激值,即-1.7dB。按照这个程序进行下去,每一次程序都将根据新的反馈给出下一次试验的推荐刺激量,直到完成40次试验,此时,程序会告诉你最终的阈限结果,约为-1.1dB。有时候你会发现程序推荐的强度你已经向被试呈现过了,此时,你应该报告新的数据,以便程序将其加入到数据库中。
图3-4(1)QUEST的实验程序
图3-4(2)用QUEST法测定听觉阈限的结果
从图3-4(2)我们可以看出,开始几次试验的刺激强度波动很大,大约10次试验后,刺激的波动开始变小,20次试验之后,刺激的强度基本达到平台,这个平台的值就是该条件下的阈限(参见表3.5)。这种由大到小的波动形态是QUEST法的典型特征。
表3.5 40次试验中刺激强度的变化规律
目前,QUEST法可广泛用于有无法(yes/no method)、迫选法(force-choice method)的心理物理学实验中(Watson&Pelli,1983;蔡永春,2008)。
在对阈下知觉的研究中存在着许多争论,但有不少实验都已表明,在被试意识不到的情况下,阈下刺激(subliminal stimuli)的意思(meaning)还是为被试“得到”了。实验中单词(如cook,烹调)飞快地闪现,以致被试不知道呈现了什么。接下来以正常速度呈现两个单词(bake,烤;view,观察),要求被试必须在这两个单词中,挑一个他认为最可能是刚才飞快闪现的词。结果表明,被试多半挑选bake。这说明被试虽然不能觉察出cook,但其意义还是得到了某种加工(Schiffman,1996)。在“意识”一章中,我们将对无意识知觉做详细的讨论。
2.恒定刺激法
刺激通常都由5~7个组成,在实验过程中维持不变,因而这种方法叫作恒定刺激法。刺激的最大强度要大到它被感觉的概率达到95%左右,刺激的最小强度要小到它被感觉的概率只在5%左右。各个刺激之间的距离相等,与最小变化法不同的是,恒定刺激法的刺激是随机呈现的,每个刺激呈现的次数应相等。
下面以测定手掌的两点阈的例子来说明用恒定刺激法怎样测量绝对阈限。先选定最大和最小的刺激12mm和8mm,然后按照距离1mm的大小确定其余的刺激为9mm、10mm和11mm。每个刺激随机呈现200次。在每一刺激呈现后,要求被试回答是“两点”还是“一点”。实验结果见表3.6。从表中可以看到,相距10mm的两点有29%的次数被判断为两点,相距11mm的两点有66%的次数被判断为两点,可以设想,50%次判断为两点的刺激必在10mm与11mm之间。
表3.6 用恒定刺激法测两点阈的结果
下面我们介绍几种计算恒定刺激法实验结果的方法。
直线内插法应用比例算式求绝对阈限。由于所求绝对阈限是得到0.50比例数的刺激值,设它为X,则
如果把实验结果准确地画出来,也可以直接从图上读出两点阈的数值。以刺激大小为横坐标,以回答“两点”的比例为纵坐标,按表3.6数值作图3-5。从纵坐标上的0.50处引与横轴的平行线,它与曲线相交于a点,再从a点作垂线相交于横轴10.6mm处,这个数值就是所求两点阈。直线内插法的优点是简单易算,但它不够精确,因为参与计算绝对阈限的只是邻近0.50比例的两个比例(在我们的例子中只是0.29与0.66),其余比例虽然也是实验结果但都被废弃不用。另外,直线内插法的图示也不够精确,因为曲线是用眼睛配合手画出来的,会因人而异。
图3-5 用作图法求两点阈
表3.7 P-Z转换表
平均Z分数法可以避免直线内插法的缺点,因而提高了结果的精确度。这种方法首先要求把实验结果的P值比例转换为标准分数即Z分数,这可以通过查P-Z转换表来获得。
Z分数是以标准差为单位所表示的原始分数与平均数的偏离,所以,9对应Z分数-1.51,意思就是9在平均数以下1.51个标准差(SD)处,而11对应Z分数+0.45,就是11在平均数以上0.45标准差处。因此,从9到11的距离相应于(1.51+0.45)个标准差,即1.96SD,所以,2=1.51SD+0.45SD。SD=1.02。
下面是表3.6结果的平均Z分数法的计算。
又因为平均数位于9以上1.51SD处,所以平均数M=9+1.51×1.02=10.54,这就是所求的绝对阈限。
如果将上述数据作图,则也可以求得绝对阈限,见图3-6。横坐标上的9mm对应于纵坐标上的-1.51SD,得a点,横坐标上的11mm对应于纵坐标上的+0.45,得b点,将a与b连成直线,再从纵坐标0处引与横坐标的平行线交a b线于c点,从c点引横坐标的垂线,交于10.54处,10.54mm就是所求得的绝对阈限。
图3-6 用Z分数求两点阈
直线内插法的图示图3-5被称为S-P作图,平均Z分数的图示图3-6被称为S-Z作图,S-Z作图得到的是一条直线,由于它是根据实验数据确定的两点联结而成,所以它比S-P眼手配合作图所得到的曲线更能获得精确的结果;但是,最小二乘法是比平均Z分数法更为精确的方法。用最小二乘法作直线时,要先确定直线方程:Y=a+bX中的a和b,有关的公式如下:
在(3.1)和(3.2)两式中,X和Y代表自变量和因变量的原始分数,N代表X或Y的个数。公式中的a是直线的截距,b是直线的斜率。在心理学中应用这两个公式时要作一点变化,即需将纵轴的Y值(即恒定刺激求得的P值)转化成对应的Z分数,使X(恒定刺激法中的刺激即S)与Y的关系转化为直线关系,因为最小二乘法只适于两个变量有线性关系的情况。这样,如果把直线方程中的X和Y代以S和Z,则
因为在常态曲线上,Z=0时,P=0.50,所以(3.4)式中的S就是所求的两点阈。
如果用最小二乘法来处理表3.6的实验数据,则我们可得表3.8。其中,X代表刺激,Y代表与回答“两点”的比例(P值)相应的Z分数,N=5。
表3.8 直线方程中a和b的计算
把表3.8中的有关数据代入(3.1),(3.2)式,则
将a值与b值代入(3.4)式,则S=10.52mm。
如果将a值和b值代入(3.3)式,则
Z=-10.20+0.97S(3.5)
再把8、9、10、11、12五个刺激代入(3.5)式求出相应的Z分数,以刺激为横坐标,以Z分数为纵坐标,画出的直线方程图类似图3-6。
由上面的叙述可以看到,同一实验结果因为处理方法不同而有差异,其中最小二乘法是最精确的。
下面以重量实验为例来说明怎样用恒定刺激法测量差别阈限。首先要确定标准刺激和比较刺激。我们选80g作为标准刺激,72、74、76、78、80、82、84、86、88g为比较刺激。标准刺激与每一个比较刺激组成一对刺激。每对刺激按随机方式呈现,要求被试将比较刺激和标准刺激进行比较,只允许做两类回答:“重”或“轻”。每个刺激都和标准刺激比较100次。标准和比较刺激相继呈现,其中50次标准刺激在前,50次标准刺激在后。实验结果见表3.9。
表3.9 用恒定刺激法测定重量差别阈限的结果
图3-7 两类回答的提重实验结果
用S-P作图法,我们得图3-7。
由表3.9或图3-7我们看到,88g有97%次被感觉重于80g,因而88g几乎是100%能与80g分辨的;72g有2%被感觉重于80g,就是说有98%次被感觉比80g轻,因而72g也几乎是100%能与80g分辨的。运用内插法,我们可以计算出80.3g有50%次被感觉重于80g,按照差别阈限的定义,有50%次引起感觉差别的刺激增量就是差别阈限,那么0.3g是不是80.3-80所求的差别阈限呢?我们说不是。原因在于,当要求被试只做“重”或“轻”两类回答时,有50%次感觉重于标准刺激(在我们的例子中是80g)的比较刺激(80.3g),实际上得到的是不能与标准刺激区分的比较刺激。打个比方说,要是我问你,明天下雨不下雨?如果你说,明天有50%的可能性下雨。那么我要说,你对于明天是否下雨是完全没有分辨能力的。所以,当要求被试只做两类回答时,只有50%次能与标准刺激区分的比较刺激,实际上是不能与标准刺激相区分的比较刺激。在这种情况下,我们就取75%次感觉重于标准刺激的比较刺激来作为相等地带的上限,因为它处在50%次与100%次感觉重于标准刺激的比较刺激之间的中点;同理,我们取25%次感觉重于标准刺激的比较刺激来作为相等地带的下限,因为它处在0次与50%次感觉重于标准刺激之间的中点。有了上限与下限我们就可以计算出差别阈限了。根据表3.9的数据,用直线内插法求得的相等地带的上限和下限分别为82.9g和78.4g。差别阈限为1/2(82.9-78.4)=2.25g。这样求得的差别阈限与前面规定的阈限的操作定义并不相符,所以称之为75%的差别阈限。因为25%次感觉重于标准刺激的比较刺激也就是75%次感觉轻于标准刺激,这样,上限和下限与标准刺激比较就都有75%的次数可以辨别。在这里2.25g为绝对差别阈限,其相对差别阈限为2.25/80=1/36。主观相等点等于50%次重于标准刺激的比较刺激,即等于80.3g。
下面我们举75%的差别阈限的另一个例子。
如图3-8所示,当标准刺激分别为50g、100g和150g时,重量增量为标准刺激的5%、10%和15%时,被试正确判断比较刺激更重的百分比(见纵坐标)。每一个数据点都表示某一比较刺激与标准刺激比较200次的结果。图形纵坐标是从0.5开始的。由这条平滑的曲线我们可以再次看到,随着比较刺激重量增加,正确判断比较刺激更重的百分比逐渐升高。这意味着并没有单一的、精确的增量就是最小可觉差。实际上,最小可觉差或差别阈限只能定义为一个统计值,在这里它是有75%次觉察出两个重量有差别的最小增量(Laming,1994)。
图3-8 恒定刺激法的结果
表3.9中的数据可以用平均Z分数方法和最小二乘法处理求差别阈限。其中,“重于标准刺激的反应比例”就是P值,将P值转换为Z分数后就可以按公式来进行各种计算。
如果用恒定刺激法测量差别阈限时,允许被试做三种回答,即比较刺激与标准刺激进行比较时,被试可以回答“重”“轻”和“相等”时,我们怎样求差别阈限呢?这时相等地带的上限定为50%次重于标准刺激的比较刺激,相等地带的下限定为50%次轻于标准刺激的比较刺激,有了上限、下限就可以求差别阈限。但是,在允许三类回答的实验中,被试的态度会大大地影响相等地带的大小。如果被试十分自信,说相等的次数就很少,结果相等地带也就很小,从而导致差别阈限(1/2的相等地带)也小;反之,如果被试十分谨慎,则说相等的次数就很多,结果则会导致差别阈限较大。这样看来,三类回答的实验易受被试个性的影响,因而人们一般更偏爱两类回答的实验方法。
在用恒定刺激法来测量差别阈限时,标准刺激和比较刺激是继时呈现的,这可能会产生时间误差。如主观相等点小于标准刺激,就产生负的时间误差。反之,就产生正的时间误差。时间误差最鲜明的例子莫过于先后比较相同的刺激(比如100g重量),但被试常常觉得后面的刺激引起的感觉强(即觉得后面的100g比前面的100g重)。客观上两次提的重量都是100g,但由于时间先后造成了误差,而觉得后一个100g比前一个100g重。
3.平均误差法
这个方法的典型实验程序是,实验者规定以某一刺激为标准刺激,然后要求被试调节另一比较刺激,使后者在感觉上与标准刺激相等。客观上一般不可能使比较刺激与标准刺激完全一样,于是每一次比较就都会得到一个误差,把多次比较的误差平均起来就可得到平均误差。因为平均误差与差别阈限成正比,所以可以用平均误差来表示差别感受性。求平均误差的方法有两种:
(1)把每次调节的结果(或每次的判断)与标准刺激之差的绝对值平均起来作为差别阈限。
(2)把每次调节的结果与主观相等点之差的绝对值平均起来作为差别阈限。在这里,主观相等点是相等地带的中点,它等于各比较刺激的平均数。
下面我们以视觉的长度辨别为例来说明如何以平均差误法测量差别阈限。在表3.10中,X代表被调节为与标准刺激相等的长度,ST代表标准刺激,M代表各次调节的平均数,AE代表平均误差,PSE代表主观相等点,CE代表常误,n代表调节的次数。
表3.10 用平均差误法测量长度差别阈限的结果
在上述实验中,为了消除空间误差,标准刺激在左边和右边的次数应各占一半。为了消除动作误差,被试从长于和短于标准刺激处开始调节的次数也各占一半。
图3-9 用标准差表示差别阈限图示
在平均差误法中除了平均误差外,标准差、四分位差也可以表示差别阈限。下面我们说明怎样用标准差来表示差别阈限。
在平均差误法的实验中,被试调节的比较刺激特别大于标准刺激的不多,特别小于标准刺激的也不多。多数的调节结果都是围绕着标准刺激的,如果实验次数很多,实验结果的次数分配就会接近于一个常态分配。分配的中点即调节的刺激本身的平均数为主观相等点。图3-9中的两条分配曲线代表两名被试的结果。
虚线的分配较实线的分配更集中,其实验结果也更加密集于标准刺激。显而易见,分配集中的被试的辨别力好,而分配分散的被试的辨别力差。因此,测量分配的离散程度的标准差就可以作为对差别阈限的估计。标准差大(见实线),说明被试对相距甚远的两个刺激(标准刺激与比较刺激)感觉是相等的,因而表示他的辨别能力差;反之,如果被试辨别力强,那么相距很近的两种刺激他感觉是相等的,结果标准差就小。直接从实验结果计算标准差的公式是:
其中,X是实验得数据,n是实验次数。
平均差误法的优点是可以让被试自己动手调整刺激,因此,被试在整个实验中可以保持高水平的积极性,不觉厌烦。当然这优点同时也带来了一个缺点,因为比较刺激是由被试调节的,所以严格说来实验条件就不那么恒定了。另外,如果刺激不能连续地变化,而有些间隔的话,用这种方法测得的差别阈限就不精确了。
用平均差误法求绝对阈限时,只要设想标准刺激的强度为零来调节比较刺激,使比较刺激的大小变化到刚刚觉察不到或刚刚觉察到,然后平均比较刺激(即每次调节的强度)就是绝对阈限。
以上三种古典心理物理学方法各有自己的特点。最小变化法的实验程序和计算过程都具体地说明了感觉阈限的含义,但它会因其渐增和渐减的刺激系列而产生习惯误差与期望误差。恒定刺激法的实验结果可以应用各种数学方法加以处理,因而便于与其他测定感受性的方法进行比较。在应用三类反应的实验程序时,被试的态度会对差别阈限值有较大影响。平均差误法的特点是求等值,它的实验程序容易引起被试的兴趣,但对不能连续变化的刺激则不能用平均差误法来测其差别阈限。
二、信号检测论
信号检测论是信息论的一个重要分支,1954年,美国心理学家W.P.Tanner和J.A.Swets把它应用于人的知觉过程,使心理物理学方法发展到一个新的阶段。知觉过程中的信号检测论是怎么一回事呢?
假设甲、乙正在家里看电视,外面有人敲门。甲说:“有人敲门。”乙说:“我没听见。”我们能不能说甲的听觉更敏锐些呢?从古典心理物理学方法的角度来看,我们是可以这么说的。但是,从信号检测论的角度来看,我们不能这样说。可能甲、乙有着同等的听觉感受性,但他们判断是否听到声音的标准不一样。甲也许较冒进,他心里想只要听到似乎有声音我就说“有人敲门”,这样,每次有人敲门我都能正确报告,不会漏报;乙也许较保守,他心里想除非有百分之百把握我不说“听见了”,这样,没有敲门时我绝不会虚报有人敲门。这是生活中的实际情形,人的感觉知觉过程不仅涉及感受性,同时又涉及判断标准。古典心理物理学方法把感受性与判断标准混在一起而不能区分它们,例如,用恒定刺激法测差别阈限时,允许三类反应,就会使差别阈限受到自信或谨慎态度的很大影响。信号检测论的优点就是能够把人的感受性与他的判断标准区分开,并以独立的数据来分别表达它们。它之所以能够做到这一点,就在于它不仅考察人对信号刺激的反应(上例中敲门声就是信号刺激),还同时考察人对噪声刺激的反应(上例中电视的声音就是噪声刺激)。下面我们以色子游戏为例来说明人们对信号与噪声这两类刺激做反应的一般规则是怎样的(林赛和诺曼,1987)。
(一)色子游戏
你的伙伴一次掷三颗色子,两颗是正常的,即每个面有一个数字,依次是1到6。第三颗是特殊的,三面写0,另三面写3。你的任务是猜测,特殊色子的哪一面朝天?是写有0的一面,还是写有3的一面?在猜以前,伙伴告诉你三颗色子朝天的数目的总和。很明显,当数目总和是2、3、4的时候,特殊色子一定是0。当数目总和是13、14、15时,特殊色子一定是3。当数目总和为5~12时,特殊色子是0还是3的可能性都有,你不能保证猜得绝对正确。那么,你怎样猜,对的把握才更大些呢?让我们把三颗色子的数目总和为8的各种可能性排列如下来做说明。
由排列可知,8由3+5构成的可能性为4种,也就是说,当总和为8时,3出现的可能性为4次;8由0+8构成的可能性为5种,也就是说,0出现的可能性为5次。所以,平均而言,扔9次色子,而色子数目总和都是8时,有4次特殊色子可能是3(44%),有5次特殊色子可能是0(56%)。根据这种测算,每当色子总数为8时,你猜0,对的机会就会多些。
根据三颗色子数目构成8的各种可能性排列的道理,我们可以把2~15的色子数目由3或由0构成的可能性列成表3.11。
表3.11 色子数目总数与特殊色子出现概率的关系
从表3.11中可以看出,当色子数目变大时,特殊色子朝天的一面为3的概率逐渐上升。例如,当总数为9时,你猜3对的概率会超过50%。
玩色子游戏时,猜对猜错一共有4种情况,下面我们结合表3.12来做一说明。
表3.12 色子游戏的4种情形
当色子总数是由3构成(即特殊色子是3时),而你事先也是猜特殊色子是3,那么你就猜对了,这叫击中;如果你猜特殊色子是0,那么你把3漏掉了,这叫漏报。当色子总数是由0构成(即特殊色子是0时),而你事先猜特殊色子是3,那么你是把0当作3,这叫虚报;如果你事先猜特殊色子是0,那么你就猜对了,这叫正确否定。
1.击中与漏报
玩色子游戏时,如果你心目中定下一个标准:凡色子数目总数等于9或大于9时,我就说特殊色子是3;凡色子数目总数小于9时,就说特殊色子是0。那么,你的击中概率为26/36=72%。这个概率可以从表3.11中看出来。当特殊色子是3时,2~15之间各个总点数出现的可能次数的总和为36(见3出现次数一栏),总数等于9或大于9时,特殊色子是3的可能次数为26,所以按照刚才的标准,你的击中概率就为26/36=72%。但是,有10次特殊色子为3时,你漏掉了,所以你漏报的概率就为10/36=28%。因为按照刚才的标准,小于9的总数你都猜0,但小于9的总数一共有10次可能是3,所以你漏掉了。击中率我们用符号P(Y/3)表示,即P(Y/3)=72%。漏报率我们用符号P(N/3)表示,即P(N/3)=28%。
2.虚报与正确否定
当色子数目总数等于9或大于9时,特殊色子是0的可能次数为10(见0出现次数一栏),按照刚才9的标准,你都说特殊色子是3,所以,你虚报了,虚报概率等于10/36=28%,虚报率我们用P(Y/0)来表示,即P(Y/0)=28%。当总数小于9时,特殊色子是0的可能次数为26(见0出现次数一栏),按照9的标准,你都说特殊色子是0,你说对了。正确否定概率用P(n/0)表示,即P(n/0)=72%。为了使大家对击中、漏报、虚报、正确否定等几个概念更加清楚,我们把以9为标准的各种概率按表3.11来加以说明,见表3.13。
我们以9为标准时,当色子总数等于9或大于9,我们都说特殊色子是3,结果我们击中26/36(见3出现次数一栏),虚报10/36(见0出现次数一栏);当色子总数小于9时,我们都说特殊色子是0,结果我们漏报10/36(见3出现次数一栏),正确否定26/36(见0出现次数一栏)。
表3.13 以9为标准时的各种概率
3.标准的移动
当我们判断特殊色子是3或0的标准发生变化时,击中率、虚报率等就会发生相应的变化。例如,我们以10为标准时(请读者用铅笔在表3.13中色子数目总数一栏的10上面轻轻画一条线),相应的击中率就是21/36=58%,虚报率就是6/36=17%,漏报率等于15/36=42%,正确否定率等于30/36=83%。尝试一下,当标准是8时,各种概率是多少。由于击中率+漏报率=100%,虚报率+正确否定率=100%,今后我们只要用击中率与虚报率来说明问题就够了。因标准的变化而导致击中率、虚报率的相应变化,可参看表3.14。
表3.14 各标准下的击中率与虚报率
只是请注意,表中标准一栏实际上是色子数目总数,如果标准定为5,它的确切含义是:当三颗色子朝天的数目加起来等于5或大于5时,我猜第三颗特殊色子朝天的一面必定是3;总数小于5时,我猜特殊色子是0。从表中可以看出,随着标准愈来愈高(数目变大)击中率愈来愈小,但虚报率也愈来愈小。另外,同一标准下的击中率与虚报率之和也不等于100%。
4.操作特征曲线
当我们把表3.14的虚报率作为横坐标,击中率作为纵坐标作图时,我们就可以形象地看到随着标准的变化,击中率与虚报率也相应地发生变化的情形(见图3-10)。我们称这个图为操作者特征曲线。
另一种表示标准的变化怎样引起击中率与虚报率变化的直观方法,是根据表3.11画曲线(见图3-11)。为了理解图3-11的含义,让我们重新看一看表3.11。从表中可以看到,当色子数目总和为2、3、4时,特殊色子为3的次数为0(见3出现次数一栏)。
3-10 标准变化引起的击中率、虚报率的变化
对此,我们可以理解为:当特殊色子出现3时,三个色子数目总和为2、3、4是不可能的,也就是说,它们出现的概率为0。那么当特殊色子是3时,色子数目总和为9出现的概率是多大呢?因为在2~15之间各个色子数出现的可能次数的总和为36,而色子数目总和为9时,特殊色子3出现的次数为5次,所以,当特殊色子是3时,色子数目总和为9出现的概率为5/36=14%。当特殊色子出现3时,其余色子数目总和出现的概率也照此计算;当色子数目总和为13、14、15时,特殊色子为0的次数为0(见0出现次数一栏)。对此,我们同样可以理解为:当特殊色子出现0时,三个色子数目总和为13、14、15是不可能的,也就是说它们出现的概率为0。当特殊色子为0时,色子数目总和为9出现的概率是多大呢?按照上面的计算方法,其概率等于4/36=11%。表3.15是特殊色子为3或0时,各色子数目总和出现的概率。
表3.15 特殊色子为3或0的条件下各色子数目总和出现的概率
根据表3.15所列数据,以色子数目总和为横坐标,以它们出现的概率为纵坐标画出的曲线如图3-11。
图3-11 色子游戏的概率分配
两条曲线有重合之处,它表明这些色子数目总和既可能由特殊色子的3构成,也可能由特殊色子的0构成。横坐标的11处是标准线,即当色子数目总和等于11或大于11时,我们说特殊色子是3。当我们使用11来做标准时,击中率就可由11的标准线右边的灰区(包括黑区)的面积来代表,这部分面积属于特殊色子3的分布曲线;虚报率则可用11的标准线右边的黑区的面积来代表,这部分面积属于特殊色子0的分布曲线。当标准线移动时,灰区面积和黑区面积的相应变化就代表击中率与虚报率的相应变化。这些情形与图3-10表示的意思是完全一致的。
(二)人对信号刺激的觉察
玩色子游戏的过程就是根据某些信息做判断的过程,人对信号刺激的觉察也是如此,下面是它们的类比:
玩色子游戏时,已知色子数目总和,要求判断这一总和是由3或0构成;人对信号的觉察与此类似,当人获得某种感觉(比如听到某种声音),要求判断这种声音是由信号刺激(敲门)引起,或是由噪声刺激(电视节目)引起。
与色子游戏一样,人们对信号的觉察也在内心设有标准,当感觉到达某种程度或超过那种程度就说感觉是信号引起的,否则,就说是由噪声引起的。
因此,上面对色子游戏的分析也就完全适用于人对信号的觉察过程。即人对信号的觉察也有击中、虚报等4种情形;随着标准的变化,其击中率与虚报率也在变化;也同样可以绘制其操作者特征曲线和分布曲线(图3-12)。
图3-12 SN分配和N分配以及判断标准Xc
图3-12与图3-11是类似的。只是后者作为判断根据的信息是间断的,前者的信息假设为连续的而已。图3-12代表感觉的正态分布。左边的曲线是由噪声(相当于0)引起的感觉分布,右边的曲线是由信号(相当于3)引起的感觉分布。横坐标是感觉的连续体(相当于色子数目的总和),纵坐标是信号引起的感觉出现的概率(右边曲线)以及噪声引起的感觉出现的概率(左边曲线)。标准线右边的横线部分代表击中率的大小,它属于由信号引起的感觉分布,标准线右边的竖线部分代表虚报率的大小,它属于由噪声引起的感觉分布。在信号检测论的实验中,击中率用P(y/SN)表示,SN代表信号,类似于色子游戏中的3;虚报率用P(y/N)表示,N代表噪声,类似于色子游戏中的0。
信号检测论到底是怎样把人的感受性与其判断标准区分开,并分别用独立的数据来表示它们的呢?下面我们就通过介绍信号检测实验的两种方法——有无法和评价法来回答这些问题。
(三)信号检测论的实验方法
1.有无法
这个方法要求事先选定SN刺激和N刺激,并规定SN和N出现的概率,然后以随机方式呈现SN或N,要求被试回答,刚才的刺激是SN还是N。根据被试对呈现刺激的判断的结果来估计P(y/SN)和P(y/N),如表3.16所示。
表3.16 根据判断结果对P(y/SN)和P(y/N)的估计
假设我们的实验是在白噪声的背景上检测一个纯音信号。以随机方式呈现给一个
被试100次信号和100次噪声,呈现200次后,我们发现:呈现100次信号被试回答说是信号的有16次,呈现100次噪声被试回答说是信号的有2次。因此这些结果可以用图3-13来说明。
图3-13 有无法实验图解
首先我们来谈一下该怎样计算判断标准的大小。图中横坐标上的ZA点就是判断标准。当获得的听感觉等于ZA感觉或大于ZA感觉时,被试就说获得的感觉是由信号引起的。在色子游戏中,我们说过,当标准变化时就会引起击中率和虚报率相应的变化,它们之间有固定的关系。因此,反过来我们已知击中率和虚报率也就可以推知标准的大小。在信号检测论中,判断标准β是由下面的公式来计算的:
在信号检测论中击中率的纵坐标就是指与击中率相应的Z分数上正态曲线的高度,从正态曲线表上可以查到,P=0.16相应的纵坐标为0.242;类似地,虚报率的纵坐标也就是指与虚报率相应的Z分数上正态曲线的高度,从正态曲线上可以查到,P=0.02相应的纵坐标为0.048。因此,这轮实验中的β=0.242/0.048=5.042。
信号检测论中感受性的高低又是怎样表示的呢?由于信号检测论实验不仅测被试对信号刺激的反应,而且也测被试对噪声刺激的反应,因此,由信号引起的感觉就形成了一个正态分布曲线;由噪声引起的感觉也形成了一个正态分布曲线,如果被试A感受性高即分辨能力强,那么他对信号与噪声就会区分得很清楚,实验结果也就会得到两个相距较远的正态曲线;当信号与噪声的强度不变,如果被试B感受性低,那么他对信号与噪声的区分就不如A清楚,实验结果就会得到两个距离较近的正态曲线,即两个正态曲线重合部分较大。如果被试C对同样的信号与噪声根本分辨不出来,那么,实验结果就是两个正态曲线完全重合,即两个正态曲线的距离为0。因此,我们就可以用两个正态曲线的距离即两个正态分配的平均数之间的距离来作为感受性的指标。为了便于在不同条件下进行比较,这个距离是以标准差为单位来表示的,常称d′,实际上它也就是击中率P对应的Z分数与虚报率P对应的Z分数之差,用公式表示如下:
关于d′的概念及其计算可参看图3-13。图中有一点要引起注意,即当P>50%时,查出的Z分数值为负;当P<50%时,查出的Z分数值为正。
通过查正态曲线表,可以得到击中率P=0.16的Z分数为1,而虚报率P=0.02的Z分数为2。将之代入d′的公式,则在这轮实验中d′=2-1=1。
一般来说,人的分辨能力在短时间内不会变化,是恒定的;但人的判断标准却可以时刻变化。影响判断标准变化的原因主要有:信号出现的概率P(SN)和对被试回答的奖惩办法。
当奖惩办法固定时,信号出现的概率将会怎样影响判断标准的变化呢?让我们结合表3.17的假设的实验结果来对其做一说明。
表3.17 P(SN)与β的关系
图3-14 根据表3.17的数据画的ROC曲线
当信号出现概率低时,被试不轻易回答说有信号,表明被试的判断标准高,见A轮实验结果。当信号出现概率高时,被试只有倾向于多说有信号,表明被试的判断标准低,见C轮实验结果。换句话说,即当信号不经常出现时,被试获得很强的感觉才说有信号;而当信号频频发生时,被试获得轻微的感觉就说有信号了。但是在几轮实验中分辨能力d′都保持恒定,这说明判断标准的变化是由于被试不同的预期产生的,与信号本身无关。根据表3.17的数据可以作图3-14。
图3-14与色子游戏中的图3-10是类似的。当判断标准变化时,击中率与虚报率都相应地发生变化,但分辨能力d′保持不变,因此,图3-14中的操作者特征曲线(ROC曲线)又叫作等感受性曲线。
在信号出现的概率保持恒定的情形下,奖惩办法导致被试不同的动机水平,最后影响β。让我们结合表3.18的假想的实验结果来对比做一说明。
表3.18 奖惩办法与β的关系
当奖惩办法是鼓励多说信号时(如F轮实验中,平均而言,不管对错只要说有信号就会获+2的奖励,而说无信号却导致-2的惩罚,因此被试倾向于多说有信号),β偏低;当奖惩办法是鼓励少说信号时(如D轮实验中,平均而言,不管对错只要说无信号就会得+1的奖励,而说有信号却导致-1的惩罚,因此被试倾向于少说有信号),β偏高。上述情况可参看图3-14。
将具有不同分辨能力的被试的实验结果画在一起,便可得到一组d′不同的操作者特征曲线,见图3-15。图中连接(0,0)和(1.0,1.0)的45°对角线是代表被试的辨别力等于0的一条线,也可以说是击中率等于虚报率的一条线。ROC曲线离这条线愈远,表明被试的辨别力愈强。
ROC曲线的基本特征还可以用图3-16来表示。
图3-16说明,ROC曲线的曲率怎样代表着被试对信号的感受性以及他(她)的反应标准。当信号本身的强度很大时,它容易被觉察,因此ROC曲线向左边弯得更高;当信号变弱,ROC曲线就向45°对角线靠拢。换句话说,即ROC曲线的曲率是由信号强度来决定的,而与被试的判断标准无关。当然,信号强度增强也就保证了信号能更多地被觉察,因此,ROC曲线的曲率是由被试的感受性和信号强度所共同决定的。当被试的判断标准高时,他倾向于少说信号,这就是图3-14中A点的情形。当被试的判断标准低时,他倾向于多说信号,这就是C点的情形,45°对角线上的描述就是指的这些情形。我们知道,d′=2.0和d′=1.0的ROC曲线都有少说信号和多说信号的情形,即都有高判断标准和低判断标准的情形,也就是说,感受性d′与判断标准β是彼此分离的(Schiffman,1996)。
图3-15 一组d′不同的ROC曲线
图3-16 ROC曲线特征图
2.评价法
在有无法实验中,当定下判断标准以后,凡等于或大于标准的感觉都说是信号引起的。
图3-17 有无法反应图示
例如,在图3-17中当x1或x2感觉出现时,被试都说是信号引起的,但是x1和x2的感觉强度是不一样的这一点却被忽略了。也就是说,当x2出现时,被试反应是信号的把握大于当x1出现时反应的把握,但有无法只要求被试回答是信号就够了。类似地,当x3出现时,被试反应是噪声的把握大于当x4出现时反应的把握,但有无法只要求被试回答是噪声就够了。这样,由于有无法是把感觉连续体分为两部分,故它从被试的反应中所能知道的就只是某一感觉在标准以上或以下,至于这种感觉离开标准多远则不知道,即反应的把握程度反映不出来。从而也就丧失掉了许多信息。
那么,有没有办法把某一感觉离标准多远表达出来呢?办法是有的,让我们回到色子游戏上来。
当色子数目多的时候,如13、14、15,我们有百分之百的把握说,特殊色子是3;当色子数目少的时候,如2、3、4,我们也有百分之百的把握说,特殊色子是0。但是当色子数目不多不少,恰在5~12时,我们多半猜测,确信的程度将会小于百分之百。这样,模仿色子游戏的情形,在信号检测论的实验中我们可以首先回答有信号或无信号,然后说明我们对回答的确信程度(或用概率来表达确信程度),这就是评价法的实验。用这样的办法,我们就可以把信号或噪声引起的感觉离标准多远表达出来(参见图3-18)。
图3-18 评价法反应图示
图3-18中的C13、C2、C3、C4和C5是感觉连续体上从左到右的5个标准。1、2、3、4、5和6代表确信程度,即评价等级。在有无法中一种信号概率或一种奖励办法只允许被试使用一个判断标准,而在评价法中,同一轮实验被试实际上使用几个判断标准,如图3-18所示,允许使用6个等级的确信程度,被试就可以使用5个判断标准。这样,当x2感觉出现时,由于它在C5标准以上,被试用第6等级来反应,当x1感觉出现时,由于它在C4标准以上,被试用第5等级来反应,余类推(6个等级的含义如表3.19所示)。结果,强度不同的感觉就分属于不同的评价等级,反应的把握程度就可以表达出来,从而也就避免了有无法中感觉强度不同,只用有信号或无信号来反应的简单做法,进而保留了较多的信息。由于评价法在一轮实验中使用了多个标准,故它可以获得有无法多轮实验才能得到的结果。
表3.19 各个确信程度的含义
在一个信号检测实验中,SN和N各呈现600次,用评价法得到的实验结果如下:
表3.20 评价法的实验结果
表3.20中的第(2)、第(3)两行分别为SN和N与各确信程度结合的次数。例如,当SN呈现时被试评价为6等的有176次,当N呈现时评价为6等的有24次等。第(4)、第(5)两行分别为SN和N呈现时被试评价为各等级的概率。例如,SN共呈现600次,评价为6等的概率为0.29(=176/600);N也是共呈现600次,评价为6等的概率为0.04(24/600)。
如果要根据表3.20的数据来计算被试在各种标准下的d′与β,则需要将C5以下的各标准的击中率与虚报率进行累加,如表3.21所示。
表3.21 各标准下的击中率和虚报率
为什么对于C5以下的各标准来说,击中率都应该是累积概率呢?让我们结合图3-18来进行说明。当x2感觉出现时,由于它在C5标准以上,故被试以第6级作反应;当x1感觉出现时,由于它在C5标准以下,故不能以第6等级反应,但它在C4标准以上,所以以第5等级反应。现在我们要计算C4标准的击中率,那就不仅要包括第5等级的反应,还应当包括第6等级的反应,因为C5标准比C4标准高,在C5标准以上可以肯定x2感觉是由信号引起,那么在比C5低的任何标准下,当然也可以肯定x2感觉是由信号引起的。所以C4标准的击中率,就是信号呈现时第6等级和第5等级的反应之和。因此,对于C5以下的各标准来说,击中率都应该是累计概率。各标准下的虚报率也应以类似的方法来计算。
图3-19 双常态坐标上的ROC曲线
根据表3.21所列数据可以计算出各标准下相应的d′和β,见表3.22。如果以虚报率的Z分数为横坐标,以击中率的Z分数为纵坐标,则画出的ROC曲线就是一条直线,这条直线与机遇线的距离就是d′的值,见图3-19所示。
由图3-19确定的d′约为1.2,它与表3.22所计算出来的5个d′的平均值1.198十分接近(赫保源等,1983)。
表3.22 各种标准下的d′和β
三、心理量表
物理刺激可由物理量表来测量。例如,一个西瓜的重量,我们用千克来量,一张桌子的长度我们用米来量。但是,心理量的大小却不能用物理量表来测量。首先,这是因为刺激的物理值的变化不一定会引起心理上相应的一对一的变化。例如,实验证明声音的频率从1000Hz到3000Hz增加了两倍,但作为心理量的音高却只增加了一倍,因此,我们不能用频率的增加(这是物理量表测量的)来量心理量音高的增加。其次,有一些物理刺激本身就难以用物理量表来测量。因此,由这些物理刺激引起的心理量的变化当然也就不能用物理量表来测量。例如,一幅山水画、书法作品就不好用什么物理量表来度量,因而,由它们引起的我们心理上的美感、喜爱程度也就不是物理量表所能测量的。因此,心理量的大小只能用心理量表来度量。
心理量表与物理量表一样,也有顺序量表、等距量表和比例量表3类。下面我们先介绍这3类量表的一般特点,然后谈谈该怎样制作心理量表。
顺序量表是将对象的某一属性排出顺序。例如,1500m赛跑的第一名、第二名、第三名等。这种量表没有相等单位,也没有绝对零。例如,如果知道第一名比第二名快1min,但由于没有相等单位,所以我们不能推测第二名比第三名也快1min。由于没有绝对零,更不能说第一名速度是第三名的几倍。因此,顺序量表是一种比较粗糙的测量表。
等距量表有相等单位,可以测量对象之间的差别,但没有绝对零。例如,1500m赛跑第一名到达时间2:01;第二名2:02;第三2:04。我们可以知道前三名之间的差距是多少,但仍然不知道第一名比第三名快多少倍,例如,我们不能说2:01比2:04快多少倍。
比例量表与上述量表相比,既有绝对零又有相等单位,因此它除了可以测量对象之间的差别,还可以确定它们之间的比例。例如,1500m赛跑第一名跑了4min,第二名5min,第三名6min。这样我们既知道第三名比第一名慢了2min(两者差别等于6减4),又知道第三名跑的时间是第一名的1.5倍(6/4)。换句话说,即对比例量表的数据我们既可以用加减法来处理也可以用乘除法来处理。比例量表是一种较理想的量表。
(一)差别阈限法、等距量表与Fechner定律
在这个标题下我们想要说明的是,如果你运用差别阈限的方法来制作等距量表,那么实验结果是支持Fechner定律的。
Fechner提出,差别阈限(ΔI)造成了最小可觉差(JND),因而JND可以用作单位来测量感觉量的大小。Fechner试图制作一个心理量表,主观经验的感觉以JND为单位,客观的刺激强度以ΔI为单位,看看刺激强度的变化怎样引起相应的感觉的变化。他还假定强弱不同水平上的感觉单位JND都是相等的,即所有的JND都代表着主观上同样的感觉单位。这样的假定是必要的,因为物理量表中有着类似的要求。例如,当我们测量长度时,第一个1km的长度应当与1000km长度中最后1km的长度相等。如果假定所有的JND都相等,那就意味着,不管刺激的强度是高或是低,ΔI造成的感觉差别都是相同的。例如,手在0℃冰水中,然后把高于0℃的温水倒入冰水,手刚刚感觉到的差别与手在40℃温水中,把高于40℃的温水倒入后刚刚感觉到的差别是一样的。
图3-20 JND与ΔI关系图
根据Weber比例,当刺激强度I增大时,ΔI也必须相应地增大,才能使主观感觉的增量保持恒定,即仍然保持着最小可觉差,反过来说,即一个给定的JND总是对应于刺激强度恒定比例的变化。这样,当刺激强度低时,产生一个JND所必需的绝对变化增量就小;而当刺激强度高时,产生一个JND所必需的绝对变化增量就大。也就是说,在刺激强度表低的一头,两刺激强度差别很小(或十分接近时),就能为一个JND所分辨;而在刺激强度量表高的一头,两刺激强度差别很大(或相距甚远时),才能为一个JND所分辨。感觉与刺激之间的这种关系见图3-20。
假定所有的JND在心理上都是相等的话,那么,感觉量表(纵坐标)上等距的增长,就必然会要求刺激强度量表上愈来愈大的增加。也就是说,当感觉单位(JND)的数目以算术级数增长时,刺激强度则以几何级数增长。刺激强度量表上的几何增长与感觉量表上的算术增长表现为一种对数关系。
下面我们用具体的数据来说明这种对数关系并推导出Fechner定律的公式。
Fechner假定,高于绝对阈限的心理量的大小可以用绝对阈限以上的最小可觉差(JND)的数目来表示。例如,在绝对阈限和某刺激之间有3个最小可觉差,那么这个刺激强度所引起的感觉就是3。这样,Fechner就将差别阈限作为心理量表的单位,而将绝对阈限作为心理量表上的0点。因此,为了制作理论上的等距量表,我们只需要知道绝对阈限与Weber比例就够了。例如,设想某种感觉的绝对阈限为10个单位,Weber比例;每一个新的最小可觉差的刺激值为前一个刺激值。请参看表3.23中前两列数字。从表上看得很清楚,随着最小可觉差数目变大,所需要的物理刺激值也愈来愈大,因此,用对数形式来表示刺激值就方便多了。相应的对数值写在表的第(三)列。表的第(四)列是对数的增量,它是恒定的。表的第(五)列是对第(二)列数据稍作处理后的形式,目的是使读者便于理解第(六)列的数据。
表3.23 理论上的Fechner量表(等距量表)
从表3.23中的(一)(四)两列我们看到,心理量每增加一个JND,物理量即刺激值的对数增量是恒定的。让我们按照表3.23的说明,把心理量与物理量的对数成比例的关系用对数形式的公式表达出来。假设:
SK=任何刺激值;
S0=绝对阈限或假定为零的特殊刺激值;
W=Weber比例;
K=从S0到SK之间的JND数目;
RK=SK引起的心理量。
仿照第(六)列的数据,我们得:
并且
由于Fechner假定心理量是与辨别成比例的,即一个刺激引起的心理量的大小是与绝对阈限以上的JND数目成比例,所以我们可以得到:
这就是著名的Fechner定律的数学表达式。Fechner定律表示的心物关系可以分解如下:
我们看到的心物对应关系是:刺激S0产生感觉R0;S1产生R1;直到SK产生RK。R1是与1个lg(1+W)相对应的……RK是与K个lg(1+W)相应的。在这里,我们又一次看到,心理量是与物理刺激的对数成比例的。
图3-21 心理量与物理量的对数值的关系
R0与R1是两个刚刚可以分辨的感觉,S0与S1是两个刚刚可以分辨的刺激;可分辨的刺激与可分辨的感觉是一回事!在这里,Fechner是用刺激来表示感觉,用可分辨的刺激来表示可分辨的感觉,因而差别阈限法是制作等距量表的间接方法。制作等距量表的其他方法还有感觉等距法。当我们以物理量的对数为横坐标,以心理量为纵坐标画图时,就得到一条直线,如图3-21。它表示心理量和物理量的对数成比例关系。
Fechner定律的前提有两个:假定Weber比例在强弱不同的刺激水平上都是恒定的;在所有刺激强度水平上的JND都是相等的,即主观的刚刚感到的差别在不同刺激水平上都是一样的。
这两个前提有其合理性,Weber比例在中等强度上是相当恒定的,而人的感官经常接受中等强度的刺激;应当承认JND也是一种测量单位。但批评Fechner定律的人认为,Weber比例不是在所有的刺激强度上都是恒定的,因此,心理量与刺激量的对数成比例的说法就不能成立了;另外,不同刺激强度上的JND也不一定相等,因而,心理量也就不能用JND数目之和来表示。
例如,如果所有的JND在主观上是相等的话,那么绝对阈限以上20JND的响声应当比绝对阈限以上10 JND的响声响1倍,因为它的JND数目比10个JND多1倍(别忘了,Fechner认为,高于绝对阈限的心理量的大小可以用绝对阈限以上的JND数目来表示)。但事实上,绝对阈限以上20 JND的响声比10 JND的响得多。这样,某一感觉道所有的JND就不可能产生同等的感觉差别。在这些批评的背景上,S.S.Stevens提出了制作心理量表的一种直接方法,并在1957年提出了心理量与物理量之间关系的新定律。
(二)数量估计法、比例量表与Stevens定律
在这个标题下我们想要说明的是,如果你运用数量估计法来制作比例量表,那么实验结果是支持Stevens定律的。
什么是数量估计法?1975年Stevens关于数量估计法给被试的指导语做了清楚的说明:“有一系列刺激以随机方式呈现给你。你的任务就是用数字来表示这些刺激的强度。你可以随意地把第一个刺激叫作任意数字,然后按照自己的主观印象给其他刺激逐个标出数字。使用的数字不受限制,可以是整数、小数或分数——以便使每个数字同你觉察的刺激相匹配。”
实验中为了避免被试使用的数字过大或过小以至对结果造成影响,应该使用几何平均值。例如,对同一刺激,3个被试使用的数字如下:100、500、10。如果取算术平均值,则为203。显而易见,203不能很好地代表这3个数据。几何平均值定义为几个数值相乘之积的n次方根。例如,求这3个数的几何平均值步骤如下:
下面是一项假设的用数量估计法作声音响度的比例量表的实验结果。
我们从这里典型的数据可以看出:
①当物理量以8倍的关系增加时,心理量以2倍的关系增加。一般而言,只要物理量的比例关系不变,心理量的比例也不变,即相等的刺激比例总是产生相等的感觉比例。
②心理量的变化与物理量的变化又有什么关系呢?我们可以说,当刺激强度以几何级数(8倍)增加时,心理量也以几何级数(2倍)增加。参见下面的数据说明。
这些数据表明,声音强度引起的心理量的变化与声音强度的立方根成正比。一般而言,心理量是物理量的幂函数,这就是Stevens提出的幂定律或叫Stevens定律。如果以S代表心理量,I代表物理量,a、b代表常数,那么幂定律就可被写作:
常数b是被试任意给定的,如被试随意把第一次出现的刺激定为100,那么他就会以这个主观印象为标准给随后出现的其他刺激标出相应的成一定比例关系的数字,如果被试随意把第一次出现的刺激定为0.2,他同样也会把与0.2这个主观印象成一定比例的数目字分配到其他刺激。在这两种情况下,b的大小不同(100与0.2),但这两种情况下各自心理量之间的比例关系不变,是相同的。常数a是指数,它代表心理量与物理量的关系,意思是当客观的物理强度成倍增加时,心理量以物理强度增加倍数的a次幂增加。就拿刚才的例子来说,当I增加到8倍时,心理量相应地增加80.3倍,即由100增加到80.3倍(100×80.3=200)。当8增加到8倍时(64),心理量相应地也增加80.3,即由200增加到80.3(200×80.3=400)等。即主观的响度和声音的物理强度增加倍数的立方根(0.3次幂)成比例地增长。
图3-22 心理量的对数值与物理量的对数值之间的关系
如果对S=bIa取对数,我们得
要是我们将刚才的例子中的数据取对数作图,心理量与物理量的关系就是直线函数关系,见图3-22。
下面我们以Stevens 1975年的一项数量估计法实验为例来对Stevens定律做进一步的说明。
实验中声音刺激的频率固定为1000Hz,共有8种强度:40、50、60、70、80、90、100、110dB。主试将这8种声音一次一种地随机呈现给32个被试,每种声音呈现两次,对每个被试来说,各种声音的呈现顺序都是不同的。被试听到第一个声音后,给出他(她)认为适当的数目来表示声音的强度,对以后听到的声音则按其与刚才听到的声音的强度比例给出适当的数字。告诉被试,回答的数字无所谓正确与否,主试感兴趣的是被试怎样感觉声音强度像是什么的,而不在于回答的“准确性”。这些指导语目的在于使被试的内部经验(internal experiences)尽可能地单纯与直接。实验结果见图3-23。图3-23中的横坐标是分贝数,它是声音强度的对数值;纵坐标是被试的回答,也已转化为对数形式。在双对数坐标形式下,实验结果表现为一条直线。许许多多的数量估计法实验都得到了类似图3-23的结果,从而导致公式(3.11)。
图3-23的结果与人的听觉经验相符而与Fech-ner定律矛盾。为了说明方便,我们先列出表3.24。
图3-23 一项数量估计法实验
表3.24 某些公共环境声音的分贝数
由于分贝数的增长表示声音强度对数值的增长,按照Fechner定律,它应相应地导致感觉的增强。但大多数人都会说,100dB(地铁列车进站)比50dB(图书馆说话声)要响得多得多,而不仅仅是两倍那么响。换句话说,即Fechner定律不能说明响度感觉随声音强度变化而产生的变化。实际上,对Fechner定律的最早挑战是由音响工程师们提出来的。当他们必须对用户说明响度怎样随声音强度变化时,仅用声音分贝数就会导致错误的说法,如100dB声音比50dB声音响一倍。于是20世纪30年代,音响工程师自己进行实验,通常是呈现两个声音,要求听声音的人回答:第二个声音比第一个声音响多少倍?也可以让被试调节第二个声音使之听起来是第一个声音的两倍或一半。Stevens当时收集了这些数据再加上自己的实验,提出了响度的宋量表(son)。他规定声级40dB的1000Hz纯音的响度为1宋,相应地,50dB为2宋(听起来觉得比40dB响一倍),60dB为4宋,(听起来觉得比40dB响4倍),70dB为8宋,等等,宋的数目随着每10dB的增加而成倍增长。其他频率声音的响度则以1000Hz声音的响度为标准。
这样,声音强度每增加10倍(即增加10dB),而相应地主观感觉响度总增长2倍。换句话说,即刺激及其感觉都按几何级数变化,因此也可以说,30年代的宋量表就已显示出了Stevens定律的雏形。20多年后,Stevens又回到感觉的测量问题并发展出数量估计法,在众多实验研究的基础上,于1957年正式提出了Stevens定律(Laming,1994)。
在公式3.11中,指数a代表直线的斜率,lgb代表直线的截距。直线的不同斜率表示心理量随物理量增加但增加的速度不同(参见图3-24)。
图3-24 心理量和物理量的关系
指数大于1的,表明心理量的增加快过物理量的增加,如电击的感觉强度;指数等于1的,表明心理量与物理量以同等的速度增加,如线段的视觉长度和线段的物理长度增长率相同;指数小于1的,表明心理量的增加速度小于物理量的增加速度,如明度比光能的增长就慢得多。
表3.25给出了各种感觉在特定条件下的指数。
表3.25 各种感觉的指数
数量估计法看似简单,但其实验结果却可以与电生理学的方法相媲美。下面我们举一个例子来说明。
由于与味蕾相连的神经纤维的一部分进入鼓索神经,而鼓索神经从舌通往延脑时途经中耳的小骨,挨近鼓膜,因此,从中耳手术者的鼓索神经上就可以很方便地直接记录出反映味觉变化的动作电位。有一项实验研究(两个被试)是这样进行的:对同一被试给予不同浓度的柠檬酸和蔗糖溶液,让他用数量估计法进行反应,报告他尝味后感觉的大小。在两天以后的手术中,同样的溶液放在被试的舌上,直接记录他们鼓索神经动作电位的发放频率。结果见图3-25。实心的圆和三角的连线代表味觉的感觉强度对柠檬酸或蔗糖溶液的依赖,而空心的圆和三角的连线表示鼓索神经动作电位的发放频率对柠檬酸或蔗糖溶液浓度的依赖。纵、横坐标都是对数单位。从图上可以看到,这两种方法的结果十分类似,也就是说感觉神经的反应强度与刺激强度的关系也可以用Stevens的幂定律来描述(Stevens,1970)。
图3-25 数量估计法与电生理学方法的比较
Stevens的数量估计法曾受到批评,人们认为被试给出的数字可能更多地反映他的数字习惯而不反映他的感觉。为了回答这类批评,Stevens曾用不同感觉道的交叉匹配法(cross-modality matching)来进行实验,以进一步验证Stevens定律。实验中被试紧握手压力计,用握力大小来匹配电流、白噪声、振动等。图3-26就是由此而得到的实验结果。
图3-26 不同感觉道的交叉匹配
假设数量估计法实验中对1000Hz声音的结果为
而对握力的结果为
如果Stevens定律是正确的,或它反映了感觉系统中神经信息的真实转换,那么从上面两式子就可以预测到握力直接与1000Hz响度的匹配。当被试用握力匹配1000Hz响度时:
M=N
因此
或
一系列的实验结果见表3.26预期指数一栏数据(b/c)。
表3.26 预期指数的计算
预期指数是用握力的指数(c)除各刺激的指数(b)得到的。表3.26表明,预期指数与实际匹配结果吻合得很好。
(三)心理物理判断的相对性
本章一开头我们曾介绍过Fechner关于烛光的观察,他发现刺激的作用不是绝对的,而是相对的。
实际上,任何刺激都不能孤立地存在,它总是在时间顺序或空间上相对于一定的上下关系(context)或背景(background),因此,对刺激的知觉不仅依赖于刺激本身,也依赖于其背景。
图3-27形象地说明了这一点。a与b线段是相等的,但因为背景刺激不同——线段两端箭头的方向不同——b线段就显得比a要长,即使两条线段的末端对齐也仍然是这样。有趣的是,类似的现象在动物身上也发现了。在实验中,一组白鼠完成任务后获得高浓度甜汁,几轮试验后奖励改为低浓度甜汁,由高浓度转变为低浓度的奖励使白鼠完成任务的结果比控制组白鼠还差,而控制组一直使用低浓度甜汁作为奖励。这是因为,高低浓度甜汁的对比使低浓度甜汁更加不甜,从而造成了差的完成任务结果(Schiffman,1996)。
图3-27 莱依尔错觉
1984年Laming提出了判断的相对性原则(relativity of judgement)用以解释数量估计法。该原则认为,数量估计法实验中所有的判断都是相对于即时的上下关系(the im-mediate context)而言的。即时的上下关系是指刚才呈现过的刺激以及给出的数目字,在这即时的上下关系中对当前刺激的判断仅仅是顺序性的。举例来说,当刺激c被判断为前一刺激b的2倍大,如果b本身被判断为其前一刺激a的3倍大,那么c就是a的6倍大了。按照这种方式来回溯,则所有的刺激都能够与实验开头的标准刺激联系起来。相对性原则认为这种回溯参照是不可能的,因而对当前刺激的判断仅仅是顺序性质的。如果对当前刺激的判断仅仅是顺序参照性的,即只是相对于即时的上下关系而进行的,那么,以图3-23的实验为例,先呈现1000Hz,40dB声音然后呈现70dB声音,被试对70dB的响度判断受40dB的影响要比下述情况小些:先呈现40dB,然后呈现110dB,被试对110dB响度的判断受40dB的影响。因为在实验设计中,要求40dB都在其余强度声音前呈现过(对其余强度也有类似要求),因此,与40dB强度差别大的声音强度听起来就显得更响,对比的效果增加了它的响度。这就造成了40dB与110dB两端判断的变异性,而这也正是图3-23中40dB与110dB两端判断变异大(数据点上的垂直线长)的原因。当然,像70dB、80dB等中间的刺激受对比效果引起的变异小些,但也仍然是存在的。专门的分析表明,数量估计法所用刺激强度在5.7个对数单位内变化,而被试给出的数字反应则仅在1.27个对数单位内变化,这样,用1.27个对数单位内感觉的变化来反映5.7个对数单位刺激强度的变化就会造成许多偏差,换句话说,即数量估计法引起的变异比简单地分辨这个声音比那个声音更响所引起的变异要大得多。判断的相对性原则就是用以解释数量估计法引起的变异的。
Laming这样小结他对于感觉本质的理解:
①被试能可靠地报告的事情就是,这灯光比那灯光更明亮(brighter),这声音比那声音更响(louder),这物体比那物体感觉更重(heavier)。
②Fechner定律用辨别刺激差别的能力来测量内部(或代表)可分辨的感觉是不成功的,因为辨别刺激差别的能力仅用刺激的物理测量本身也能说明,因此,不一定是反映感觉的差别。换句话说,即Fechner提出的心理的物理学(physics of the mind)并没有实现。
③数量估计法是对感觉的直接测量,虽然数量估计法引起的变异大得多,但数量估计法已提供了数字判断是怎样系统形成的详尽资料,一旦这些资料能合理地得到解释,对感觉本质的理解就会进入一个新的阶段(Laming,1994)。
(四)对偶比较法、等级排列法与顺序量表
我们可以用对偶比较法与等级排列法来制作顺序量表。
对偶比较法最早出现在颜色爱好的研究中。例如,在白纸卡片上分别写上红、橙、黄、绿、蓝。被试的任务非常简单:在面前的两张卡片中挑一张,以表示在两种颜色中他更喜欢哪一种颜色。比完两种颜色以后,换另一对颜色再比较,这样一直做下去直到所有的颜色都被判断完为止。由于每一种颜色都要和另外的颜色配对比较,所以5种颜色共需配成10对即配对数目等于n(n-1)/2(其中n是待比较的样品数目)。表3.27是假设的实验结果。
表3.27 用对偶比较法研究颜色爱好的实验结果
下面让我们结合该表来说明一下对偶比较法的数据处理。表中最上面一行与最左面的颜色都是待配对比较的颜色,表中其余颜色都是比较中的优胜者。例如,当红与橙比较时,被试选红。当蓝与绿比较时,第一次被试选绿;第二次被试选蓝;等等。选择分数就是某种颜色与其他颜色比较时优胜的次数,如红的选择分数为7,表示红与其他颜色比较时胜了7次。当我们把选择分数转换成百分比(P)时,要除以2(n-1)。(n-1)是每种颜色与其他颜色比较的次数,为了消除空间误差或时间误差,相同的颜色要比较两次,所以为2(n-1)次。当把P转换成Z分数时,就可以得出各对颜色爱好的相对距离。为了消除负值,把每个Z分数加上1.13,这就是Z′的数据。根据Z′的数据可得图3-28,它表示一个被试对各种颜色爱好的程度。
图3-28 某被试对各种颜色爱好的程度
1906年,美国心理学家J.M.Gattll曾用等级排列法对当时10位著名的天文学家排过等级。他请一些有代表性的专家按天文学家的声望排出名次,声望最高的排在第一……这样就得到一个单一的等级顺序。他的实验结果见表3.28(武德沃斯,1965)。
表3.28 Gattll实验结果
在对偶比较法中我们得选择分数,即每一样品与其他样品比较时获胜的次数。其实,等级排列法中的等级也可以表示某样品与其他样品比较时获胜的次数。例如,某天文学家在10名天文学家中排在第二位就表示他的声望胜过其余8人的声望,因此,第二位也就相当于选择分数8。这样,就可以把等级排列法中的等级转换成选择分数。假设C代表选择分数,R代表被评判的等级,n代表样品的总数,则
C=n-R(3.12)
而平均选择分数Mc就等于样品总数减平均等级。即
表3.28的数据中平均选择分数化为百分数(P)时只除以(n-1),这是因为在采用等级排列法的实验中只需把样品排列等级一次。
当P值为0或1.00时怎么办?出现这种情形时可以在每个平均选择分数上加0.5分(Mc′),这可以理解为某天文学家的声望与其自身比不分胜负,于是每个天文学家各得半分。相应地,P′值就不是除以(n-1),而是n,因为自身与自身比过一次。由P′可以转换为Z′,每个Z′分数加+0.77,就可以消除Z′分数中的负值(武德沃斯等,1965)。
如果你对天文学家的声望不感兴趣,而是想了解一些产品的外观质量如何,那么你就可以让被试按外观质量来将产品排出等级,数据的处理同上。总之,被试按照一个指定的因次把许多样品排列成一个顺序的系列,这就是等级排列法。
问题
1.为什么必须对感觉及其刺激加以区分?
2.怎样理解感觉阈限与差别阈限的概念?
3.什么是Weber定律?
4.测量感觉阈限与差别阈限的3种方法的实验程序是怎样的?实验结果如何处理?
5.什么叫75%的差别阈限?它有什么优点?
6.什么叫阈下知觉?
7.色子游戏的一般规则是怎样的?怎样定标准可以使猜对的百分比超过50%?
8.信号检测论中,击中率与虚报率怎样随标准升高或降低而变化?
9.有无法与评价法的实验程序是怎样的?怎样计算d′与β?
10.什么叫等感受性曲线?
11.影响β的因素是什么?影响d′的因素是什么?
12.评价法中低标准下的击中率与虚报率为什么都应该是累积概率?
13.信号检测论与古典心理物理法的差别是怎样的?
14.什么是Fechner定律?它与Weber比例有什么关系?
15.怎样理解Fechner定律的基本特征是用可分辨的刺激来表示可分辨的感觉?
16.数量估计法与感觉道交叉匹配方法的实验程序是怎样的?
17.什么是Stevens定律?
18.怎样理解心理物理判断的相对性?
19.对偶比较法与等级排列法的实验程序是怎样的?
参考文献
蔡永春.(2008).周边抑制与双眼抑制之间的交互作用.中国科学院心理研究所:博士研究生学位论文.
赫葆源,张厚粲,陈舒永等.(1983).实验心理学.北京:北京大学出版社.
林赛,诺曼著.孙晔,王甦等译.(1987).人的信息加工:心理学概论.北京:科学出版社.
加德纳·墨菲,约瑟夫·柯琦著.林方,王景和译.(1987).近代心理学历史导引.北京:商务印书馆.
武德沃斯,施洛斯贝格.曹日昌等译.(1965).实验心理学.北京:科学出版社.
Luce, R. D.,&Krumhansl, C.L.(1988).Measurement, scaling, and psychophysics.In Atkinson, R.C.,Herrnstein, R.J.,Lindgey, G.,&Luce, R.D.(Eds).Handbook of Experimental Psychol-ogy.New York:Wiley.
Schiffman, H. R.(1996).Sensation and Perception.New York:John Wiley&Sons Inc.
Stevens, S. S.(1970).Neural events and the psychophysical law.Science,170(3962),1043~1050.
Watson, A. B.,&Pelli, D.G.(1983).Quest:a Bayesian adaptive psychometric method.Perception&Psychophysics,33(2),113~120.