基于心理负荷的生产效率研究
上QQ阅读APP看书,第一时间看更新

2.3 行为反应研究中的相关神经和生理科学指标

2.3.1 EEG

EEG(electroencephalogram)主要用于测量并记录不同部位的脑电活动,脑电活动的节律及振幅与创造性、疲劳、注意力、记忆等有密切的联系。表2-4展示了大脑不同频段波的特征和描述(Fahrion, Walters, Coyne, et al.,1992;Kadir, Ismail, Rahman, et al.,2009; Zhao, Li, Chen, et al.,2010)。

表2-4 EEG各频段特征和描述

2.3.2 ERP

EEG作为一种神经电信号,是脑活动的直接反映。事件相关电位(event related potential, ERP)是EEG研究中最广泛使用的技术方法。ERP又称认知电位,是在人的头皮表面记录到的、刺激诱发的大脑电位变化信息,它将人们对外界刺激信息进行认知加工的脑电活动以科学客观的和高时间精度的方式反映出来。ERP实验可以获得人的行为反应过程中产生的各种脑电成分,而这些ERP成分反映了行为背后的特定认知机理。ERP成分本身往往具有一定的认知含义,而且也可划分为两个细分维度。波幅维度一般反映了人们对刺激信息进行认知加工的强度,其潜伏期维度则反映了人们对刺激进行认知加工的时间。

人的行为反应过程中涉及的几个重要的ERP成分主要是N2、P300、LRP。这些成分与行为和动作反应机制的认知加工和反应准备过程密切相关,因此可以用来有效解释行为反应背后的机理。为此,本书将在本节中分三个小节依次介绍这些ERP成分。

2.3.2.1 N2

N2是刺激呈现后出现的第二个负成分,因此被命名为N2,其潜伏期为200~300ms。N2主要表现在脑的额—中央区,脑内源主要是激活了前扣带回(anterior cingulate cortex, ACC)等区域(Bekker, Kenemans&Verbaten,2005;Bush, Luu&Posner,2000; Carter, Braver, Barch, et al.,1998; Nieuwenhuis, Yeung, van den Wildenberg, et al.,2003; Sasaki, Gemba, Nambu, et al., 1993; van Veen &Carter,2002; Watanabe, Sugiura, Sato, et al.,2002)。

不同的作业任务或处于不同的脑区,N2具有不同的表现和意义。通过对相关文献的梳理,发现N2有两种典型的含义:第一,由新异刺激引起的总体预警系统反应;第二,行为反应过程中的认知控制,包括反应抑制、反应冲突、错误监控等。下面对N2成分的这两种含义进行简述。

第一,新异刺激引起的总体预警系统反应。

Courchesne, Hillyard &Galambos(1975)首先发现了视觉ERP的新异反应,他们采用了三类刺激oddball范式(标准刺激——概率80%;偏差刺激——概率10%;新异非靶刺激——概率10%),结果发现新异刺激引起额部N2的增大,称之为视觉ERP新异效应,它反映了总体预警系统的工作。

研究发现,人们对于情绪刺激往往具有某种特殊的敏感性,它是在人们长期生活中面对可能的外来威胁所形成的一种自适应性反应(Hansen &Hansen,1988; Huang & Luo,2006; Ohman, Lundqvist & Esteves, 2001; Smith, Cacioppo & Larsen,2003; Tipples, Atkinson & Young, 2002)。情绪刺激能吸引较多的注意力,从而会诱发较强的N2成分(Balconi & Pozzoli,2008)。尤其是负性刺激,相对于中性刺激,往往具有较早的N2潜伏期(Kiss & Eimer,2008; Liddell, Williams, Rathjen, et al., 2004)和较大的N2波幅(Li, Yuan & Lin,2008; Ma, Wang, Wang, et al., 2010; Schupp, Stockburger, Codispoti, et al.,2007; Yuan, Yang, Meng, et al.,2008)。

第二,N2表现为行为反应过程中的认知控制,包括反应抑制、反应冲突、错误监控。

在go/no-go的刺激任务中,no-go刺激诱发出比go刺激更明显的N2负波,它反映了一种自上而下的抑制机制,也就是对潜在反应倾向的抑制,N2的这种抑制效应也会存在于外显反应任务中(Bruin & Wijers,2002;Pfefferbaum, Ford, Weller, et al.,1985)。研究发现,当加大反应压力时,no-go任务中的N2波幅加强(Jodo &Kayama,1992),这说明N2的波幅可以作为反应抑制的参考衡量指标(Kenstein, Hoormann & Hohnsbein,1999)。

在stop-single任务中,被试被要求对指定的刺激进行选择反应的任务,但是当刺激之后出现一个停止刺激,要求被试进行停止反应时,会诱发出较大的N2波幅,反映了认知加工中的反应抑制(Band, Ridderinkhof & van der Molen,2003)。

Eriksen双侧实验范式研究要求被试对字母串中央的字母进行选择反应,包括两种字母串:一种是周围的字母和中央的字母完全一致,如“HHHHH”(一致条件);一种是周围的字母和中心字母不一致,如“HHSHH”(不一致条件)。结果表明不一致的条件引起较慢的反应,诱发较大N2波幅,且主要分布在额—中央区,反映了认知冲突(Bartholow, Pearson, Dickter, et al.,2005)。

西蒙效应(Simon effect)相关的研究中,在不一致的条件下(反应手和刺激位置不在同侧),会诱发较大的N2成分(Oostenveld, Praamstra, Stegeman, et al.,2001; Valle-Inclán,1996a),反映了行为反应认知加工过程的冲突识别(van Veen&Carter,2002; Yang &Wang,2002)。Melara, Wang, Vu, et al.(2008)的S-R(刺激—反应)任务脑电研究发现,不一致相对于一致有较大的N2波幅,反映了S-R冲突早期的识别和注意干扰。

综上所述,N2成分在认知过程中会扮演不同的角色,它既可以反映总体预警系统的工作,亦可以表示行为反应过程的认知控制(反应抑制、反应冲突、错误监控),从而调节操作者的行为反应。因此,N2在行为反应加工过程中的作用不容忽视。本书中重点关注N2的第二个含义,即行为反应过程的认知控制。

2.3.2.2 P300

P300是晚成分中的第三个正波,最初发现时于300ms左右,故称之为P300(Sutton, Braren & Zubin,1965)。它是ERP成分中研究最多、应用最广的成分。随着研究的进展,其家族成分不断被发现,其潜伏期已经逐渐扩展到了800ms。P300脑区分布较为广泛,分布在前额—中央—后脑区,但后脑区的波幅一般比前额区的波幅要大(Bartholow, Riordan, Saults, et al., 2009)。因此,许多研究往往在中央—后脑区发现显著的P300成分(Nieuwenhuis, Aston-Jones & Cohen,2005; Polezzi, Sartori, Rumiati, et al.,2010)。

通过对相关文献的梳理,P300相关理论模型主要有两种:背景更新理论模型和资源分配理论模型。下面就这两个理论进行简要描述。

第一,背景更新理论模型。

Donchin(1981)提出了背景更新理论模型用于阐释P300的认知机理:人在信息处理认知活动时会形成一个必要信息库,并储存在人脑记忆中。当对新的信息进行认知加工时,人脑会将其相关的表征信息整合到已有的脑信息库中,并对原有的背景信息进行调整形成新的表征信息,以相应修正未来的应对决策和反应,在这个信息库的更新过程中便产生了P300,其波幅代表了信息更新程度。Kok(2001)指出信息刺激根据概率、任务重要性、任务难度的不同,需要占用不同量的注意力和记忆资源,而P300的波幅则反映了加工过程中的认知资源量(见图2-7)。

图2-7 P300波幅意义模式

(资料来源:译自Kok, A. On the utility of P3 amplitude as a measure of processing capacity.Psychophysiology,2001,38(3), :38-55)

研究表明,P300的潜伏期随着任务的难度的增加而增加,这反映了人们对刺激物的评价或分类所需要的时间的延长(Donchin,1981; Kutas &Dale,1997)。西蒙效应相关研究发现,反应手和刺激位置不一致的条件下,相对于一致条件,会诱发较小的P300振幅(Melara, Wang, Vu, et al., 2008; Ragot,1990; Zhou, Zhang, Tan, et al.,2004)和延迟的P300潜伏期(Masaki, Takasawa & Yamazaki,2000; Melara, Wang, Vu, et al., 2008; Valle-Inclán,1996b),反映了认知加工分类过程中的空间冲突控制(Melara, Wang, Vu, et al.,2008; Ragot,1984)。

第二,资源分配理论模型。

P300的另一个重要理论是资源分配理论。在双任务模式中,P300的波幅有效地反映了注意资源的分配(见图2-8)。完成任务所需资源分配过程受到整体刺激水平的影响(Kahneman,1973)。当任务执行性要求较低时,不需要占用大量的资源,因此刺激的P300的波幅较大,潜伏期相对较短;对于需要大量注意资源的任务,由于资源要用于任务执行,因此刺激诱发的P300波幅较小但潜伏期较长(Kok,2001; Polich,1987)。因此,刺激的水平可以调节P300的波幅和潜伏期,被动刺激相比主动执行的任务诱发较小的P300波幅(Kok,1990; Pribram & McGuinness,1975)。

图2-8 P300注意资源分配模型

(资料来源:改编自Kahneman, D.Attention and effort.1973; Kok, A.Internal and external control:A two-factor model of amplitude change of event-related potentials.Acta Psychologica,1990,74(2):213-236; Kok, A. On the utility of P3 amplitude as a measure of processing capacity. Psychophysiology,2001,38(3):557-577; Polich, J. Task difficulty, probability, and inter-stimulus interval as determinants of P300 from auditory stimuli.Electroencephalography and Clinical Neurophysiology/Evoked Potentials Section,1987,68(4):311-320; Pribram, K.H.& McGuinness, D. Arousal, activation, and effort in the control of attention.Psychological Review,1975,82(2):116)

情绪对信息认知加工过程产生重要的影响(Dolan,2002; Fox, Russo, Bowles, et al.,2001; Goldstein, Brendel, Tuescher, et al.,2007; Ohman, Flykt & Esteves,2001; Phelps, Ling & Carrasco,2006; Rowe, Hirsh &Anderson,2007; Yuan, Yang, Meng, et al.,2008; Yuan, Zhang, Chen, et al.,2007; Yu, Yuan &Luo,2009)。Zhang &Lu(2012)的研究表明,情绪表情(正性和负性)相对中性表情占用较多的注意资源,诱发较高的P300波幅和较短的P300潜伏期;尤其是威胁等负性刺激会诱发较强的P300成分(Schupp, Stockburger, Codispoti, et al.,2007)。此外,Yuan, Lu, Yang, et al.(2011)的研究发现,目标刺激在负性情绪启动下相对于中性启动有较小的P300波幅。

综上所述,P300反映了刺激反应过程中多种认知加工问题,在具体的问题中,P300可能不止具有一种含义,而是同时代表了多种意义。在未来研究中讨论P300成分时,将综合考虑具体的实验范式和刺激材料,以便对P300做出更加合理的解释。

2.3.2.3 LRP

单侧化准备电位(lateralized readiness potential, LRP)是与行为反应准备相关的脑电成分,在反应之前出现(Kornhuber,1965;赵仑,2010)。Kornhuber发现当反应手运动时,对侧头皮将出现比同侧更大的一个负电位,称之为单侧化运动准备电位,其最大波幅位于头皮中央对应于初级运动皮层的位置。LRP经典记录电极点是C3′和C4′(标准国际10—20系统C3、C4电极点前方1cm),实际研究中多采用C3、C4电极点(Coles,1989; Hsieh&Yu,2003; Rammsayer &Stahl,2004;陈立翰,2008;赵仑,2010)。

LRP获取的方法有两种:两阶段相减方法(即C3/4[L]-C3/4[R])(De Jong, Wierda, Mulder, et al.,1988;赵仑,2010),相减—平均序列的方法(即[(C4-C3)[L]+(C3-C4)[R]/2)(Coles,1989; Gratton,1988;赵仑,2010)。

LRP常用开始启动时间点(onset latency)进行分析,可以分为刺激锁时S-LRP和反应锁时R-LRP两种(Mordkoff & Gianaros,2000; Rinkenauer, Osman, Ulrich, et al.,2004;赵仑,2010)。S-LRP是指刺激出现和LRP之间的时间间隔,反映了运动准备过程中的信息感知;R-LRP是指LRP出现和反应时间点之间的时间间隔,反映了运动准备过程中的反应执行(Huang & Luo,2006; Rinkenauer, Osman, Ulrich, et al.,2004;赵仑,2010)。因此,LRP可以作为反应准备的一个“在线”标志,通过对S-LRP和R-LRP的启动时间进行分析,得到认知和反应加工过程的时间进程信息。从脑内源分析,S-LRP激活主要体现在顶叶和第一运动皮层,而R-LRP的激活主要在后运动皮层(Leuthold &Jentzsch,2002)。

LRP在由人的外在行为推演出内部认知加工过程中起着重要作用,它能够确切地解释心理加工的时间进程,尤其是反应准备、反应选择和反应执行方面。目前LRP的研究主要应用于四个方面(陈立翰,2008):第一,反应准备和反应执行;第二,阈下直觉和内隐学习;第三,西蒙效应;第四,脑机界面。其中,西蒙效应是本书中重点关注的一个方面。

当反应手位置和刺激位置不一致时,相比一致时单侧手运动反应要快,这种现象称之为西蒙效应(Vallesi, Mapelli, Schiff, et al.,2005), LRP可以从运动准备的阶段反映西蒙效应的产生机理(De Jong, Wierda, Mulder, et al.,1988; Gratton, Coles, Sirevaag, et al.,1988)。西蒙效应的相关研究表明,在一致情形下LRP的阈下激活是对正确选择的支持,而在不一致情形下则是对正确选择的阻碍(Wascher & Wolber,2004)。西蒙任务中,不一致相比一致有较长的LRP始潜伏期(Leuthold & Kopp,1998;Masaki, Takasawa &Yamazaki,2000)和较小的LRP波幅(Cespón, Galdo-Alvarez & Díaz,2012; Lubbe,2002)。Vallesi, Mapelli, Schiff, et al.(2005)发现水平西蒙任务和垂直西蒙任务有不同的认知加工机制(见图2-9)。

图2-9 水平西蒙效应和垂直西蒙效应的LRP

(资料来源:Vallesi, A., Mapelli, D.&Schiff, S., et al.Horizontal and vertical Simon effect:Different underlying mechanisms.Cognition,2005,96(1):B33-B43)

水平任务中,LRP在不一致的实验中,首先偏向与错误反应相同的方向(称为Gratton-dip),与刺激位置同侧,它是由刺激位置诱发的自动激活反应,然后LRP回归到正确偏离方向;同时,这种一致和不一致表现出的差异(西蒙效应)随着反应时的增加而减弱,这个变化趋势表明,与刺激位置同方向的自动加工反应首先得到激活并随着时间开始下降,为正确方向反应准备;而在垂直任务中,不一致的条件下,LRP并没有出现Gratton-dip的早期偏离,但在正确方向的反应准备过程中表现出延迟,也就是说垂直任务中西蒙效应并不随反应时的增加发生变化。

西蒙效应机制中主要有两种假设:第一种是信息感知干扰假设,此假设认为西蒙任务中的干扰效应产生于察觉—编码阶段(Hasbroucq & Guiard, 1991; Masaki, Takaswa &Yamazaki,2000);第二种是反应干扰假设,此假设认为西蒙任务中的干扰效应产生于反应执行阶段(Masaki, Takasawa &Yamazaki,2000; Valle-Inclán,1996a)。因此,LRP可以作为划分察觉—编码阶段和反应执行阶段的时间标记。

2.3.3 EMG

2.3.3.1 EMG定义及产生机理

肌肉在持续收缩过程中,会逐渐进入疲劳状态,表面肌电(surface electromyography, SEMG)信号是从肌体表面通过电极记录下来的神经肌肉活动时产生的生物电信号,因此它在一定程度上反映了肌肉的疲劳度。

人体的运动主要由骨骼肌来实现,它是人体运动系统的主要组成部分。在大脑中枢神经系统的控制下,一方面,骨骼肌纤维通过其兴奋、收缩的功能作用于骨骼而产生人体各组织的协调运动;另一方面,相应的细胞生成肌神经电位,形成EMG。具体过程为:肌肉收缩时,信号由大脑运动皮层发出,沿着神经传导到运动神经元,并释放特定化学物质,此化学物质使得人体细胞的细胞膜对离子的吸收能力发生变化,产生了动作电位,动作电位信号传播过程中引起肌纤维的激活,进而产生动作和运动,同时,电位信号传导过程的变化便是EMG(Basmajian & De Luca,1985;邓晨曦,2009;刘汉扬,陈家琦,1990;苑廷刚,王向东,张戈,2002;邹彬,2008)。EMG产生原理如图2-10所示。

图2-10 EMG产生原理

(资料来源:译自Basmajian, J.V.&De Luca, C.Muscles alive.Proceedings of the Royal Society of Medicine,1985(278):126)

图2-1 1 EMG记录位置

(资料来源:Gerard, M.J., Armstrong, T.J., Rempel, D.A., et a.l Short term and long term effects of enhanced auditory feedback on typing force, EMG, and comfort while typing.Applied Ergonomics,2002,33(2):129-138;轧铸,季红光,王海明.生物反馈及其临床应用.中国行为医学科学,1997,6(1):74-75)

2.3.3.2 EMG记录点

EMG检测时通常要用三个电极,正电极和负电极放在最易检测到动作电位的部位,接地是EMG放大器的零电压参考点,一般放在动作电位最微弱的部位(崔玉鹏,洪峰,2005)。电极一般与纽扣式电极贴片连接,正、负电极选择顺着肌纤维的方向贴在肌肉收缩的几何中心。EMG电极贴片被贴放之前,应尽量保持所测部位的清洁,可用酒精擦拭皮肤,以免皮肤电阻对EMG信号产生较大的影响(崔玉鹏,洪峰,2005)。

EMG记录点有以下几种常用的选择方式(Gerard, Armstrong, Rempel, et al.,2002;轧铸,季红光,王海明,1997):①咬肌上的三角电极(见图2-11(a)); ②上梯形肌的广阔位置(见图2-11(b)); ③胸部(见图2-11(c)); ④手腕(见图2-11(d))。

2.3.3.3 EMG影响因素

EMG是检测人体疲劳度的有效指标,随着疲劳度的增加,肌电图中肌电的振幅随之增加,但这种相关性仍然可能受到一些因素的干扰,因此在EMG记录过程中要综合考虑或尽量避免这些影响因素。

研究表明,干扰因素主要可概括为以下几个方面(Chaffin,1973;邓晨曦,2009;邹彬,2008):①工作的性质;②体温因素;③电源的干扰;④心电因素;⑤电极移动因素;⑥无线电波因素。

2.3.3.4 EMG信息处理技术和方法

由于直接采集到的EMG信号是时间序列信号,它是活动时产生的电位变化在时间和空间维度上的综合,且肌电信号往往是不平稳的,需要经过处理后才可用来评价疲劳。研究表明,主要有以下几个方法和技术适用于动态肌电信号的处理(Karlsson, Yu & Akay,1999;董建华,顾汉明,张星,2007;邓晨曦,2009):①Cohen类时频分析;②短时傅里叶变换(short time Fourier transform, STFT); ③小波变换(wavele transform, WT)。

上述用于动态肌电信号处理的三种方法各有其优劣之处,对比分析结果描述如表2-5所示。本书研究中结合采用的生理记录仪特点,对EMG信号处理采用短时傅里叶变换的方法。

表2-5 EMG信息处理技术方法的优势和劣势对比

(资料来源:整理自邓晨曦.基于静动态收缩条件的前臂肌电信号疲劳特征研究.天津大学硕士学位论文,2009;董建华,顾汉明,张星.几种时频分析方法的比较及应用.工程地球物理学报,2007,4(4):312-316)

2.3.3.5 EMG未来发展

EMG技术产生于20世纪50年代,最早应用于运动科研领域,它在判断疲劳度方面有明显的效果,但因操作和分析等方面的不便利性使得其应用性较弱。神经科学与肌学等基础生理学进展为EMG的应用奠定了坚实的基础,计算机技术和生物信号处理技术的发展,为EMG技术的应用带来了便利性,有效地推动了EMG在运动领域、医学领域和心理学等领域的应用和进展(赵永超,2009)。