面向言语治疗的汉语词汇语义表征分析研究
上QQ阅读APP看书,第一时间看更新

第一节 词汇语义特征分析:言语治疗手段和语言学方法

在以交流障碍为主要表现的疾病的临床诊治中,无论是失语症还是语言发育迟缓,或是老年痴呆,往往首先从词汇语义水平进行评估、诊断和治疗。例如,命名、联想和分类等行为学任务,常用于痴呆和失语症的诊断和功能评估中(Garrard et al., 2005;Jefferies&Lambon Ralph,2006;Reilly et al., 2011;Perri et al., 2012)。由于医学具有很强的实践性,词汇语义的这些操作任务,也往往用作临床治疗手段。近年来,在欧美的言语治疗专业发展中,对语义特征分析的应用越来越受到关注,并且已经形成了自身的技术操作模式(祁冬晴、江钟立,2014)。

一、语义特征训练:现有治疗技术的优势与局限性

作为语言学研究方法的语义特征分析有着悠久的历史。李葆嘉(2013,9-12页)认为,这种方法可以追溯到17世纪欧洲学者的“语义基元”设想。作为言语治疗手段的语义特征分析则相对较晚才发展出来。德国神经学和心理学家瑞义泽(W.Riese)在《失语症早期研究史》(Riese,1947)第17条脚注中,转引法国医生特鲁索(A.Trousseau)在1864年报道的一个法语病例(Trousseau,1864),认为这可能是史上第一例失语症治疗记录。这是一位患有完全性失语的女性。她通过复述别人问题来帮助检索记忆中的词汇,然后在笔记本中写下自己能说出的词。这些词是按照前词能引发她说出后词的顺序来记录,其中有“羽毛→鸟→家禽→填鸭子”这样的词序。笔者认为,这也可能是最早的利用词汇语义特征进行提示的言语治疗记录。

直接以言语治疗为目的的词汇语义特征分析技术,直到1985年才有报道。在这一年的美国伊利诺伊州言语语言听力学会年会上,耶维萨科(M.Ylvisaker)和塞科赖什(S.Szekeres)首次把语义特征分析引入脑外伤患者交流功能障碍治疗中(Ylvisaker&Szekeres,1985)。遗憾的是,此后很长一段时间都没有进展。直到1994年,马萨罗(M.Massaro)和汤普金斯(C.A.Tompkins)才提出系统的操作框架(简称M-T语义训练[4]),并且验证了该方法的疗效(Massaro&Tompkins,1994)。在他们的报道中,两名患者因脑外伤导致认知功能障碍,主要表现为言语交流障碍。他们接受了为期1周的义征训练。结果发现,患者对已训练项目(特化效应)和未训练项目(拓展效应)的命名能力都得到显著改善。在训练结束后2周再次评估,发现疗效仍然存在。1995年,伯耶尔(M.Boyle)和科艾琉(C.A.Coelho)首次报道应用于慢性失语症的义征训练(Boyle&Coelho,1995)。这是一例布洛卡失语症男性患者,57岁,母语为英语,右侧额顶叶缺血性卒中后68个月。训练用图共34张,选自斯诺格拉斯-范德瓦特图集(Snodgrass&Vanderwart,1980)。采用M-T语义训练共2周,每周3次。第一周使用少图方式,每次训练7张图。第二周采用多图方式,每次训练27张图。结果显示,义征训练有显著的特化效应,并且在采用少图方式阶段,还可以观察到拓展效应。疗效在训练结束后可以维持2个月。

图2 语义训练卡片示意图

(Massaro&Tompkins,1994)

在实施M-T语义训练时,研究者向患者出示语义训练卡(如图2)。卡片中央是一张有待命名的图片,周边罗列了六种语义特征。分别是类别(group)、用途(use)、动作(action)、属性(properties)、方所(location)和联想(association)。治疗师首先向患者呈现图卡,要求患者尝试命名图片。不管患者是否能够正确命名,治疗师接下来都要引导患者说出与目标词相关的语义特征。在引导过程中,治疗师需要遵循训练卡上给出的六种语义特征进行提示,并且把患者说出的语义特征填入相应框栏。如果患者无法说出某种语义特征,治疗师就要在相应框栏加以标记,并且把正确的语义特征说给患者听。如果当六类特征都已经训练完毕,而患者仍不能正确命名图片,就由治疗师告之正确名称,并且要求患者跟着复述一次。最后,再次复习已经填入各框栏的所有义征。这种义征训练法要求患者自己说出义征,因而又可以称为义征产出疗法。后来又开发出义征识认疗法,即在治疗时出示几个备选义征供患者指认。但是,并非所有研究都严格区分这两种疗法。伯耶尔在2010年综述了此前所有的失语症语义特征训练文献,明确对产出、识认和混合这三种形式加以区分。伯耶尔认为,语义特征训练具有改善认知功能、提高交流能力的作用,但同时也指出,目前仍无法确认三种形式中的哪一种最有效(Boyle,2010)。这种不确定性,应该与言语治疗时针对不同患者选取可行任务的做法密切相关。在临床言语治疗中,非流畅性失语可能无法实施义征产出疗法,而更容易接受义征识认疗法。流畅性失语、失认症和失用症患者可能更适于接受义征产出疗法。但是,可以确定的是,大多数认知功能障碍患者都可以找到某种适宜的形式接受语义特征训练,并且从中获益。

从上述操作框架来看,语义特征训练法并不复杂。但是,有一些基础问题没有解决,从而限制了它的推广应用。首先,为什么要选这六种义征做分析?这个问题又可以分解为两个子问题:要怎样对语义特征进行分类?要挑选哪些语义特征类别用于训练?早期文献没有给出详细说明,而这恰恰是该方法后续发展的主要问题。义征在不同概念中的分布不尽相同。例如,“筷子”可以填入<进食>[用途][5]、<餐具>[分类]、<夹取>[动作]、<细长形>[属性]、<在桌上>[方所]、<米饭>[联想]。但是,“草莓”和“板凳”就很难找出它们本身能做什么动作。因此,不断有M-T语义训练的修订版或改进版出现。例如,万鲍(J.L.Wambaugh)和佛格森(M.Ferguson)把语义特征分析用于改善失语症患者的动作命名(Wambaugh&Ferguson,2007)。他们列举了六种类型的动作语义特征供训练:动作执行者、动作目的、怎么做、性质描述、动作发生场所、联想到的事物或动作。但是,这充其量是提出了更详细的研究方向,而没有从根本上解决语义特征的分类和选取问题。

其次,在特定的认知功能障碍中,例如失语症或失认症,哪些语义特征更易受损?这个问题也可以分解为两个子问题。第一,仍然是义征分类问题。但它不是指纯粹的质性语义分类,而是如何在量化的语义评估基础上进行分类,由此方可进行“更易”或“不易”的程度比较。第二,哪些语义特征在特定认知功能障碍时得以保留?在言语治疗中,有一个难易度控制的原则,即设置的训练任务需要让患者感到稍有难度,但经过努力又能够完成。如果患者无法完成训练,或者由于任务过难,患者就有可能产生挫折感,从而导致拒绝配合治疗,疗效也就无从谈起。因此,语义特征训练的方案需要确保用于训练的语义特征是有一定难度,却又在患者残存功能范围内。这同样需要量化评估义征,方能做出有效判断。

梅森-鲍曼(M.B.Mason-Baughman)等人分析了语义特征的三种可量化指标:重要性、独特性和共通性(Mason-Baughman&Wallace,2013)。重要性可以分为强和弱两种。强重要性又称必要性,是指概念所指对象的所有实例都必须具有的义征。弱重要性是指某些义征虽然对概念所指对象也很重要,但却没有必要在所有实例中都出现。例如,对于“汽车”这个概念,<车轮>和<方向盘>是必要义征,而<车牌>和<后备箱>是弱重要义征。独特性是指义征只在某范畴的一小部分实例中出现,可以由此划分下位类别。例如,在“服装”这个范畴中,<袖子>只在“大衣”和“衬衫”这些概念中出现,它在“衣服”和“裤子”这两个类别之间具有区分作用。共通性是指义征在一类事物的所有实例中都存在。例如,<用来穿>是“服装”范畴内所有概念都有的义征。梅森-鲍曼等根据以上性质,搭配出四种情况:强重要共通、弱重要共通、强重要区别、弱重要区别。例如,“草莓”的这四种义征分别是<摘>、<甜>、<圆锥形>和<在水果馅饼上>。梅森-鲍曼等研究了10名英语失语症患者(流畅性失语2名,非流畅性失语8名),发现区别性义征受损程度要显著高于共通性义征,而重要性强弱则对义征受损程度没有显著影响。佩里(R.Perri)等人分析了阿尔茨海默病患者的语义特征,计算了这些特征的独特性指标,并且把语义特征分为感觉型(例如“香蕉”<黄色的>)和非感觉型(例如“熊猫”<吃竹子>),结果发现感觉型义征和独特性义征较早受损,而非感觉型义征和多数概念共享的义征则不易受损(Perri et al., 2012)。此类研究虽然增进了对特定认知功能障碍的语义特征受损的认识,但是研究旨趣集中于疾病诊断,而非言语治疗。

再次,应该先选择哪种语义特征进行训练?这似乎与前两个问题相似,但实质上是语义特征的编排问题。无论是质性的语义分类,还是量化的义征评估,一旦落实到训练方案中,都必须面对排序问题。例如,图2里的六种义征,在义征产出疗法中,应该按照什么顺序进行提示呢?是顺时针,还是先上后下,或是先左后右?在义征识认疗法中,应该按照时间顺序先后呈现语义特征,还是按照空间顺序,选择一些语义特征,配以图片或词卡,同时呈现在患者面前?如果深入考虑这个问题,就会发现,它其实触及了隐藏在认知过程中的深层机制。无论是言语治疗,还是二语习得,甚至是语言发育,都涉及语主利用时间和空间线索认识事物之间的关系,从而掌握知识的能力。例如,当面对墙上的一排开关而不知哪个能打开所需的灯时,人们会试着去逐个按动它们,通过手部动作和灯光明灭之间的时间线索来找到正确的开关。又如,在儿童语言发育过程中,父母指向实物并说出名称,孩子则不断尝试复述名称,同时辅以对实物的操作,从而掌握词汇语义和语音的对应关系。当需要向别人解释某些概念时,人们总会用一系列语义特征的组合来传递概念语义,而这些语义特征的先后呈现顺序,则体现了言说者内心所认为的特征重要性排序。事实上,柯林斯(A.M.Collins)和奎廉提出的语义记忆分层网络模型就认为,语义特征的有序呈现会有助于概念识别(Collins&Quillian,1969)。如果要把这种认识应用到言语治疗中,就需要在语言学理论指导下对词汇语义特征排序,而这种排序需要以词汇语义特征的质性分类和量化分析为基础。深入的神经语言学机制研究又有可能为改进排序方案提供依据。

上述问题的解决都有赖于对词汇语义特征进行质性分类和量化分析。欧美词汇语义研究在这方面已经积累了较为丰富的经验。这种积累一方面是受到神经心理学和神经语言学的推动,为揭示词汇语义系统的结构组织模式提供了理论与实验依据;另一方面,在研究中通过人群调查建立语义特征分析数据库,并发展了质性分类方案与量化分析指标,从而为解决上述医学问题奠定了语言学基础。

二、语义特征分析:认知理论和实验依据

在与词汇语义研究相关的认知障碍中,范畴特异性语义损伤(category specific semantic impairments)尤其受到关注[6]。它是指当脑损伤患者在命名和理解概念时,生物和非生物范畴的损伤程度存在显著差异(俞建梁、陈先梅,2013)。1984年,神经心理学家沃林顿(E.K.Warrington)和沙立科(T.Shallice)提出该术语,详细报道了四例单纯疱疹病毒性脑炎后遗症患者(Warrington&Shallice,1984)。这四例患者存在双侧颞叶受损,在执行图片识认和听词辨认任务时,表现出较明显的生物范畴受损,而非生物范畴相对保留。沃林顿和沙立科为这种现象提出了感觉-功用理论(sensory-functional theory),认为人脑在处理生物范畴时较多依赖感觉特征,而非生物范畴更多依赖功用特征。根据该理论,这四名患者的视听感知神经通路受损,影响感觉特征的处理,从而在行为学上表现出生物范畴处理障碍。

在感觉-功用理论提出以后,围绕范畴特异性语义损伤,研究者们提出了众多理论。由于各种研究主要采用视知觉和听知觉通路来探查语义记忆的组织结构,心理学家克里(G.S.Cree)和麦克雷(K.McRae)提出,各种理论所关注的影响因素分属于三个方面:语义表征、视觉表征和词形表征(Cree&McRae,2003)。其中,影响语义表征的因素有知识类型(感觉知识和功用知识)、区别性义征、相关性义征、概念相似性和概念熟悉度。影响视觉表征的是视觉信息的相似性和复杂性。影响词形表征的是词频。如果仅考察语义表征,克里和麦克雷提出可以把所有理论分为三种类型:支持非模态语义表征的理论、支持模态化语义处理的理论和认为存在先天领域划分的理论。支持非模态语义表征的理论包括概念结构理论(conceptual structure account)(Tyler&Moss,2001)和一元内容组织假说(organized unitary content hypothesis)(Caramazza et al., 1990)。他们都认为语义表征是一个不分模块的整体结构。虽然语义特征可以有模态差异,但是语义特征并不以模态化方式构建语义表征。之所以语义表征有范畴之分,是因为不同模态的义征,在不同范畴中的分布数量或联结强度不同。支持模态化语义处理的理论包括感觉-功用理论、感觉-运动理论(sensory-motor theory)(Antonucci&Alt,2011)、义征关联与区分理论(correlated and distinguishing features account)(Devlin et al., 1998)和分层互动理论(hierarchical interactive theory)(Humphreys&Forde,2001)等。他们都认为语义表征分布于相对独立的感觉和功用模块中,由相互独立的感觉和功用通路来分配处理语义信息。语义特征直接以模态化方式构建语义表征。认为存在先天领域划分的理论包括领域特异性假说(domain-specific hypothesis)(Caramazza&Shelton,1998)和分布式领域特异性假说(distributed domain-specific hypothesis)(Mahon&Caramazza,2009)。他们都认为进化过程在认知系统中刻录了三个先天领域,可以把物体区分为动物、植物和工具。这种先天划分对语义表征而言,具有首要性和限制性。

克里和麦克雷认为,要解决范畴特异性语义损伤研究方面的理论争议,就需要构建经验性词汇语义特征数据库(简称义征库),用于词汇语义表征建模和分析。为此,他们采用义征提名法[7]进行人群调查,建立了国际上第一个大型英语名物义征库(McRae, De Sa,&Seidenberg,1997;McRae&Cree,2002;Cree&McRae,2003;McRae et al., 2005),随后又出现了荷兰语(比利时弗兰芒语)(Ruts et al., 2004;De Deyne et al., 2008)、英语动词(Vinson&Vigliocco,2008)、德语(Kremer&Baroni,2011)和意大利语(Kremer&Baroni,2011;Lenci et al., 2013;Montefinese et al., 2013)等多个采用类似方法的大型义征库。虽然这些研究都关注语义表征的组织结构,但义征提名法实际上是一种调用语义记忆的心理学手段。采用这种方法得到的结果,不仅反映语义表征的结构,而且还受到语义记忆系统的功能活动的影响。因此,在考察这些义征库的医学和语言学价值之前,有必要了解心理语言学和神经心理学领域在语义表征和语义记忆方面的一些基本观念,并考察其近期研究成果。

在《牛津心理语言学手册》中,伦敦大学的心理语言学家维廖科(G.Vigliocco)指出,欧美词汇语义表征研究存在两种基本观念:整体观和成分观(Vigliocco&Vinson,2007)。整体观把词视为在意义上不可分割的颗粒化实体,词与词之间形成错综复杂的意义作用关系,从而使概念系统呈现为以词为节点,词间意义关系为连线的复杂网络。在整体观基础上,对词义的分析就变成了对词间关系的辨析和标注。例如,“猫”是“动物”的下位词,“耳朵”与“脸”是部分-整体关系。欧美词汇语言学研究中所指“语义网络”(semantic networks),主要是基于整体观的单词网络,其典型成果是普林斯顿大学的词网(WordNet©)。

成分观把词视为由相互交织的语义特征构成的实体,认为语义系统的底层构造是语义特征而不是概念。柯林斯和罗福图斯(E.F.Loftus)的扩散激活模型(Collins&Loftus,1975)通常被认为是词汇语义整体观的经典模型(Hutchison,2003)。但是,柯林斯与奎廉在1969年构建语义记忆的分层存储模型时,实际上采用的是语义特征分析。例如,“鸵鸟”的义征是<有细长的腿>、<很高>和<不会飞>,“鲨鱼”的义征是<会撕咬>和<有危险>(Collins&Quillian,1969)。是否分析语义特征,并不造成语义表征的整体观和成分观的对立。只不过整体观认为当概念激活时,所有语义特征都同等激活。成分观则认为,语义特征的激活程度不均等,一部分语义特征激活,会使持有这些特征的概念更易激活。基于联想关系的语义启动效应支持整体观,而基于义征重叠关系的语义启动效应则支持成分观(Hutchison,2003)。但是,无论在实际的语言使用中,还是在精心设计的心理语言学实验中,联想关系和义征重叠关系都难以明确区分开来(Hutchison,2003)。在M-T语义训练中,联想词本身就作为一种义征而呈现在治疗卡上(图2)。一些语义网络和语义记忆的建模研究,也直接使用联想词库作为建模语料来源(Steyvers&Tenenbaum,2005;Steyvers, Griffiths,&Dennis,2006;Morais, Olsson,&Schooler,2013)。

神经语言学研究支持这样一种观点:人脑对事物的语义表征可以分为不同语义特征,各语义特征在不同脑区得到处理(多模态的语义特征处理),最终汇合形成一个统一的语义表征(非模态的语义表征储藏)。这种观点实际上把语义记忆划分成两个部分:库藏内容(语义表征、语义网络或语义知识)和存取能力(语义控制、语义使用或语义处理)(Jefferies&Lambon Ralph,2006;Reilly et al., 2011)。如果在临床诊疗中应用该理论指导行为学评估,则可以认为:当库藏本身受损时,无论是听觉任务,还是视觉任务,任何行为学评定,都表现出同样程度的障碍,即呈现模块间一致性。如果库藏相对完好,那么经不同感知模块实施行为学评定,所得结果会不一致。语义系统就好比是一个图书馆,库存书籍相当于语义知识。使用索书系统借阅图书,相当于语义处理过程。可以根据语种、学科、年代或作者等不同信息进行检索。缺少一种信息并不妨碍借助其他信息索书。如果库存本身缺失,那么无论用什么方法都找不到所要的书。语义痴呆是库藏受损,语义失语(失语症所伴语义障碍)、失用症或失认症是存取受损,阿尔茨海默病则是库藏和存取两者均受损。

2013年,英国约克大学心理学家杰弗瑞斯(E.Jefferies)综述其研究团队的五年研究成果(Jefferies,2013)。该研究结合行为学评估、功能性磁共振检测和经颅磁刺激,对语义失语、语义痴呆和健康对照者进行分析,在人脑中找到分别掌管语义表征和语义控制的神经基础。前者位于颞叶前部,是一个可以整合多模态语义信息的非模态中枢。当这个部位受损时会发生语义痴呆。虽然患者的情景记忆、视听信号处理和决策能力得以保留,但却在视、听、嗅和触等各模块的语义任务中都受损。后者分布在左侧额下回、颞中回后部和顶叶下回等部位,属于多模态语义信息处理中枢,其受损则表现为语义失语。这些神经影像学证据提示,失语症患者相对保留完好的语义表征,有助于利用语义任务实施训练,恢复语言使用能力。但同时也提示,选用语义任务时需要模拟正常的语义存取形式,而语义特征提取机制的神经影像学研究为此提供了依据。

2012年,美国加利福尼亚大学的神经学家胡斯(A.G.Huth)等(Huth et al., 2012)参照WordNet同义词集,对一段录像中的每秒画面进行成分分析。从中人工甄别出1364个成分(对象或动作),并增加341个上位概念。例如,在同一画面中先甄别<狗>,随之增加<犬类>。由此共得到1705个成分,作为该录像中出现的语义特征。胡斯等让5名受试者观看录像,同时检测功能性磁共振,共采集120分钟数据。由此,一个皮质位点就有了1705个语义特征的120分钟时间序列数据。通过回归分析就可以得知在整个观看录像期间,某个语义特征对该皮质位点是否有显著激活或抑制。当这种计算覆盖整个大脑皮质时,就获得了全脑语义特征分布图。结果显示,语义特征的脑内分布具有聚集性、连续性和离散性。聚集性表现为语义特征在宏观上可以聚集为语义范畴。胡斯等发现五种范畴划分:①可动(人、动物和交通工具)与不可动、②社会(人和交流动词)与非社会、③文明(人、人造物和交通工具)与自然(动物)、④生物(人、动物、植物、身体局部、植物局部)与非生物、⑤动物(人、动物)与非动物。连续性表现为,分布在局部脑皮质上的语义特征不存在截然的边界划分,而是平滑过渡。离散性表现为,同一个语义特征并不是激活单个特定脑区,而是散在激活多个皮质部位,同时还会对另外一些部位造成抑制。该研究支持语义处理存在范畴差异的观点。虽然无法把语义特征定位到特定脑区,但是发现当共享某些语义特征的不同概念出现时,会激发相似的脑区活动模式。这也提示可以在语义特征基础上设计语义任务,预测甚至干预脑功能活动。

2008年,卡内基梅隆大学的计算机学家米切尔(T.M.Mitchell)与脑影像学家和语言学家合作,首次报道借助词汇语义特征预测人脑对名词词义的脑功能影像活动(Mitchell et al., 2008)。该研究人工选取3类共25个义征词来描述语义特征,分别是感觉类(fear, hear, listen, see, smell, taste和touch)、运动类(eat, lift, manipulate, move, push, rub, run和say)和抽象类(approach, break, clean, drive, enter, fill, near, open, ride和wear)。另外,选取12类共60个具体概念,配上简笔画和相应名词,作为磁共振检测时的刺激源。对于每个刺激词,从谷歌语料库中提取每个义征词与该刺激词的共现次数,由此用25个数值来构建该刺激词的义征表达式,即为刺激词建立语义表征模型。以“图+词”方式呈现概念,给受试者3秒钟时间思考每个概念的意义,同时采集功能性磁共振数据。研究者假设,刺激词的义征表达式决定着大脑对该名词的反应程度。通过把60个名词的义征集与其相应的功能性磁共振数据进行比较,可以计算出每个义征对大脑的哪些部位有多大的功能活动贡献,从而建立预测模型。任何一个具体概念,只要知道了它的义征表达式,就可以借助模型来预测它对脑功能活动的影响。反之,可以借助功能活动数据来推算概念的义征表达式,并推测两个概念是否同类。2011年,张凯闵(K.M.Chang)等(Chang, Mitchell,&Just,2011)从米切尔等(Mitchell et al., 2008)使用的60个概念中,找出43个收录于克里和麦克雷义征库的概念(Cree&McRae,2003),证明如果使用该义征库构建这些概念的义征表达式,也同样可以起到上述预测脑功能活动、推测义征表达式和判断概念类别的作用。2013年,佩雷拉(F.Pereira)等又报道可以采用主题模型从维基百科文档中提取义征表达式,用于构建模型预测脑功能活动(Pereira, Botvinick,&Detre,2013)。从这些研究可以发现,“概念-义征-脑功能活动”的基本关系已经牢固地扎根于此类研究范式之中。

从以上词汇语义的认知研究可以发现,无论是范畴损伤问题研究,还是表征与控制研究,或者是脑功能机制探索,都基于语义特征开展语义分析。神经心理学和神经语言学围绕认知问题进行的义征探索,已经为推动医学方面的言语治疗研究提供了理论与实验依据。但是,无论是神经机制研究的发展,还是言语治疗方法的进步,在使用语义特征分析作为操作工具时,都需要开发相应的义征数据库,并制订合理的语义特征选取和编排策略。随之而来的问题是,怎么获取语义特征数据?怎么分析?怎么选材?又要怎么编排?