
1.4 研究思路及方法
1.4.1 概念的界定和研究对象
1.4.1.1 概念的界定
1.4.1.1.1 词语搭配
在遵循国内外相关研究已达成的基本共识的基础上,综合考虑词语组合形式的多样性特点[1]、组合的内在机制、二语学习者词语组合的习得特点[2]以及二语教学的需要等因素,将词语搭配界定为“两个词在一个句子内按照一定的句法规则构成的、在语义和语用上为母语者普遍接受的词语组合关系”。
该界定只针对实词搭配,不包括语法搭配,主要强调四点。
第一,句法规则是构成搭配的先决条件。两个词的组合只有符合一定的句法规则,形成一定的句法结构(如主谓、动宾等),才算搭配。排除那些频繁共现但没有特定句法关系的词序列,如“老师在五层会议室开会”中的“会议室开会”不是搭配。另外,句法关系也是确定两个词构成的多个组合是否同属一个搭配的关键。如果两个核心词构成的多个组合属于同一句法关系,那么它们属于同一个搭配的不同形式,比如,“吃苹果”“吃了一个苹果”“吃了毒苹果”中,“吃”和“苹果”都是动宾关系,因此都是“吃+苹果”的搭配。如果两个核心词组成的多个组合属于不同句法关系,那么应该视为不同的搭配,例如,“他认识一个漂亮姑娘”中“漂亮”和“姑娘”是定中关系,“那个姑娘很漂亮”中“姑娘”和“漂亮”是主谓关系,因此这里的“漂亮姑娘”和“姑娘漂亮”,虽然构成成分相同,但属于不同的搭配。
第二,两个词构成的组合在语义和语用上都必须为母语者普遍接受。搭配除了必须符合一定的句法规则,在语义组合和语用特征上都必须符合母语者的习惯。有一方面不符合,就不是一个恰当的搭配。例如“得到疾病”“吩咐老师”,基本语义说得通,但语用特征上不符合汉语的习惯,母语者普遍不接受这样的搭配。另外,因语感差异,只有个别母语者可以接受的组合不算常规搭配。
第三,搭配的核心成分为两个词,区别于一般的短语。搭配本身在语言单位上讲是短语,但并非所有短语都是搭配。比如,“卖菜的”“美丽可爱的姑娘”“又白又胖”等都是短语,但不是我们这里所讲的词语搭配。其中,“卖菜的”这个短语中包含了一个搭配“卖菜”,“美丽可爱的姑娘”包含了“美丽的姑娘”“可爱的姑娘”两个搭配,“又白又胖”包含了“又……又……”的语法搭配和意义上并列的两个词语,不属于这里讲的词语搭配(即实词搭配)。
第四,搭配强调的是两个词语之间的联结关系,在实际文本中两个词不一定相邻。如“买了一件漂亮的衣服”“买了很多衣服”都是“买+衣服”这个“型”的不同文本实“例”(参考李斌,2011a)。因此,两个词常常既可以构成紧邻搭配,又可以构成离散搭配。无论构成紧邻搭配还是离散搭配,两个词一定在同一个句子中出现,跨句的共现关系不构成我们所讲的搭配。
1.4.1.1.2 习得难度
本研究的核心是通过考察影响搭配习得难度的因素及其作用机制来了解搭配知识的习得机制,因此首先要明确什么是习得难度。综观已有研究,除了专门的学习或习得难度研究,第二语言习得相关研究对习得难度也有诸多论述,但对习得难度的概念并没有明确的界定。最大的问题是没有区分学习难度和习得难度。国外相关研究大多用“学习难度”(learning difficulty)的概念,实际考察的内容既涉及学习难度,也涉及习得难度;国内多数学者使用“习得难度”的概念,还有一些学者交替使用“学习难度”和“习得难度”的概念。实际上,这是两个不同的概念。“学习”是指有意识地获得语言知识的过程,获得的是“显性语言知识”,而“习得”是指通过无意识或下意识的方式获得语言知识,习得的结果是获得“隐性语言知识”(王建勤,2009)。因此,学习难度只是获取“显性语言知识”的困难程度,而习得难度是将通过学习或其他渠道获得的知识内化为隐性语言知识的难易程度。另外,习得难度外显指标的界定和论证方面还几乎是空白。通俗地讲,就是没有指明习得难度具体体现在哪些方面,没有论证观测结果是否代表真正的习得难度。由于习得难度本身是一个无法直接、准确测量的变量,需要通过一些观测指标(observable indicators)去测量。在考察习得难度及其影响因素之前,首先必须明确哪些变量可以作为习得难度的观测指标,再通过考察相关因素对这些观测指标的影响,来确定这些因素是否可以准确预测到习得难度。
鉴于以上考虑,本研究将语言的习得难度界定为“将通过各种渠道获得的语言知识内化为隐性语言知识的困难程度”。一个语言项目的隐性知识越难获得,其习得难度越大。
据此,搭配的习得难度即指获得隐性搭配知识的困难程度。隐性搭配知识主要体现在理解性搭配知识和产出性搭配知识的获得方面。而获得隐性搭配知识的困难程度又体现在两个方面:一是获得时间的长短,通常需要时间越长的知识越难;二是可达到的深度,搭配知识的深度可以通过理解和产出来衡量。在相同学习时间内,如果一个搭配连达到理解的水平都很难,那么这个搭配的习得难度就非常大;如果一个搭配只能达到理解的水平,很难达到自由产出的水平,那么这个搭配的习得难度相对比较大;如果一个搭配可达到自由产出的水平,那么这个搭配的习得难度就相对比较小。因此,我们可以通过观察不同阶段搭配的理解和产出水平来观测搭配的习得难度,通过影响搭配理解和产出的因素间接预测搭配习得难度,从而深入了解搭配的内在习得机制。
1.4.1.2 研究范围
Benson(1985)、Benson et al.(1986b,1997)等根据组成成分之间的语法关系和整个组合的语法结构分出了语法搭配(grammatical collocations)和词汇搭配(lexical collocations)。语法搭配是指由一个主导词(a dominant word,如名词、动词、形容词等)与一个介词或语法结构(如不定式、从句)构成的组合,如“名词+介词”“形容词+介词”“名词+不定式”等(Benson et al.,1997);词汇搭配是指由名词、动词、形容词、副词等实词构成的组合,如“动词+名词”“形容词+名词”“名词+动词”等(Benson et al.,1997)。
本研究考察的是由实词组成的词语搭配,不包括介词等有虚词成分参与构成的语法搭配。另外,由于量词与名词、动词构成的搭配比较特殊,其相关限制因素与其他的实词搭配差异比较大,也暂不纳入当前的研究中。因此,我们将研究范围限定为名词(含代词)、动词、形容词、副词构成的搭配,参考张寿康和林杏光(1992)、李裕德(1998)的搭配框架,一共分出五种结构类型的搭配,如表1-1所示。
表1-1 搭配的结构类型
由于并列结构的构成成分关系主要强调意义上的并列结构关系的复杂性、语义选择限制等方面都不同于表1-1中所列的几种结构类型。相对于这些结构,并列结构的限制较少,学习者出错的概率也相对比较低,因此暂不将并列结构纳入本书的研究。
1.4.2 研究问题
(1)哪些是影响搭配习得的关键因素?这些因素之间是怎样的关系?
(2)各个因素如何在搭配知识体系的不同层面以及搭配习得和加工的不同阶段起作用?各个因素与搭配知识体系的关系机制是怎样的?
(3)如何通过这些影响因素预测搭配的习得难度?
1.4.3 研究思路
研究将结合已有本体研究的成果,通过语料分析和理解测试考察相关因素在搭配习得中的作用,并通过模型对各个因素的影响机制进行解释和探讨,从而深入挖掘搭配习得的机制。研究本着系统性原则,将所有因素放在与其他因素的关系网络中,考察其在整个搭配知识体系习得过程中的动态作用。一方面要尽可能地找出所有可能有影响的因素,以保证观察到的各个因素的作用是在整个关系网络中的相对作用,避免因脱离与其他因素的关系而作出片面的结论。另一方面要对其中起关键作用的因素进行深入考察和探讨,以便找到预测搭配习得难度的关键指标。因此,研究的各个部分将在尽量全面的基础上,分别有所侧重。具体分如下几个步骤。
第一,对搭配习得影响因素的研究成果和搭配的本体研究成果进行“元分析”式的归纳总结,探讨语际、语内和语外三个维度影响搭配习得的已知因素和未知的潜在因素,将归纳总结得到的影响因素作为考察的主要因素。
第二,通过对中介语语篇中的搭配进行穷尽式的描写和统计分析,考察上一步列出的因素在搭配产出中的影响,以及其他可能影响搭配习得的重要因素。首先随机抽取多个母语背景的中介语语篇(包括中级和高级水平的语篇)。然后从这些语篇中穷尽地提取主谓、动宾、定中、状中和中补结构搭配,包括所有正确的、不太地道的和偏误的搭配。最后根据要考察的因素进行分类统计和描写,观察各个因素在搭配产出中的表现。
第三,通过学习者主观评测和深层理解测试,考察各个因素对搭配理解的影响。由于考察的因素较多,因素间的关系比较复杂,且考察的搭配结构类型较多,很难采用“在线”的实验研究方法一一考察。而“离线”的测试具有可操作性强,受测试环境、时间等影响相对较小的优点,通过优质的测试题,能在有限的时间内,很方便地测很多方面,也能深入认知层面。因此,本研究暂时只采用“离线”的诱导性测试考察相关因素的影响。
第四,根据语料分析和测试所得结果,构建相应的模型,解释和探讨因素间的关系及其动态的影响机制。在此基础上进一步探讨搭配习得难度的预测指标和预测机制。
[1] 两个词的组合形式有多种可能,有些可以构成多种结构形式的搭配,有些必须相邻,有些可以插入其他修饰限定成分,有些词语之间的搭配则在其他修饰成分参与的情况下才成立。
[2] 在二语习得中,不同类型的词语组合都有不同程度的习得难度,并非只有限制性搭配在习得上有困难。从深层关系上讲,自由组合、固定组合等本质上都是词语组合关系,可以作为一类进行研究;从二语教学的角度讲,了解不同类型词语组合的习得规律和相关影响因素,对词汇及搭配教学都有重要的意义。