第二节 词库和词法的范围
对于哪些词汇单位应该列在词库中,哪些不用列在词库中,不同的学者给出了不尽相同的回答(参看Carstairs-McCarthy 1992)。
Bloomfield(1933)将词库看做是语法的附录,是一些不规则体的列表,语素是列入词库中的,另外词库也包括一些在功能上具有不规则性的复杂的形式。不过,Bloomfield作为一个结构主义语言学家,对于词库这种不规则单位的集合没有多大兴趣,因此对于词库没有深入研究。
Chomsky(1965)开始对词库成员进行了比较系统的分析,对词库成员的结构与组织提出了一套观点。词库中的词汇项目都具有句法、语义和语音信息。句法信息包括语类(category)信息(即属于名词还是动词等)、次语类(subcategory)信息(如名词中的专有名词、动词中的不及物动词等)以及选择限制(selection restriction,即词汇单位在句法组合中选择其搭配成分时要受到的制约)。词库通过词汇插入(lexical insertion)这一个环节与句法部分相联系(词汇插入是发生在深层结构里,在短语结构规则运行之后进行的)。Chomsky(1965)的词库中的成员主要是词。Chomsky将固定语和短语动词看做单一的词汇成员,但是这与他关于词库的整体理论(尤其是其中的词汇插入)有冲突,因为有些固定语和短语动词必须插入在非终端的节点下而词则是插入在终端节点下的,而且有些固定语还可以插入在非连续的节点之下。对此,Chomsky没有提出解决方案。值得指出的是,Chomsky的研究重点是在句法,词库的研究也是为了解决句法运转的问题,而不是独立的一个部分。在最简方案之前,Chomsky将屈折形式的生成放到句法中。正如Aronoff(1988)所指出的,在很多生成语法的著作中,词库被默认为是主要词汇范畴集合的成员(members of ma-jor lexical category),或者说是开放词类的成员,而不包括功能性词类的成员(转引自Anderson 1992)。lexical作为形容词就主要指的是实词性的。不过,到了最简方案阶段,屈折形式也被移入到词库中,词从词库中出来时就已带有所有的屈折词缀,句法是对屈折形式所携带的特征进行核查。
Halle(1973)不是将词库看做一个单一的清单,而将词库看做包含三个清单:(1)语素的清单,包括不可分析的词根和词缀。(2)词典(dic-tionary),包含语言中所有实际出现的词。(3)过滤器(filter),包含:A.可能的但是实际不出现的词,这些词带有[-词汇插入]([-Lexical In-sertion])的标记,即不能实施词汇插入的规则;B.意义不能从组合成分和构词规则中推导出来的词;C.语音上具有特异性的词。过滤器中包括了在某些方面存在特异性的复杂的词。这样一个三分的词库看起来比较复杂,而且语素部分与词典部分有相当的重复。于是后来的学者们试图将其简化。
Jackendoff(1975)提出了只包含词的单一词库。词缀不列在词库中,词缀并不单独出现,其意义在反映其出现环境的词汇羡余规则(lexical re-dundancy rules)中得以表现,所以无需一一列出。Jackendoff的词库改造了Bloomfield(1933)的观点:在收录不规则的词汇单位的同时,也容纳了一些词法和语义的规则在内。
Aronoff(1976)也主张词库中只收录词,不收录词缀。与Jackendoff(1975)的不同在于是不是列出全部的词。Jackendoff(1975)认为所有实际出现的词都要列入词库,不管它们的构成是规则的还是不规则的,不管它们的意义是透明的还是特异的。但是Aronoff仅列出那些至少在某个特征上具有任意性的词。Aronoff还严格区分了活着的构词过程与已经死了的构词过程,前者还能够创造新词,而后者则已不能。比如英文中构成名词的后缀-ness就仍具有能产性,于是就可以放入词法规则中处理,而构成名词的后缀-th已经完全丧失了能产性,不再能够构造新词。由死了的构词法所构造的词就应该一一列入词库。实际上,Quirk et al.(1972)关于英语的语法著作中就已提到了死了的构词法与活跃着的构词法的区分,Aronoff更为强调这种区分。
Beard(1995)提出的“基于词位-语素的词法”模型(Lexeme-Mor-pheme Base Morphology)中,严格区分开放性的实词性语素与封闭性的语法性语素,认为只有前者才储存在词库中,后者由词法来处理。语法包括四个自主模块:句法、词库、词法、语音。词法是与词库并列的一个独立模块。
Lieber(1981)提出的词库中包含所有不能分析的词汇成分,也称为词汇终端成分(lexical terminal elements),这基本上对应于传统意义上的语素(包括词根和词缀)。
Di Sciullo&Williams(1987)认为列入词库中的项目不一定和词联系在一起。与Aronoff(1976)一样,他们强调将一个项目列入词库的主要标准是任意性和不可预测性:“词库就像一个监狱,装的是那些不合法者。”[19]并不是只有词才具有任意性和不可预测性的特点,语素和短语甚至少量句子都具有这一特征,因此也都是词库中的成员。
到现在为止,词库的成员及结构还是一个可以继续讨论的问题。我们认为一个语言中的词库包括哪些内容,应该与该语言词法包括哪些内容相联系,因此词库的内部构成是可以有语言差异的。
根据汉语词法的特点,我们假设汉语中的词库应包括词、一些在构词过程中活跃的语素和一些习语。那些在构词中不活跃的词根语素不在词库中单独列出,只呈现在由其构成的词中,这样对词汇知识的表征可以做到更为经济。在词库成员的范围方面,我们的词库与Di Sciullo&Williams(1987)的词库相似。在我们的词库中,并不收录所有实际出现的词,而只收录具有特异性和意义不可预测性的词,也包括一些虽然内部形式透明但使用频率很高的词。我们也同意Aronoff(1976)区分活着的构词法和已经丧失了能产性的死去了的构词法的主张,将由前者所构成的词交由词法处理,而将由后者所构成的词全部列入词库。
词法关注的内容主要有以下几个方面:
(1)语素及其分类。
(2)复杂的词的类型和内部结构,主要研究的有派生词、屈折形式和复合词三类。
(3)对词法模式的研究,包括词法模式的形式构成及所表达的意义以及能产性的问题等。
(4)一些特殊的词法过程,如重叠、变音等。
(5)词法与语言的其他层面之间的关系,包括词法与句法、词法与语音、词法与词汇语义、词法与语用等之间的关系。这些都涉及界面(inter-face)性质的研究。
(6)词法的历时方面,比如词缀和词法规则的形成与变化。
以上这些问题,在本书的研究中都有或多或少的涉及。
在研究词法时,应该注意区分词法现象、词汇现象和句法现象。词汇现象不具有规律性,词法现象和句法现象都有规律,只是词法现象受词法规则的控制,而句法现象受句法规则的控制。表面上看起来类似的现象,有可能性质不同,需要仔细辨别。
比如汉语的重叠现象,有些是属于词法的(morphological),有些是属于词汇的(lexical),有些则是属于句法的(syntactic)。
词法重叠具有以下的性质:重叠的基式是词,按照固定的模式重叠,表达一定的词法意义。包括:(1)性质形容词重叠,如“弯弯、高高兴兴”等,重叠的基式可以是单音词或双音词,按照AA式或AABB式重叠,表达减量(AA式)或增量(AABB式)的词法意义。(2)动词重叠,如“看看、研究研究”等,按照AA式或ABAB式重叠,表达短时、轻松、随意等意义。(3)名词重叠,如“天天、书书、山山、瓶瓶罐罐”等,按照AA式或AABB式重叠,表示周遍或多量等意义。方位词重叠从大类上可以归入名词重叠,也是表示周遍,如“上上下下”。(4)量词重叠,如“个个、件件”等,按照AA式重叠,也是表示周遍含义。
词汇重叠具有以下性质:重叠的基式不是词或者虽然是词但重叠后的意义与重叠前基本没有差别,不具有规则性,需要以清单方式记忆。包括以下现象:(1)重叠语素,如“猩猩、狒狒、往往”等,重叠的基式不是词,重叠前不具有意义,重叠以后才有了意义,或重叠前意义与重叠后意义没有关联,需要整体加以记忆。还有一些重叠式词缀或重叠式构词成分也属于这一类,重叠式词缀可以参与构成一系列词,如“乎乎”,可以构成“胖乎乎、傻乎乎、黑乎乎”等,但其自身只是在重叠后才具有了这样的意义,因此是一个重叠语素;重叠式的构词成分不具有能产性,只能和特定的成分搭配后成词,如“澄澄”一般只与“黄”搭配构成“黄澄澄”,“澄澄”在重叠前的意义与重叠后无关,也是一个重叠语素,需要整体记忆。(2)重叠式词汇词,如“星星、爸爸、妈妈、姐姐、弟弟”等,基式是名词,重叠以后与重叠前的语义基本相同,可以说形成了原来单音词的重叠式双音词变体;再如“常常、渐渐”等,重叠的基式是副词,重叠以后与重叠前的语义也基本相同。这些重叠式双音词数量不多,找不出非常明确的出现条件,需要放入词库,属于词汇词。
句法重叠的性质是:基式是词,重叠实际是句法中的并列操作的结果,重叠的次数无限制,经常可以达到三次或四次,通过并列反复表达的句法意义是强调。比如程度副词可以形成句法重叠:“非常非常非常(漂亮)、最最最最(特殊)”,用以表达对程度的强调,带有主观性,重叠的次数可以随着说话人的感情态度而定[20]。再如拟声词的重叠,也具有句法性,实际上是一种同义并列,重叠次数也没有限制,如“哗哗、哗哗哗、哗哗哗哗、咚咚、咚咚咚、咚咚咚咚”。
类似的,表面相同的现象可能有些是由词法控制的,而有些是由词汇控制的,这也需要区分。
比如,有些轻声是词法控制的,动词重叠的后一音节一般读轻声:“看看、听听、走走、打扫打扫、研究研究”等,这是与词法相关的轻声。不是所有的重叠的后一音节都轻声,形容词重叠和名词重叠的后字都不轻声,只有动词重叠这一特定的词法模式才带来轻声。另外有一类轻声是词汇控制的,出现在一些常用的双音词上,如“衣裳、东西、暖和、姥爷”等。
再如,有些变调是词法控制的,北京话口语中形容词AABB式里的BB变阴平,如“结结实实、慢慢腾腾、磨磨蹭蹭”等,这种变调就是与特定的词法模式相关联的,对比同是AABB式的名词或动词,如“瓶瓶罐罐、边边角角、汤汤水水、打打闹闹、走走停停、说说笑笑、蹦蹦跳跳”等,这些形式中的BB就不发生变调。这说明AABB式形容词中的变调不是仅由AABB这一形式诱发的,而是由构造形容词的特定词法模式诱发的。在一些北方方言中,双音形容词儿化后第二个音节变阴平,经常与“的”配合出现,如“痛快儿、老实儿、麻利儿、漂亮儿(的)、精神儿(的)、机灵儿(的)”等,在意义上大多是褒义的,这也是与词法相关的变调。另外一些变调则是词汇控制的,如“一、不、七、八”的变调,就只与这些特定的词汇形式相关,不可类推,需要逐一记忆。
综上所述,将词法现象与词汇现象、句法现象区分清楚是非常重要的,不少研究中所犯的错误就在于没有认清语言现象的性质,将这三类现象混淆了。
区分词库与词法的概念对于人用或机用的各类词典的编纂都具有指导作用。各类词典首先应该全面收录那些内部不可分析或内部构成模式不具有能产性的词汇性成分。对于那些由能产性较强的词法模式所造成的形式,就可以根据词典的规模和适用对象等作或多或少的收录。如果是供人使用的词典,由于母语者有可以利用的内化了的词法知识,即使是外语学习者也具有一定的概括推理能力,因此对由能产性词法模式所造成的具有规则形式的词就可以不收录或少收录一些,可以只对词法模式举例加以说明,而重点收录那些意义特异化,或使用频率较高的组合;而供计算机用的词典,由于计算机具有很大的储存能力,又由于机器缺乏人所有的一些概括能力,所以可以多收一些由能产性较强的词法模式生成的规则组合。对于那些由适用面较窄的词法规则所造成的意义透明的形式,由于其数量少,也可予以穷尽性地收录。比如,“初”与数字“一”到“十”的组合,虽然意义具有规则性,完全可以预测,但是由于其数量有限,只有十个,在容量大的词典中也可以一一列出。