第二节 频率对词感的制约
一 研究背景
“词”是汉语的一级重要语法单位,过去,在“离散”语法观的指导下,人们重视词与短语之间的差异而忽略了二者之间的连续性。随着功能语法、认知语法研究的深入,在重视“离散”的同时,“连续统”的观念也已确立。随着观念的转变,人们对词与短语的划界问题也有了新的认识:静态地看,典型的词与典型的短语都是明确的,而词与短语的交界处则是模糊的;[8]动态地看,短语与词之间存在着一种演变关系,短语是词的一个重要来源,人为地切断这种联系不利于对词以及构词背景的认识。同时,语言应用研究的发展,如辞书和教材的收词、中文信息处理的分词等,都要求把词和短语区分开来,甚至要求把词全部枚举出来,这样一来,运用“连续统”的观念对词与短语的区分给予理论上的说明已不能满足应用研究的需要。今天,语言学的学术发展,语言学之外的新的理论和方法,统计工具的应用以及大量的实践活动,如辞书标注词性、语料库分词等,都形成了各自的对“词”的认识。在这些新进展的基础上,有条件也有能力在新的层面上对什么是现代汉语的“词”进行重新的理论探索。
二 频率与词感
结构紧密、意义融合、音节适中是现代汉语的“典型”的词的特征,为人们的词感差异作出了语言学上的解释。但是,在运用这些标准去判定一个语言单位是不是词时,常常会遇到一些无法解释的词感差异现象。如:
1.按照上述标准都不是词的,词感却有明显差异。
如“羊肉”和“马肉”,均可插入“的”,意义都是字面性的,同为双音节。按照上面的标准,它们的词感应该一致。鉴于二者在结构、意义上不符合典型的词的特征,均应处理为短语。但是实际上,“羊肉”的词感高,“马肉”的词感低。同类的又如:猪肉、牛肉、鸡肉、兔肉、鹿肉、鸟肉、鼠肉等。不难看出,更为常见的“猪肉”“牛肉”“鸡肉”“兔肉”等的词感更高。
2.按照上述标准不应该是词的,词感反而较高。
这种情况集中在双音节单位上,名词性的突出表现在定中式上,如:鸡蛋、布鞋、白云、蓝天、小鸟、皮包;动词性的突出表现在动宾式上,如:唱歌、说话、读书、办事。
这些单位均可以扩展,名词性的中间可以插入“的”,如:“鸡的蛋”、“布的鞋”等;动词性的扩展形式更为丰富,如:“唱完歌”、“说两句话”等。它们的意义均是字面性的。这些单位只在长度上符合典型的词的要求,按照上面的标准应该处理为短语。但是实际上,对于大众而言,它们都有着较高的词感。显然,“鸡蛋”“唱歌”等像词,常见是其中的一个关键原因。
3.按照上述标准倾向于是词的,词感反而较低。
部分意义是字面性的双音节单位因各种原因不能扩展,从结构上看,倾向于是词,但是实际词感不一定如此。
如含有后缀而不能扩展的单位,以“~者”为例:谈者、编者、读者、患者、死者、送者、听者、玩者、退者、问者、闻者、舞者、议者、译者、引者、饮者、见者、教者、看者、买者、卖者、拍者、判者、跑者、聘者、织者、住者、租者、坐者……
如含有非独用语素而不能扩展的单位,以含有非独用语素“声”的“~声”为例:悲声、鞭声、蝉声、长声、唱声、潮声、吵声、车声、槌声、粗声、脆声、答声、笛声、怪声、歌声、喊声、鸡声、桨声、娇声、叫声、巨声、咳声、哭声、浪声、雷声、骂声、闷声……[9]
如因扩展后意义发生显著改变而不能扩展的单位,以“神~”为例:神刀、神鞭、神兵、神丹、神灯、神风、神峰、神鼓、神光、神剑、神箭、神龙、神牛、神枪、神兽、神树、神水、神童、神物、神眼、神药、神医、神鹰、神掌、神针、神钟……[10]
这些“神~”中的“神”都是“神奇”义,如扩展为“神的~”,“神”有可能变为“神仙”义,试比较“神刀——神的刀”。因此,这些“神~”均不能扩展。
上述“~者”“~声”“神~”均不能扩展,意义都是字面性的,同为双音节。按照上面的标准,它们的词感应该一致,考虑到结构上的非扩展性,均应倾向于处理为词。但是,上述“~者”中各单位的实际词感并不一致:“编者”“读者”“患者”“死者”等词感较高,其余词感较低或很低;“~声”中各单位的词感均不高;“神~”中各单位的词感不一致:绝大多数词感很低,少数词感较高,如:神童、神医。不难看出,凡是临时造成的或者不常见的单位,词感就低,只有那些常见的才具有较高的词感。[11]
由上述三种情况可以看出,结构、意义、音长不足以解释上述语言单位的词感差异问题。这些语言单位都不是典型的“词”,它们的意义均为字面性的,结构上或者可以扩展、或者不能扩展,音节都是双音节。可见,对于词与短语的中间状态来说,频率对词感的制约就显现了出来。
三 频率与“词”
(一)频率是词化的重要动力
从词的产生看,频率是词化的重要动力。频率对词化的影响来源于交际的需要,反映了人们的社会生活和语言实践。词与短语之间存在着不同类型的中间状态,频率是决定这些中间状态能否转化为词的一个重要因素。频率对词化的影响,至少表现在以下三个方面:
首先,对于意义是字面性的中间状态来说,频率是制约它们词感高低的重要因素。
“羊肉”像词,“马肉”不像词,“鸡蛋”像词,“鸟蛋”不像词,等等,都说明了频率对词感的影响。频率对词化的影响还可以在韵律上找到证据。彭泽润(2006)论证了“词调模式化”是区分词与非词的一个标志,是汉语“词”意识的突出表现,并指出“口语中常用的词或者词化的词组都有可能率先采用模式化词调”。[12]由此可见,“常用”这一频率因素促使语言单位实现了韵律上的整体化,即从韵律上看,已经是一个整体。显然,高频是促成这些单位韵律词化的重要动力。
其次,对于意义是非字面性的中间状态来说,频率对它们的词感也有重要的影响。
一般而言,当一个双音节单位固定地具有某种非字面性的意义时,也就取得了词的身份。[13]但是,如果这个双音节单位还没有得到绝大多数人的认可,即在使用范围和使用频率上还受到了较大的限制,那么,其“词”的身份仍难以得到承认。试比较“你们”和“您们”,“们”的意义有所虚化,“你们”和“您们”都是意义非完全透明的双音节单位,从结构、意义、音长上看,如果“你们”是词,“您们”也应该是词。但是,实际上,更多的人认可“你们”是词,而“您们”是不是词还见仁见智。究其原因,莫过于“您们”还不大常用,还没在人们的心目中扎根、定型。[14]可见,一个新“词”产生之后,即使其意义是非字面性的,也并不意味着就同时取得了“词”的地位。言语层面的“词”要想转化为语言层面的“词”,频率是一个重要条件。以往研究中所提到的“临时词”“偶发词”“生造词”等,其“词”的身份不稳固,频率是其中一个重要因素。
第三,频率是短语词化的一个重要动力。
在现代汉语中,短语是词的一个重要来源,而频率是短语词化的一个重要动力。为了便于交际,使用频繁的短语会在形式上进一步压缩,并且频率的高低与压缩程度之间有一定的相关性。试比较“非典型性肺炎”与“磁悬浮列车”,二者的使用频率都曾在一段时期内迅速攀升,不过,前者的使用频率更高,高频使用状态持续的时间更长。在此期间,它们的长音节形式给人们的交际带来了不便,压缩形式“非典”“磁浮列车”自然产生,前者已经是一个词的形式,后者仍是短语形式。可以设想,如果“磁浮列车”这种事物在中国能像铁路一样普及,其形式定会进一步压缩。频率反映的是人们的社会生活和语言经验,因此,频率对词的形成的制约,是社会生活和语言经验制约语言结构的一种表现,它根源于交际的需要,折射出了社会与文化的背景。
(二)频率与词的认知
语言具有类推性,但是由类推产生的一系列单位未必具有同等的词的身份。语言是认知的产物,具有类推关系的一组单位,从逻辑上看,应该具有同等的词或者短语的地位,但是实际上,它们的身份要受到它们所表示的概念在人们的认知心理中的地位的制约。频率是表征认知地位的一个指标,频率越高说明认知地位越显著。这可以通过以下两组词语的对比看出。
首先看第一组“~类”:
(1)自由语素+类:人类、酒类、奶类、鸟类、肉类、蛇类、球类、鞋类、盐类、鱼类、草类、虫类、糖类、菜类、油类;
(2)非自由语素+类:豆类、谷类、藻类、蕨类、菌类、禽类、犬类、乳类、兽类、鼠类、薯类、畜类、猿类、匪类、果类、猴类。
“~类”具有类推造词、造语的功能,上述(1)是自由语素与“类”的组合,(2)是非自由语素与“类”的组合。显然,(2)组单位并不比(1)组单位更像词。这两组单位具有类推联系,但它们并不因为这种类推联系而拥有相同的词感。这些单位中,“人类”的词感最高。
“人类”最有资格成为一个词,是因为它所表达的概念与人们的联系最密切。在思维活动中,人们经常会想及“人类”这个概念,表现在言语活动中,人们经常会用到“人类”这个语言单位。虽然在生物学的科学分类体系中,“人类”与“鸟类”“蛇类”“鱼类”“犬类”等具有大致等同的等级地位,但是在人们的认知分类体系中,“人类”的地位更凸显。认知地位对语言单位的级别有重要的调节作用,认知地位越凸显,词的特征就越显著,反之,短语的特征就越明显。语言具有类推性,但是,具有类推联系的一组单位所表达的概念与人们的联系的紧密程度并不具有类推性,它们在人类认知体系中的地位也不具有类推性,所以,它们的身份也不具有类推性。
再看第二组:
(1)功能+“桌”:书桌、饭桌、茶桌、牌桌;
(2)“船”+部件:船舱、船帆、船桨、船壳。
(1)从形式上看是“名词性自由语素+桌”,从语义上看,名词性自由语素均表示“桌子”的功能属性:“书桌”“饭桌”等均是“桌子”的下位概念。(2)从形式上看是“船+名词性自由语素”,从语义上看,名词性自由语素均表示“船”的不同部件:“船舱”“船帆”等均是“船”的构成部分。
(1)组单位均不能插入“的”,要想插入须添加其他成分,如:
书桌——*书的桌——看书的桌子 饭桌——*饭的桌——吃饭的桌子
茶桌——*茶的桌——喝茶的桌子 牌桌——*牌的桌——打牌的桌子
这些单位意义都是字面性的,同为双音节。可见,(1)组单位在结构、意义、音长上表现一致。但是,它们的词感并不匀质:“书桌”“饭桌”比“茶桌”“牌桌”更像词。
“桌子”这种事物具有多方面的用途,如可以用来看书、吃饭、喝茶、打牌等,并因此形成了一系列“桌子”的下位概念。这些下位概念所表达的事物与人们的联系的紧密程度不尽相同:在人类与“桌子”的互动活动中,后者主要是用来“吃饭”“看书”的,“喝茶”“打牌”是次要功能。与人们联系紧密的事物,认知地位更凸显。“桌子”表示基本层次范畴,是一个词毫无疑问。但是,“桌子”的诸多下位概念并不因为它们都是“桌子”的下位概念而在是词抑或短语方面也是一致的,它们的身份要受到其所表达的概念的常见程度的制约,受到人们的认知心理的调节,表现重要属性的单位比表现次要属性的单位更有资格成为词。有时,这种属性认知的差异还有可能打破音长对词感的一般限制,如三音节的“电脑桌”“办公桌”,就词感而言可能并不低于双音节的“茶桌”“牌桌”。而当事物所具有的某种属性不仅是次要的,而且是临时性的用途的话,那么,在语言形式上,就不再能以一个类似于词的面貌出现,而只能以短语的面貌出现,如“喝汤的桌子”不能说成“汤桌”。
(2)组单位均可插入“的”,如:
船舱——船的舱 船帆——船的帆
船桨——船的桨 船壳——船的壳
这些单位意义都是字面性的,同为双音节。就结构、意义、音节而言,它们表现一致。但是,它们的词感并不匀质,大致有这样的排序:船舱>船桨、船帆>船壳。
“船”表示基本层次范畴,是一个词毫无疑问。但是表示“船”的诸多构成部件的语言单位并不因为它们都表示“船”的构成部件而在词或短语的身份上也是一致的。人们在认知“船”这个事物时,有些部件在人们心目中比较重要,如:船舱、船桨、船帆;有些部件则不那么重要,如:船壳。为人们所熟知的、认知地位重要的构成部件更有望成为词,这也正是“船舱”“船桨”等词感不均的原因。
综上所述,对于意义不凝聚的语言单位来说,它们在结构、意义、音节上的一致性,并不能确保它们具有同等的词的资格,它们在语义场中的同等地位,也不能确保它们具有同等的词的资格。语言单位越常见,认知地位就越显著;认知地位越显著,词的身份就越明确。可见,用频率解释词感具有认知心理的依据,可以解决具有类推联系的语言单位的词感不平衡问题,可以解决具有同等逻辑分类地位的语言单位的词感不平衡问题。
(三)频率与词的感知
语言的理解是一个信息加工的过程,在这一过程中,语言单位的使用频率会在很大程度上制约着人们对语言单位的感知方式。由认知心理学的研究可知,高频语言单位的认知阈限低,很容易激活,低频语言单位的认知阈限高,若想激活需要更多的时间和信息。由此可以推断,对于熟悉的单位,人们一般不会再去通过分析它的构成成分而获知它的意义,而对于不熟悉的单位,人们在获取它的意义时往往还要分析它的构成成分的意义。如“抵制”和“抵拒”,前者很常见,后者较少见,人们在理解“抵制”时,除非是专业的词汇分析,一般不会再经历分析“抵”和“制”的意义这个过程。而对于“抵拒”,由于它很少见,人们在遇到它时极有可能通过分析它的构成成分来获知它的意义。即:高频可以增加语言单位的意义感知的完整性,削弱语义的分析过程。
如前所述,词与自由短语在意义上的区别是:词的意义是非字面性的,自由短语的意义是字面性的。但是,有一些很典型的词,意义近乎是字面性的。如“坚强”,“坚”是“坚定”,“强”是“刚强”,“坚强”的内部结构关系是联合,所以其字面义为“坚定刚强”,这也基本上反映了“坚强”的词义。[15]但是,其近乎字面性的意义并不能阻止人们把“坚强”看作一个词。事实上,“坚强”是一个很典型的词。如果说“坚强”具有较高的词感是因为含有非自由语素“坚”,不如说是因为“坚强”的高频使用决定了人们对它的感知方式:整体感知。即:虽然“坚强”的词义是透明的,可以进行内部解析,但是由于它很常见,人们在使用、理解它时已无需分析其内部构成而是直接把它当作一个整体来处理。高频单位倾向于整体感知,低频单位倾向于组合感知。整体感知,构成成分之间的意义融合度必然就高,组合感知,构成成分之间的意义融合度必然就低。意义的融合度是影响词感的一个重要因素,在意义的感知方式上,词倾向于是整体感知,自由短语倾向于是组合感知。所以,高频有助于提升词感就不难理解了。
四 频率的动态性
由结构、意义、音长所确定的词化连续统不能完全解决词与短语的划界问题,连续统与频率相结合,在词与短语区分的静态标准中纳入频率这个动态指标,将有助于更好地解决词与短语的中间状态。频率是一个“量”的标准。用频率来辅助确定中间状态的身份,反映的是语言生活的真实发展状态,把握的是语言发展的未来方向和面貌,是运用语言发展观来解决词与短语的划界问题。它将从“量”的角度裁定言语层面的“词”与语言层面的“词”的不同与转化,从“量”的角度揭示言语到语言的转变,符合语言发展的规律。特别是当语言应用研究要求把词全部枚举出来的时候,频率将为此提供技术支持。
用频率辅助解决词与短语的划界问题,提倡词与短语识别的“动态观”。频率本身是动态的。客观上,高频与低频之间没有一个说一不二的界限,频率差异同样是渐变的。用频率区分词和短语,是遵循词化规律在必须作出区分时所采用的一个技术手段,带有一定的人为性。同时,语言单位的频率也不是静止不变的。有些单位在某段时间内频率很高,后来就销声匿迹了。这种单位可以成为流行词、历史词,但不是现时语言系统中的词。用频率区分词和短语,其结果不是凝滞不变的。随着语言生活的改变,有些单位可以由非词变为词,有些单位也可以从现时的词库中隐退。
五 小结
本节以功能和认知语法为背景,以词与短语的划分为目的,探讨频率与“词”之间的关系。由分析可知,人们的词感存在着明显的频率效应,频率是词化的重要动力,频率对词感的制约具有认知心理与语言理解上的依据。这为运用频率标准区分词和短语提供了理论支持。运用频率区分词和短语,提倡词与短语识别的“动态观”。连续统与频率相结合将有助于解决词与短语的划界问题,有助于更好地服务于语言应用研究的需要。