第三节 词
一 词位
什么是词?或许会有人认为我们这个问题问得过分幼稚,说词典里收入的就是词嘛。姑且不说一部词典收与不收哪些条目主要是因词典编者所设的标准而定,这一回答未能从根本上解决问题;就词典所收条目的实际情况看,这一回答也无法使人直接凭条目以判定词。有些词是词典所不收的,因为收不胜收,没有必要;没有一部词典敢宣称它将世间所有的词尽收,一无遗漏。有些为词典所收入的却又不见得是词的单位,有的是生造的单位,有的是大于词的单位,还有的可能是小于词的单位——词的构件。类型相同的各部词典的收词标准虽大同小异,但所收条目还是不尽相同的,这固然反映出各词典编者的收词理念不同,也在相当程度上说明了词确定的困难。因此,词的确定并不是一件轻而易举的工作。如果我们一定要为词下一个定义的话,所谓词就是一定历史平面上介乎于字(语素)和短语(包括固定短语、自由短语),有别于架构的一类词汇单位。这里所用的是排除法,即把非词的单位排除掉,所剩下的就是词的单位。排除法,说起来轻松,真正要用它从实际语言中来确定词,就不那么容易了。
说到此,似乎该为词位下一个定义式的说明了:所谓词位,是某种语言材料单位中可将其与其他成分区别开来的特定形式和意义的集合。“词位”的概念或源出于“音位”。就像音位是由若干音素构成的,义位由若干义素构成一样,词位就是由若干词构成的。当然,这若干词,不是风马牛不相干的一个个词,而是在形式上、意义上彼此有重要瓜葛和牵连的词的形体,彼此可成为一个特定的集合,它们中的任何一个都不可与之外的成分组合另外的这类特定集合。若干个这样的词的形体,就构成了一个词位。7谈词位,就要谈词位变体的问题。词位变体可从四个方面考虑:一是从词汇的角度考虑的变体,可称词汇变体。例如“仿佛”“彷彿”“髣髴”,就是同一词位从词汇角度滋生的三个变体。当然,如果再进一步细化,还可将词汇变体再细分为词形变体和语义变体两类,“仿佛”“彷彿”“髣髴”可视为词形变体,语义变体例如“管道”在大陆长期以来是“用金属或其他材料制成的管子,用来输送或排除流体”的意思,在台湾地区则主要是“途径”的意思。8二是从语音的角度考虑的变体,可称语音变体。例如“赵家庄”“赵各庄”,两个形体中的“家”“各”其实是中古音的变化所导致的不同写法,由“家”“各”的不同产生的“赵家庄”“赵各庄”两个变体,属于语音变体的问题。需要注意的是,历史上的一些语音变体,后来独立出去成了另外的词,就不再是变体了,例如“角落”和“旮旯”,“孔”和“窟窿”。三是从语法角度考虑的变体,可称为语法变体。例如“红”和“红红”,“漂亮”和“漂漂亮亮”,就都属于语法变体问题。四是从语用角度考虑的变体,可称为语用变体。例如“肥溜溜”一般指肉、菜等食物油水大、脂肪多,但在浩然的小说《金光大道》中却可以用以指生活水平之高,有“肥溜溜的小日子”的说法。后者的用法即属于语用变体。再如车“拉”的对象在大陆可以是无生命的物体,也可以是人。但是在台湾地区,则只能是无生命的物体,指人时,则只能是已失去生命的尸体。“拉”在台湾的用法,即属于语用变体。
二 词品、词感
词品就是语言使用者心目中对一个词的单位品相的优劣程度的评判结果。词品是语言使用者根据词感确定的:词感好的,词品高;词感差的,词品低。
词感是说一种语言(尤其是母语)的人对该语言的某个单位是否成词的接受度。比如汉语中的“通电话”,无词感;“通话”,则有词感。“通话”收入了《现汉》。英语的“blue book”汉译成“蓝皮书”而未译成“蓝色的书”。“蓝皮书”有词感,“蓝色的书”无词感。“蓝鸟”指日产汽车时,有词感,而若以“蓝色的鸟”指同样的事物对象时,则无词感。再如“大姑娘挽袖”所以会给《汉语词汇》的作者孙常叙先生以词感,那是因为它在东北方言中指的是一种豆角。实际生活中所存在的词是有目治、耳治之别的,也就是说存在着口词(听觉上的词)和目词(视觉上的词)的区别。口词,因为为广大的语言使用者所使用,予人较强的词感;而目词,只有在有较高文化水平的人的阅读的书面上使用,在写成文字的情况下,才容易理解,因此对大众来说词感稍弱。例如“状态不佳”“心情不佳”的“不佳”并非一个词,而只是一个短语,这从《现汉》未收取它为条可以为证。“佳”才是一个词。但是“佳”却绝不在人们口头出现和使用,不是个口词,而只能在书面上出现和使用,是个目词。再“失忆”,如果可以说是词的话,那大概只能说是目词,而非口词。“失忆”一词产生的时间虽已超过一二十年,最近用于电视剧《我的失忆男友》的剧名中,但也还是个目词。再如2011年5月5日《新快报》有一篇题为《25岁女驴友独行川藏失联20天 父亲昨赴四川寻女》的文字,其中的“失联”恐怕也是目词,而非口词。再如下面两段文字:
这具浸在棺液中的古尸是中国首次在长江以北发现的汉代湿尸,也是继湖南长沙马王堆汉墓、湖北荆州汉墓之后,中国又一次发现保存完好的汉代古尸。(《南京医学家尝试提取千年古尸DNA》,2008年10月9日《现代快报》)
切肝救儿,母子平安!肝源紧张仅1%患者有机会(2005年9月8日金羊网标题)
前一段文字中的“湿尸”和后一段文字中的“肝源”就不是口词,即不是嘴说口听能够使用的,而是写在纸上,用眼睛看才能看得懂的目词。词的这一区别(予人的词感的不同)也表明了词的确定(词位的确定)并非一件简单的事情。这个例子或许可以说明这样一个问题:由于双字词的作用,导致人们用入词的字反观未入词的字,从已入词的字的语素身份推导所有未入词甚或不入词的字(实际上这些字就是词——单字词)也成了语素,也就是把词给语素化了。再看下一段文字,“尸”本就是一个词,但由于它经常出现在“尸体、尸首”等双字词中,导致人们认定“尸”就是一个语素而忘记了或不再承认其词的身份,于是“女尸、男尸、童尸、腐尸、干尸”等被看成了词。有的组合被视为词,连带其他组合也有了被视为词的可能,例如随着出土的木乃伊日渐增多,“干尸”的曝光率也逐渐增大。“干尸”词感加大了,“湿尸”的词感也在增强。下面有一个例子:
据介绍,这是荆州第一次出土干尸,1975年,荆州凤凰山曾出土一具保存完好的男性“湿尸”。“一男一女,一湿一干,这是近年荆州文物最大的发现之一。”文物专家称,这具干尸具有较高的研究价值。(《湖北荆州出土完好女性干尸》,2009年4月29日《楚天都市报》)
当然,“湿尸”的词感目前还比不上“干尸”,这一点从“湿尸”需加引号而“干尸”无需加引号即可看出。但“湿”“尸”毕竟可以组合在一起成为“湿尸”,而无须组合为“湿的尸”或“湿的尸体”,说明它在向词过渡。而这种过渡恰恰是“干尸”起了重要的推动的作用。除上述诸“尸”,其他的“尸”能否也算作词呢?如“妪尸、翁尸、蛇尸、蝇尸、马尸、鹿尸”有无词的资格?据报载,湘西有所谓“赶尸”的习俗,这“赶尸”是否词呢?再如下例:
光绪回到北京之后,因为他这时候还是囚帝,所以那些小的太监也不是那么买账。(水银河《可能谋杀光绪的三大元凶》,2008年11月4日新浪博客)
其中的“囚帝”一词也不是口词,而是目词。由“囚”与他字组合构成的词语有“囚车、囚犯、囚禁、囚笼、囚首垢面、囚徒、囚衣、死囚”等,由“帝”与他字组合构成的词语有“帝都、帝国、帝京、帝君、帝王、帝制、帝子、皇帝、玉帝、玉皇大帝”等,这都是为《现汉》第5版收入的词语。而“囚帝”却是未为《现汉》收入的单位,其词的资格能否被承认下来呢?倘若回答是肯定的,那么接踵而来,“囚床、囚食、虐囚、脏囚、病囚”等,“帝弟、帝孙、幼帝、老帝”等,是否也可承认其词的身份呢?
当然,有些组合体之所以会被人视为目词,根本的原因还在于构成它们的那些字还很少组合在一起,该组合体也很少经常性地复呈于人们的眼前。一旦一些汉字经常性的组合在一起,一旦该组合体经常性的为人们使用,它们就不会是只能为人们看懂的目词,而会是也能为人们听懂的口词了。
无论一个单位是否为词典所收取,无论所造出的单位是口词还是目词,都反映了人们心智中的类推造词过程。如“动物名+肉”构成的词有“猪肉、牛肉、羊肉、狗肉、鸡肉、兔肉、鸭肉、鹅肉、马肉”等。这些词的造就,显然是先由与人关系最为密切的禽畜的名与“肉”相组合,造出“猪肉、牛肉、羊肉、狗肉、鸡肉”等,而后类推造出“兔肉、鸭肉、鹅肉、马肉、驴肉”等,甚至还会造出更多其他的词,如“蛇肉、虎肉、驼肉、鱼肉、鸟肉”等。“猪肉、牛肉、羊肉、狗肉、鸡肉”易为人们视作词,“兔肉、鸭肉、鹅肉、马肉、驴肉”也不好不承认它们是词,推而广之,“蛇肉、虎肉、驼肉、鱼肉、鸟肉”以及“火鸡肉、猴子肉、鲸鱼肉、松鼠肉、骡子肉”等似乎也无过硬理由不承认它们词的资格。人们可以以心理的接受度为由决定是否将它们中的一部分或全部收入自己所编的词典,或者为它们应否被收入自己心仪的词典找到理由或根据,即承认它们的词位,但是却没有确凿的理由将其一分为二,即将其中的一部分叫作词,承认其词位,将其中的另一部分视为非词,不承认其词位。或许我们可以得出一个直感,从“猪肉”等到“猫肉”等,口词的概率愈来愈低,目词的概率愈来愈高。
类推造词的情况,最明显的反映为前字不同、后字相同的双字组配上。也就是说后字确定,前字更改,组成新词。这样的词从结构上看,定—中偏正式的即属此类。从词的重心的角度看,这类词也可称之为后心结构的词。例子可举出很多,如:“军队的编制名+长”构成的“军长、师长、旅长、团长、营长、连长、排长、班长”,“树名+树”构成的“松树、杨树、柳树、榆树、柏树、铁树”,“地方名产等的名目+都”构成的“茶都(安溪)、雾都(重庆)、林都(伊春)、煤都(抚顺)、锡都(个旧)、镍都(金昌)、瓷都(景德镇)、风筝都(潍坊)”,“娱乐项目+友”构成的“酒友、烟友、牌友、棋友、钓友、网友、吟友、狱友、猎友”,“职业名+匠”构成的“木匠、瓦匠、铁匠、染匠、鞋匠、泥水匠、教书匠”,“植物名+农”构成的“粮农、菜农、棉农、果农、蚕农、茶农、花农、枣农、蔗农、蕉农、烟农、猪农、蒜农”,“职业名等+龄”构成的“工龄、军龄、学龄、驾龄、癌龄、航龄”,“行业或事务+客”构成的“游客、旅客、香客、房客、访客、食客、看客、浴客”,“自然界等的灾害名+灾”构成的“涝灾、火灾、雹灾、水灾、洪灾、冻灾、蝗灾、旱灾、风灾”,“地名+门”构成的“澳门、虎门、金门、津门、石门、潭门、天门、厦门、玉门”。当然,这其中也有因意义不同而有的不同组合情况。例如“具”因义项不同而分别为两类结构:“具1”是“工具”义,结构成的词如“钓具、磨具、刀具、文具、赌具、淫具”等,“具2”是“器具”义,结构成的词如“家具、炊具、道具、装具、酒具、茶具、餐具、烟具、卧具”等。在这种类推造词的过程中,一些字的意义得以具体化。例如“民”是与“人”在意义上具有同一性的字,后来逐渐生出某种职业、某一兴趣领域的意义,类推出“线民、股民、彩民、烟民”等。类推不仅可造出大量普通词,类推的造词方法亦可在专属词语上大显身手,当然这样造出的专属词语更存在着能否为词典收入和是否具有词的资格的问题,例如“机构的性质、职责名+办”构成的“招办、中办、经贸办、绿化办、纠风办、特首办、打假办、扫黄办”,“银行名+行”构成的“世行、人行、中行、农行、建行、交行、招行”(顺便说一句,港澳不是“银行名+行”的构词模式,而是“银行名+银”的构词模式,因此,“中国银行”不是略作“中行”而是略作“中银”,工商银行不是略作“工行”而是略作“工银”)。用同类结构造就的单位,未必就在词语使用者心目中有同样的词感。例如“物品+主”构成的“车主、船主、房主、机主、尸主”甚至“博主”,都有词感,但是“衣主、鞋主、袜主、表主、笔主”很难说有词感。类推造词的情况,也明显的反映在后字不同、前字相同的双字组配上。前字确定,后字更改,造出的词数量上虽远不及前者,但也有不少。这样的词,从结构上看支配格式、状—中偏正格式的都属此类。从词的重心的角度看,这类词也可称之为前心结构的词。例如“吃+食物”构成的“吃饭、吃菜、吃醋、吃刀、吃酒、吃茶、吃烟、吃水”,“打+被支配的对象”构成的“打人、打马、打枪、打水、打饭、打鼓、打字、打桩、打针、打药、打拳、打食、打胎、打钎、打气、打炮、打卦、打卡、打鼾、打黑、打夯、打工、打的、打更、打表、打场、打包、打靶、打苞、打车”。
汉语中,前心结构常用来作为短语的结构模式,后心结构才多用作词的结构模式。比较而言,前心结构的词的词感不如后心结构的词的词感更强。
三 词长
中国传统的学问——小学的术语系统中,只有“字”而没有“词”。字,就是书写时占用一个正方体空间位置的单位,说话时具有声韵调的一个组合体,根本不存在所谓“字长”的问题。自从语言学的概念中出现了“词”这个术语,便有了“词长”的纠葛。许多字,由于它们本就是独立自由运用的单位,跟学者为“词”所下的定义完全吻合,因而也就无法不承认它们是词,如“吃、说、门、肉、好、香、一、五”。但是“词”之所以成其为“词”,而且有了深入研究的必要,是因为大量非单字词的生成。理想的词究竟是由几个字组成的?词是否可以长度无限?即无论由多少个字构成的单位都是词?词的长度是否应该有个限制,即超出了一定限度便不再承认它是词?因为若不加限制,谚语、歌谣、诗句等,似乎都会与词相混淆了,而这显然是不适当的。
词无疑可以分别为典型的词和非典型的词。词的典型格式是双字组合,词的次典型格式是三字组合,个别的四字组合甚至五字组合,也可算作词的次典型格式。词的典型格式是双字组合、次典型格式主要是三字组合这一认识是以下列事实为根据的:清·翟灏《通俗编》可看作中国古代或至少是清代词语类工具书的代表。该书收条共计5,558个,9其中双字词汇单位有2,242个,约占40.34%,例如“风色、连襟、卖官、名纸”,三字词汇单位有696个,约占总数的12.52%,例如“打头风、挂龙雨、雪等伴、朝暮人”。两者相加有词2,938个,约占该书收条总数的52.86%。《近现代汉语新词词源词典》(汉语大词典出版社 2001)所收条目可看作19世纪末至20世纪初汉语词语的代表。该词典收条凡5,056个(该词典姚德怀序称收条5,275个,似有不确),其中双字词汇单位有2,567个,约占50.77%,例如“环球、季风、卵巢、视线”,三字词汇单位有1,690个,约占33.43%,例如“动滑轮、花条马、凝聚力、电压表”。两者相加有词4,257个,约占该书收条总数的84.20%。《现汉》1996年版可看作20世纪中叶至20世纪90年代初汉语词语类工具书的代表。该词典收条凡58,481个,其中双字词汇单位有39,548个,约占67.63%,例如“返潮、津液、三副、小卖”,三字词汇单位有4,828个,约占8.26%,例如“三联单、小金库、修辞格、普及本”。两者相加有词44,376个,约占该书收条总数的75.88%。《新华新词语词典》(商务印书馆 2003)可看作20世纪末至21世纪初这十几年来汉语词语类工具书的代表。该词典收20世纪90年代以来的词汇单位凡2,168个(该词典凡例称收条2,200个,似有不确),其中双字词汇单位有1,204个,约占55.54%,例如“盗印、跟进、卖场、梯次”,三字词汇单位有324个,约占14.95%,例如“冷和平、倒计时、蓝筹股、烂尾楼”。两者相加有词1,528个,约占该书收条总数的70.48%。由上述工具书收条情况不难看出,双字词汇单位、三字词汇单位在汉语词汇中占有相当大的比例,两者之和在整个词汇中占压倒的多数。还可看到,双字词汇单位的数量远大于三字词汇单位的数量,因而我们可以把双字组合视为词的典型格式,把三字组合看作词的次典型格式的主体部分。