汉语历史词汇学概要
上QQ阅读APP看书,第一时间看更新

五 “字”的重要作用

不过,“字本位”理论强调“字”的作用,这对我们有启发。确实,像吕叔湘所说:“不但在古代,甚至在现代,这个有意义的单音节——‘字’,还是享有相当大的自主性,在说汉语的人的语言生活里起极其重要的作用,远过于像俄语这种语言里的‘词根’。”这个问题,下面分几点来谈。

5.1 字之所以重要,首先是由于字所表达的语言学单位“语素”在汉语中十分重要。语素是构成复合词的基础;有些汉字后来虽然不能单独使用,但作为语素仍非常活跃。

(一)很多被认为是“语素”的“字”,在现代汉语中有时可以单用。

民 一般要说“人民”,但还可以说:“拥政爱民”、“军爱民,民拥军”。

金 一般要说“金子”,但还可以说:“金银财宝”、“开口是银,闭口是金”。

桌 一般要说“桌子”,但还可以说:“桌椅板凳”、“摆了一桌的菜”。

(二)词典中有不少义项是语素义。

如《现代汉语词典》:(摘引,不全录)

[家] ④经营某种行业的人家或具有某种身份的人:农~、东~。⑤掌握某种专门学识或从事某种专门活动的人:专~、画~。❻学术流派:儒~、法~。❼指相对各方中的一方:上~、下~。❽谦辞:~父、~兄。❾人工饲养或培植的:~畜、~禽。

[光] ②景物:风~、春~。③光彩;荣誉:增~。④指好处:沾~、叨~。⑤敬辞:~临、~顾。❼明亮:~明、~泽。❾一点儿不剩;全没有了;完了:精~、用~。❿(身体)露着:~膀子、~着身子。

词典应该是以词为条目,收词的义项,为什么要收语素的义项?因为这些单音词,很多情况下同时又是语素,而且这些语素很常用,缺了这些语素义,词典就不完整,不能给读者提供帮助。

(三)语素可以很灵活地组词,有些语素的组词能力比相应的词要强。

如:在现代汉语中,“狮”和“虎”是语素,“狮子”和“老虎”是词。但“狮”、“虎”的组词能力比“狮子”、“老虎”强。“雄狮”、“睡狮”、“醒狮”、“狮吼”中的“狮”都不能换成“狮子”。“虎将”、“虎威”、“虎穴”、“虎视”中的“虎”不能换成“老虎”。

在现代汉语中,“taxi”的译音词“的士”组词能力很有限,但语素“的”虽不能单用,却很快地构成了一串新词:“面的”、“打的”、“的哥”等。

陈卫恒(2011)说:“从汉语词汇化的进程来看,与汉语不断由双音词组凝固为新的双音词的进程相伴,也有不少双音词在进一步组合中沉淀或还原为单音节的字或词素,作为字组左右扩展的背景参照或者‘核心’。……比如:我们知道,现代汉语‘杯’字不能单说,而要说‘杯子’;但是若要以‘杯子’为参照左右进一步扩展,就会又还原为‘杯’。如:水杯、茶杯、保温杯,杯具、杯身。同样的,彩蝶、蛛网、扎啤等,也是这种例子。”(P.181—182)这话说得很对。不过,与其说“沉淀或还原”,还不如说在汉人的心理中,单音节的语素是一个更基本的单位,作为一种茶具的概念,储存在人们心理中的不是“杯子”,而是“杯”。这就是赵元任说的:“在中国人的观念里,‘字’是中心主题,‘词’则在许多不同的意义上,都是辅助性的副题,节奏给汉语裁定了这一样式。”吕叔湘说的“汉语词汇的基本单位还是一个一个的单字”,也是这个意思。

用语素组词不但十分自由,而且成词以后意蕴十分丰富。如20世纪20年代的诗人戴望舒用“雨”和“巷”组合成一个新词“雨巷”,非常形象地表达了江南春雨中的小巷的情景。这虽然是诗人个人的创造,但很快就广为传播,进入了全民语言。

正因为表达汉语语素的“字”有这样重要的作用,所以一些计算语言学家把“字”作为基本单位,并提出汉语的表义特征是“字义基元化,词义组合化”(黄曾阳《HNC(概念层次网络)理论》,清华大学出版社,1998)。但是,照我的理解,作为基元的“字”还应该是书写单位的汉字经过分合以后而形成的表达语素的单位。比如,在考虑现代汉语复合词的构成时,“和”这个汉字至少应该分为两个基元:1.构成“和平”、“和睦”的“和1”(也可以写作“龢”);2.构成“总和”、“和数”的“和2”。同样,“公”这个汉字,也应分为两个基元:1.构成“公鸡”、“老公”的“公1”;2.构成“公共”、“公园”的“公2”。而且,有些凝固得很紧的双音词,在现代汉语已经作为一个单一的意义单位,无法把它拆成两个字或语素来理解。如“和气”、“气魄”中的“气”,虽然是一个语素,但说现代汉语的人已经无法明确说出它的意义,更不能用它来组成其他复合词。我们可以把那些有单独意义、有构词能力的语素称为“基本语素”(如“狮、虎、杯”等以及“煤气”、“气愤”中的“气”),把那些没有单独意义、没有构词能力的语素称为“非基本语素”(如“和气”、“气魄”的“气”)。那些表达基本语素的字可以是“基元”,表达非基本语素的不是“基元”,“基元”还是“和气”、“气魄”等词。

以上说的是作为“有意义的单音节”的“字”的作用。作为兼具形音义的符号,“字”还有它另外一些重要作用。

5.2 汉字具有表义的作用。

汉字主要是记录语言的符号,但它不仅仅是记录语言的符号。《汉语字本位语法导论》说:“目前流行的定义是:‘文字是记录语言的书写符号系统。’这个定义不能说‘错’,但应该说,不是很全面,因为这种‘记录’不一定完全是被动的记录,也可能在记录语言的同时,它本身也兼具符号的作用,形成一种以其形体表达现实的表义符号系统。”从汉字的总体情况来看,这样说大致是可以的。对汉字形体的表义作用应该给予充分的重视。

语言中的词或语素都是音义结合体,都提供了音和义的信息。不过,音的信息是明显的,一个词或语素总会有一个音。义的信息则不那么明显,特别是几个同音的词或语素,如果脱离了上下文,人们往往不容易知道它们意义的区别。而很多汉字其形体具有明显的表义作用。

有些汉字是象形字或会意字,从字的形体可以直接了解字的意义。经过隶变,很多字线条化了,象形的意味大大减少。但稍具文字知识,有些字还是可以从字形来了解其意义。如:“目”,表示眼睛;“牧”,表示人在放牛。

更多的汉字是形声字,字的声符通常表示字的读音,形符通常表示字义所属的意义范畴。一个不认识的字,根据其声符和形符大致可以猜测其读音和大致意义。这一点,每一个人在自己学习汉字的过程中都会有体会:有一些难字,可能开始时并不知道其读音,但是,根据字的偏旁,根据这些字经常出现的上下文,可以猜出其大致意义。比如,“驖”,大概是一种马;“赆”,大概和钱财有关;“饕餮”两个字,大概和吃有关。也就是说,人们在学习过程中,不是先把这些字和语言中的词或语素联系起来,从而知道它们的意义,而是直接根据其字形和经常出现的场合,来推知其意义。

汉语中有不少同音词。如:“湅”、“练”、“炼”三个词,读音完全一样,如果用拼音文字,liàn, liàn, liàn也完全一样。但写成汉字,其偏旁就显示了意义范畴的不同。《说文》:“炼,治金也。”段注:“湅,治丝也。练,治缯也。炼,治金也。”又如:“揉”、“蹂”、“糅”、“鞣”、“”这五个字,读音都一样;都是以“柔”为声符,加上不同的偏旁。仅仅看其偏旁,就大致可以知道,“揉”是手的动作,“蹂”是脚的动作,“糅”可能与谷物有关,“鞣”可能与皮革有关,“”可能与车辆有关。从这个角度讲,汉字的形体结构比词或语素表达了更多的信息,汉字的表义功能要大于语言中的“语素”或“词”。

不过,这一点不能说过头。在长期的历史发展过程中,汉字的字形和意义都有了很大的变化。特别是发展到现代汉字阶段,很多汉字就无法从字形推求字义了。如:莫,甲骨文是在四个屮中一个日,表示日暮。现在,“莫”字已经没有了“日暮”的意义,形体上也看不出四个屮了。还有一些形声字,在篆书中就是“省声”,即声符只保留一部分。“夜”篆文作“”,《说文》分析其字形结构说:“从夕,亦省声。”声符“亦”已经省去一部分(所谓“省声”),形符也不像“夕”了。更多的汉字形体在历史上发生了变化,至今已看不出什么是声符,什么是义符。如:“责”篆文作“”,从贝,朿声,后来“朿”变成了“”,看不出读音了。“责”的常用意义是“责任”、“责备”,也和钱财没有直接关系了。“青”篆文写作“”,从丹,生声。在楷书中声符和形符都看不出来了,更无法从字形推求字义。指示代词“這”(简化为“这”),从字形看也是一个形声字,从辵,言声。本音鱼彦切,义为“迎也”。但指示代词“這”的词义和“辵”毫无关系,读音和“言”也毫无关系。后来用这个字表示指示代词,和它原来的音义都无关。“验”字和马无关,“赓”字也和钱财无关。还有一些字,如“歹”、“为”、“书”等,只是一些简单的笔画线条,是记录语言中词或语素的符号,它们的形体结构没有提供任何读音和意义的信息。说现代汉字是一个完整的“以其形体表达现实的表义符号系统”,这话就要大打折扣。

5.3 汉字使得汉语的符号系统繁简适中。

尽管发展到现阶段,有不少汉字已经不提供任何读音和意义的信息了,但作为形体不同的汉字,还是有它巨大的作用:不同的汉字区分了汉语的大量同音词,使得汉语的符号系统部不至于太简单;同时,一个汉字往往表达几个意义,又使得汉语的符号系统不至于太繁复。

汉语是单音节语言,音节数不多,所以有大量的同音词(homo-phone)(英语也有,如threw, through,但不如汉语多)。如果不用汉字分化,只用不同的音节来构成一个符号系统,这个符号系统就太简单,难以表达意义。另一方面,汉字往往是一字多义(polysemy),例如“看”,主要有六个义项:①使视线接触人或物。②观察并加以判断。③访问。④对待。⑤诊治。⑥照料。这六个义项属于同一个词,都用一个“看”字表达。这又控制了符号系统使之不过于繁复,所以有“词涯八千”之说。否则,如果一个意义就用一个符号,则符号会高达数万,这样的符号系统又过于繁复,人们难以掌握和使用。《史记》用字4932个,频次最高的1—1308个字占全书用字量的26.5%,但覆盖全书95%的内容。这1300个字大部分是多义的,如果一字一义,势必增加用字量。(参见郑锦全《从计量理解语言认知》,李波《史记字频研究》)

下面举例谈谈汉字区分同音词的作用。如:yóu这个音节,《现代汉语词典》有如下条目:尤,由,邮(郵),犹(猶),油,柚,疣(肬),斿,莜,莸(蕕),铀(鈾),蚰,鱿(魷),游(遊),楢,(輶),鲉(鮋),猷,蝣,蝤,繇,

这些字在现代汉语中是完全同音的。从历史上考察,可以分为三类:

由,油,蚰,斿,游,遊,蝣,犹(猶),莸(蕕),猷,楢,,輶,蝤。(上古为余母,幽部。《广韵》为以周切。)

尤,疣(肬),邮(郵)。(上古为匣母,之部。《广韵》为羽求切。)

繇,。(上古为余母,宵部。《广韵》为以周切。)

虽然古音分得细一些,但仍有不少同音的。这些词主要靠汉字来加以区分。

5.4 汉字可以超时代,超地域。

词语是在不停的变化之中的。不同的时代,不同的地域,读音都会不同。如“金”,上古是见母侵部,拟音为kǐǝm。在现代方言中,广州话还读kɐm。“直”,上古是澄母职部,拟音为dǐk。在现代方言中,澄海话还读dik。如果是用拼音文字来记录,那么,前一个时代的文字,可能后一个时代的人不认识,这个地区的文字,可能那个地区的人不认识。

汉字虽然有表音的成分,但不与特定的语音联系。同一个字的读法,古今可以不同,方言可以不同(当然,古今的读音和不同方言的读音会有对应关系,但使用汉字的人一般对此是不注意的),但大家都认得是同一个汉字,所以能超时代、超地域。

5.5 汉字的变化反映和适应了语言的发展。

这样说,并不意味着汉字是一成不变的。在历史上,汉字也有很多变化。除了字体的变化,有些变化是反映和适应语言的变化的。这个问题不可能展开讲,只能简单地举例谈一谈。

如区别字和累增字,反映了词义的引申和发展。

“取”,本义是割取战俘的耳朵,引申为取得东西,又引申为娶妻。为了使引申义区别于本义,后来出现了区别字“娶”,专表娶妻。

“益”,本义是水漫出,引申为增益,而且引申义用得更多。为了使本义区别于引申义,后来出现了累增字“溢”,专表水漫出。

“戚”,本义是一种斧,又假借为“忧戚”的“戚”。为了使假借义区别于本义,后来出现了区别字“慼”,专表忧戚。

“然”,本义是燃烧,又假借为“然否”的“然”,而且假借义用得更多。为了使本义区别于假借义,后来出现了累增字“燃”,专表燃烧。

又如“父”和“爸”。“父”上古为並母,鱼部,拟音为bǐwɑ。后来並母分出奉母,鱼部字的主要元音多数变为u。所以现代“父”读作fu(去声)。但是口语中表“父亲”的这个词的读音仍然是pa(去声),所以人们又新造一个汉字“爸”来记录这个读音。原有的“父”仍然保留,在用法上和“爸”有一些区别。

5.6 汉字是人们最熟悉的社会学的单位。因为这种单位的存在,形成汉语中一些特有的现象。例如:

(一)一些本来不能拆开的单纯词可以扩展成一个复杂的动宾词组。如:

慷慨——慷他人之慨 上当——上了他的当 鞠躬——鞠了一个躬

这是因为,人们总觉得这些单纯词是由两个字组成的,而每个字都是有意义的,前一个字和后一个字会构成一种意义关系,而且通常把它们看作是动作和对象的关系。这样,在对象的前面当然可以加上修饰语。这就形成了这种扩展。

这种扩展也会在一些复合词中出现,而且,如果经常出现,还会使后一个字的意义和词性产生变化。如:

敬礼——敬一个礼——敬一个举手礼/敬一个注目礼/敬一个军礼

“敬”和“礼”本是并列的动词,《吕氏春秋·宠怀》:“求其孤寡而振恤之,见其长老而敬礼之。”“敬礼之”是“尊敬并礼遇他们”。现代“礼”演变为名词“表示尊敬的言语或动作”(参见《现代汉语词典》)。

(二)一些复杂的词组可以简缩为一两个字。

如:“核武器扩散”可以简称为“核扩散”,“非典型性肺炎”可以简称为“非典”。“北美洲和大西洋军事条约”可以简称为“北约”。这都是抽取其中的一两个字来代表整个词组。这是由“字”在汉语中的重要性决定的。现在,又有把原指军事组织的“北约”和“华约”用来指高考时以北大为首的和以清华为首的两个联合自主招生组合,这又是汉字“北”和“华”生成的有趣联想。

英语中也有这样的缩写,但往往是几个词起首的字母的拼合,如: NATO: North Atlantic Treaty Organization. AIDS: Acquired Immune Dificiency Syndrome。

又如:“百花齐放,百家争鸣”的方针可以简称为“双百方针”,“民族主义,民权主义,民生主义”可以简称为“三民主义”,“不打棍子,不揪辫子,不戴帽子”的政策可以简称为“三不政策”,“马上文章,枕上文章,厕上文章”可以简称为“三上文章”,“工业现代化,农业现代化,国防现代化,科技现代化”可以简称为“四化”。这些也都着眼于每个词组中都有相同的一个字;而且,这个字可以只是字形相同,而意义未必相同。如“三民主义”的三个“民”,仔细分析,其意义是不同的:“民权,民生”中的“民”是“人民,老百姓”,“民族”中的“民”不是“人民,老百姓”。

英语中这样的简缩不多,偶尔有一些,也是以字母来代表整个词。如:Three R’s: reading, writing, arithmetic。因为英语是多音节语言,音节这个语言单位在英语中没有什么重要作用,更没有把音节和意义联系起来,所以,像这样的简缩很少见。

5.7 因为汉语中词不是现成的,而字是现成的,所以,作为汉语习得的起点,是字而不是词。

这里所说的汉语习得,包括汉族的儿童学习汉语,也包括外族人学习汉语。两者的汉语习得情况不完全一样,但以字为汉语习得的起点,这是一致的。

小孩学语文,从来都说“识字”,而不说“识词”。这不是一个人们表达习惯的问题,而是一个实际上以什么为起点的问题。以词为起点是不可能的,什么是汉语的词,这个问题太复杂了,连语言学家都不能轻易地回答,根本不可能让一个初学汉语的人去掌握汉语的词。以字为起点是比较现实的办法,不管是孩子还是成人,都可以先从一些笔画简单的汉字开始,做到能认能写,然后逐步认识更多的汉字,并进而会读会写更多的双音词。

当然,所谓“认字”的过程,实际上还是以汉字为起点,来掌握汉语的语素或词,这里包括了我们前面所说的把汉字加以分和合的过程。比如一年级的小学生,在认“长”这个字的时候,必然要知道这个字有cháng和zhǎng两种读音,在学“和”这个字的时候,必然要知道这个字虽然就读hé一个音,但“你和我”的“和”跟“和气”的“和”是两个不同的意思。在学了“和”这个字以后,如果他在某处看到一个“咊”字,人们会告诉他,这是“和”的另一种写法。学了“和”字、“气”字,又学了“平”字、“天”字、“生”字,他就会读和写“和气”、“和平”、“天气”、“生气”。

而且,我们也不能把话说过头,说“认字”的过程只能是从字到词。一些凝固得很紧而又很常见的双音词(如“和气”、“和平”、“天气”、“生气”等),孩子不可能先懂得其中“和”字跟“气”字的意义,才学会这些双音词。孩子在学习时先在听和说的过程中懂得了“和气”、“和平”、“天气”、“生气”这些词的意思,现在只是会读会写而已;而不可能是先掌握了“和”跟“气”这两个字的多种意义,然后拿它来和另一些汉字“平”、“天”、“生”来合成“和气”、“和平”、“天气”、“生气”这些词。但即使长大以后,他也不会去理会这里面的“气”这个字究竟是什么意思。所以,我们说汉字很重要,但不能过分夸大汉字在汉语习得中的作用。尽管孩子学汉语是以字为起点,并不能说他们学习时是以字为基本单位,实际上,还是以词和基本语素(如上面说到的“狮”、“虎”、“杯”等)为基本单位的。

5.8 汉字不仅在汉语习得中很重要,而且在词典编纂中也很重要。汉语有“字典”和“词典”之分。字典是以字为单位的,词典是以词为单位的。但是,在词典中有时也还是以字为单位。

“通假”是汉语(特别是古代汉语)中常见的现象。比如,“蚤起”的“蚤”,是把“蚤”借作“早”用。这种现象,在字典、词典中怎样处理呢?如果以字为单位,当然是在“蚤”这个字条下说明这个字有时借作“早”用,即标明“蚤”有一个义项是“通‘早’”。如果以词为单位,就应该在“早”这个词条下说明这个词有时借用“蚤”字表达。但《汉语大词典》并没有采用后一种做法,而是在“蚤”条下立一个义项:

蚤1.跳蚤。3.通“早”。

其实,通假是文字问题,不是词汇问题。就词而言,无所谓这个词通那个词。严格地说,在“蚤”下说“通‘早’”,实际上还是把“蚤”作为一个字条来处理。各种词典中说“某通某”的很多,凡是这样来处理的,都是以字为单位来处理。

《现代汉语词典》在处理字词关系时是比较严格的,经常在字头的右上角用1、2来区分字形相同的几个不同的词。如:开1是动词,开2是含金量单位。喂1是招呼的声音,喂2是喂养的喂。但“蚤”条下却没有分1、2,而是作为一条:

蚤 zǎo 跳蚤。

〈古〉又同“早”。

这也是把“蚤”既作为词条(“跳蚤”),又作为字条(“〈古〉又同‘早’”)。

复音条目的处理也有这个问题。如“翔实”,这个词里的“翔”其实就是“详”,“翔”是个通假字。如果严格地以词为单位,是应该放在“详”这个词条下的。但《现代汉语词典》在“详”下收了【详实】,作为参见条,在“翔”下收了【翔实】条,作为主条。这仍是以字为单位的。

不过,通假义的条目是放在词下,还是放在字下,这不是一个理论问题,而是一个应用问题。读者是在阅读时看到了“蚤起”和“翔实”,但不知道其意思,才来查词典的。“蚤起”放到“蚤”下,“翔实”放到“翔”下,读者立即能查到。如果放在“早”下和“详”下,读者就无从查找了。