第一节 《汉语水平词汇等级大纲》中的传承语素
一 《等级大纲》全部语素的考察
我们参照《等级大纲》与《现代汉语词典》[2](以下简称《现汉》)的单字与词语编排方法,按语素、构词级别、单用级别、所出现的甲级词、乙级词、丙级词、丁级词顺序,首先建立了构成8822条词语的全部语素语料库。
语料库建立的基本原则和具体步骤如下(参见表3-1):
(1)语素的确定采取逐词分析的方式:《等级大纲》中以单用形式出现的条目,我们在语料库中设单用及其出现级别一栏予以标示,如“啊ā”的单用级别为甲级,语料库中就标注为“甲”,“阿”的单用级别为乙级,语料库中就标注为“乙”;《等级大纲》中以多字词出现的条目,我们则深入每个语词内部,条分缕析,逐一分解。如丙级词“逮捕”,可以分析出“逮”和“捕”两个语素,而四字习用结构“不是…而是”则可以分解出“不”“是”“而”三个语素,另一字“是”因重复出现且语义无别而被剔除。至于“咖啡”“徘徊”,分别为音译词和联绵词,语料库中都作为一个语素列出。
表3-1 《等级大纲》全部语素语料库示例
(2)语料库的语素按音序排列,一般不再标注语音。但对于《等级大纲》中分条标出,且有两读的语素,语料库标出了拼音。如“啊”在《等级大纲》中有“啊ā(叹,甲)”和“啊a(助,甲)”两个词条,分别为同形异音的两个词;“陆 liǜ”与“陆 lù”,“横 héng”与“横hèng”,也是同样情况,我们在语料库中均注出拼音。此外,一些特殊的读音,我们也予以标注,如“逮”一般读为第三声,但“逮捕”中的“逮”读为第四声,义同第三声的“逮”,且只用于“逮捕”这一个词中,我们在语料库中也标出了读音。
(3)构词级别的确定按甲乙丙丁四级词的出现顺序,从前往后予以确定。如“阿”在大纲中所构成的唯一的词“阿姨”出现在乙级词中,它的构词级别即为乙级;后缀“子”在《等级大纲》中构词73个,其中甲级词有“杯子、本子、儿子”等14个;乙级词有“包子、被子、脖子”等22个;丙级词有“村子、钉子、豆子”等17个;丁级词有“爱面子、班子、雹子”等20个,因其最先出现的级别为甲级,后缀“子”的构词级别即为甲级。
(4)本语料库是基于《等级大纲》的语素统计,因此,如果出现的单字词(语素)没有在《等级大纲》中构成其他词语,我们只将它作为单字词列出。如“斑”在《现汉》中可以构成“斑白、斑点、斑痕、斑纹、斑马、斑马线、雀斑”等词,但在《等级大纲》中没有呈现构词的情况,我们只将其作为单字词列出。但为了反映语素在现代汉语构词中的真实情况,我们另外补做了这部分语素构词的例表(详见表3-6:《等级大纲》中未参与构词的传承语素可拓展词语示例)。
(5)语料库严格按照语素构词的实际情况列词,因此,每个合成词在词表中的出现次数,都是根据其在所由构词的语素目下参与构词的情况确定的。如“疯狂”由“疯”和“狂”两个语素构成,那么在“疯”和“狂”两个语素栏中,都可以找到“疯狂”一词。再如“百花齐放”由“百”“花”“齐”“放”四个语素构成,那么“百花齐放”一词在语料库中也会出现四次。
(6)《等级大纲》中的词语很多包含有一个字形相同的构词成分,而这些构词成分并不是同一个语素,如“剧”在《等级大纲》所示的单用条目中只有表示“戏剧”义的后起义“剧2”,即“剧”(名,丙),构成的词语也达10个。但“剧”还有“猛烈、厉害”的上古传承义,在《等级大纲》中出现的词语包括“剧烈、急剧、加剧”3个。再如“方”在《等级大纲》中有甲级词“方向、方法、方便”,乙级词“东方、立方、方式”,丙级词“后方、大方、药方”,丁级词“四方、立方米、处方”等30个词语,分别属于不同的语素。我们根据《王力古汉语字典》[3](以下简称《王力古汉》)等提供的上古义项线索,参照《现汉》的条目安排,在语料库中分出了“剧1”和“剧2”,“方1”“方2”和“方3”等同形异义的语素,并将相关词语归入适合的语素目下,这也是本语料库着力较多之处。
(7)《等级大纲》中的单字词,有一些为同形分列的。这些分条列出的单字词,有的是两个不同的语素,如“并”,在按音序排列的词汇大纲中分列为“424并 bìng(副、连,乙)”和“425并 bìng(动,乙)”,我们在语料库中也处理为“并1”和“并2”,分别表示“一并、并且”和“合并”的意思;还有一些虽在《等级大纲》中分条列出,但从语源和语义上看,仍属于同一个语素,《等级大纲》分列的主要原因是考虑到其语法功能的不同,分列以方便学生掌握。我们综合《王力古汉》《辞源》(1983)等说明,参照《现汉》的条目安排,仍归入一个语素目下,如“包”,《等级大纲》中分列为“158包bāo(名、量,乙)”和“159包bāo(动,乙)”,但从语源上看,“包”的上古义为“裹”,量词、名词等用法都为其引申义,我们在语料库中仍作为一个语素列出,但在备注栏中予以注明,他如“报、遍、差 chà”等,在《等级大纲》中分列为“203报 bào(名,甲)”和“204报 bào(动,丙)”“377遍 biàn(量,甲)”和“378遍 biàn(形,乙)”“675差chà(形,乙)”和“676差 chà(动,甲)”,我们也都归入一个语素栏下。
我们依据对《等级大纲》8822条词语查测的最终结果,建立了由3120个语素构成的全部语素语料库。本语料库覆盖了所有出现于《等级大纲》中的语素,包括传承语素和非传承语素、参与构词的语素和未参与构词的语素、可以单独使用的语素和只具有构词功能的语素,是《等级大纲》语素的总汇。
对《等级大纲》语素的考察,引起我们特别注意的有以下几个方面。
(1)同形语素在语料库中占了很大比例。
在3120个语素中,同形语素211组,涉及语素432个,包括:啊、挨、按、把、帮、奔、本、别、便、并、博、布、差、才、参、草、长、陈、称、处、畜、传、从、大、代、逮、待、担、当、倒、道、得、的、等、抵、地、调、端、断、恶、儿、法、凡、方、复、概、干、革、给、更、姑、谷、固、姑、怪、官、管、果、号、核、横、候、忽、华、会、纪、哄、花、划、晃、汇、伙、甲、假、间、教、结、禁、经、竟、纠、局、具、剧、卷、决、觉、卡、看、可、克、空、孔、控、款、况、拉、老、里、了、落、率、略、麻、没、美、米、面、明、命、模、哪、难、念、宁、偶、排、批、偏、漂、铺、强、切、且、曲、圈、任、日、容、如、若、塞、散、上、少、舍、生、盛、拾、使、输、署、数、似、肆、松、所、台、挑、头、吐、为、维、委、悉、下、相、向、项、象、削、效、兴、行、许、血、呀、要、仪、以、义、易、益、应、营、与、元、原、越、运、炸、站、载、脏、则、折、丈、着、阵、征、正、挣、之、支、只、志、质、致、中、种、重、注、转、庄、装、准、子、自、纵、足、钻。其中399个为两个一组,如“车站”的“站”与“站岗”的“站”,“器官”的“官”与“军官”的“官”; 32个为3个一组,如甲级词“方向”、乙级词“立方”、丙级词“药方”就分由3个不同的语素构成,他如“果、可、略、生、征、把、麻、要、着”等;4个一组的很少,只见到“复”一组,如“复杂、反复、报复、复兴”中的“复”,就分别代表了4个语素。同形语素的语音多数相同,如上面举到的“站、官、方、复”等。也有不少异音的情况,如“哄 hǒng”与“哄 hòng”“炸zhá”与“炸zhà”。同形语素之多,超出我们的预料,也从一个方面说明了学生发音不准、语义理解有误等常见问题的产生原因,提醒我们在国际汉语词语教学中要特别重视同形语素的教学。
(2)可以作为单字词使用的语素比例相对较高。
在3120个语素中,有1833个语素可以作为单字词使用,其中甲级442个,乙级540个,丙级403个,丁级448个,占了语素总数的58.75%,这就为我们的语素教学奠定了很好的基础。教学中学生对老师介绍的语素构词往往有一种畏难情绪,有一种不能直接获取词语义的担忧。但当语素本身又可以作为单字词学习之后,这个问题便迎刃而解。如“边、上、天”是所有学生在开始阶段就要学习的甲级词,掌握了这些甲级词后,教学中便可以很自然地导入语素构词,如“边上、上边、天上、上天、天边”,既以滚雪球的方式扩大了词汇量,同时又可帮助学生对单字词的理解与掌握,可谓一举两得。
(3)构词级别呈现均匀分布的态势。
在3120个语素中,始出现于甲级构词的620个,始出现于乙级构词的711个,始出现于丙级构词的624个,始出现于丁级构词的731个,分别占语素总数的19.87%、22.79%、20.00%、23.43%,另有434个未在《等级大纲》中参与构词,占总数的13.91%,基本呈现一种均匀分布的态势。这种分布状况,很利于我们语素教学的循序渐进,也适于国际汉语教材的科学编写。
二 《等级大纲》传承语素的考察
(一)《等级大纲》传承语素语料库的构建
在建立了覆盖《等级大纲》8822条词语、总数为3120个语素的全部语素语料库基础上,我们对其中的传承语素进行了筛选,并进而建立了《等级大纲》全部传承语素语料库。
传承语素多为上古汉语中的常用词。对于上古汉语词的确定,《王力古汉》是我们研究的重要参考。王力先生写于1985年的《古汉语字典·序》曾谈到该词典的八个特点:一是扩大词义的概括性,从而减少义项,简明易懂;二是将古书上只出现一次的僻义归入备考栏,以避免与正常词义相混;三是树立历史观点,注意词义的时代性;四是标明古韵部,既便于读上古韵文,又便于辨认叠韵联绵字;五是注明联绵字,以帮助读者了解词义;六是提纲挈领,在每部的前面先写一篇部首总论(有些小部除外);七是辨析同义词,对于意义相近的字提出来加以辨析;八是列举一些音近义通的同源字,给读者提供一些语源学知识。[4]我们对传承语素的来源认定主要参照《王力古汉》和《辞源》(1983),同时也参考了《汉语大词典》(1997)、《汉语大字典》(2010)的词(字)源分析。语料库中传承语素的来源,主要见于《周易》《尚书》《诗经》《周礼》《仪礼》《春秋》《左传》《国语》《论语》《孙子》《老子》《列子》《墨子》《孟子》《庄子》《荀子》《楚辞》《尔雅》《韩非子》《商君书》《吕氏春秋》《山海经》《孙膑兵法》《战国策》《公羊传》《谷梁传》《礼记》《史记》《淮南子》《急就篇》《新语》《盐铁论》《方言》等出自西汉以前的作品,以及《说文》和《汉书》两部成书于东汉的作品。我们将较早见于《说文》和《汉书》的语素也作为传承语素,是因为《说文》虽成书于东汉,但对字义的解释却基本保存了上古的语义系统;而《汉书》也是专门记述西汉历史,很多词义或沿自西汉,或处于两汉过渡期,基本上可以反映上古语言风貌。当然,对传承语素的分析考察,仅仅依据这些工具书和上古文献有时是不够的,必须根据已有的线索,认真稽考上古汉语传世和新出土的文献资料,以保证立论的可靠性。
《现汉》和《现代汉语规范词典》(2004),是以记录普通话语汇为主的中型词典,在推广普通话、规范汉语教学方面都有广泛的影响与声誉,也是我们在确定现代汉语词语的词性、义项等方面的重要参考
我们对构成《等级大纲》的全部3120个语素进行了逐一考察,最后确定出传承语素总数目为2425个,占全部语素总数的77.72%(见附录一:《等级大纲》传承语素总表);后起语素总数目为695个,占全部语素总数的22.28%。其中,未参与构词的传承语素241个,合成词中的传承语素2184个,所占比例分别为9.94%和90.06%。后起语素中未参与构词的208个,合成词中的487个,所占比例分别为29.93%和70.07%。
我们仿表3-1将《等级大纲》全部传承语素制作成语料库例表:表3-2。与表3-1比较,表3-2列传承语素13个,筛选掉的5个为后起语素,其中“啊”“疯”是后起字,“咖啡”为音译词,“剧2”作为“戏剧”的含义,是后起义;“阿”作为名词词头,也是产生于中古时期。
表3-2 《等级大纲》全部传承语素语料库示例
表3-2 《等级大纲》全部传承语素语料库示例续表
需要说明的是,我们的语料库是基于《等级大纲》而建构的。如果一个语素在《等级大纲》构词中没有反映其上古传承的特征,即使在《现汉》中可以找到其作为传承语素构词的例证,我们仍然没有作为传承语素将其收入语料库,如“逗”。“逗”在上古为“停留”义(逗,止也)[5],引申指句中的停顿。“逗引,招引”则为后起义,如唐李贺《李凭箜篌引》:“女娲炼石补天处,石破天惊逗秋雨。”“逗”的上古义与后起义,在《现汉》中标示为“逗1”和“逗2”。“逗1”在现代汉语中一般只作为构词语素存在,如“逗号、逗点、逗留”,《等级大纲》中列出的“逗”(乙级,动词)实际为“逗2”。根据基于《等级大纲》的原则,我们的传承语素语料库没有包括“逗”。“悉”也是同样情况。“悉”在《尚书》中有“全部”的意思,《现汉》“悉1”即为传承语素,构成了“悉数、悉心”等词,但《等级大纲》中的“据悉”“熟悉”的“悉”为《现汉》中的“悉2”,是后起义“知道”的意思,所以本语料库不作为传承语素收入。
另外,构建语料库时我们对语素来源所涉及的上古典籍,并不严格上溯其最早出现的文本,只要是源自上古时期的就作为传承语素界定的根据。这一方面是由于语义传承的线索有时难以确定,另一方面考虑到词语溯源并非我们建库的目的所在,我们的主要工作是围绕如何切实有效地服务于国际汉语词汇教学而展开的。
(二)《等级大纲》中未参与构词的传承语素
《等级大纲》中未参与构词的传承语素共241个,如表3-3所示:
表3-3 《等级大纲》中未参与构词的传承语素语料库
由表3-3统计,《等级大纲》中未参与构词的241个传承语素,在甲、乙、丙、丁四个词语级别中的分布情况分别为:甲级22、乙级46、丙级62、丁级112(见表3-4),其中“每”在《等级大纲》中分列两条:4385每měi(代,甲)和4386每měi(副,乙),我们依据前述的建库原则合并为一个,这样“每”便分别计算于甲级和乙级构词。
表3-4
统计显示,《等级大纲》中未参与构词的传承语素属于甲级的只有22个,占总数的9.13%,而属于丁级的有112个,高达46.47%。未参与构词的传承语素在《等级大纲》中主要呈现以下三种情况:
(1)本身就不具备构词能力的,如表3-5所示:
表3-5
我们所说的本身就不具备构词能力的语素,是指这类语素在现代汉语词汇系统中不具有构成合成词的能力,语素与词完全一致,这类情况约占7%。
(2)在现代汉语词汇系统中参与构词的能力有限的:有些只能构成较为冷僻的专有词语,如“丙”构成的“丙部、丙丁、丙纶、丙种射线”,“茎”构成的“地上茎、地下茎”;有些只能构成相沿习用的熟语,如由“株”构成的“守株待兔、株守”,由“粥”构成的“僧多粥少、一锅粥”;有些只能与量词构成表示总称的名词,如“灯盏、布匹、马匹”;有些则随着词汇双音化的趋势而在单字后加上名词后缀“子、儿”等变为双音词,如“秆子、爪子、爪儿”,这类情况约占6%。
(3)在现代汉语词汇系统中具有较强的构词能力,但受《等级大纲》收词范围所限而没有呈现组词能力的。这类情况在整个未参与构词的传承语素中所占比例最大,大约为87%。如表示数目的“六、九”,在现代汉语中可以构成“六神、六亲、六欲、六书、五颜六色、五脏六腑;九鼎、九泉、九霄、九泉、九牛一毛、九死一生”等;联绵语素在《等级大纲》传承语素中包括“仓促、踌躇、鞠躬、慷慨、玲珑、犹豫、蜘蛛、猖狂、玫瑰、徘徊、蜻蜓、汹涌、蓬勃、珊瑚、汪洋、梧桐、酝酿、郑重”等18个,除“蓬勃”外,在《等级大纲》中都未参与构词,但其本身大多具有构词能力,如双声的“踌躇(踌躇不前)、鞠躬(鞠躬尽瘁)、慷慨(慷慨激昂)、玲珑(小巧玲珑)、犹豫(犹豫不决)、郑重(郑重其事)”;叠韵的“玫瑰(玫瑰紫、玫瑰红)、汪洋(汪洋大海)、汹涌(汹涌澎湃)、蜻蜓(蜻蜓点水)”,以及“珊瑚(珊瑚虫、珊瑚岛、珊瑚礁)、汪洋(汪洋大海)”等。表3-6为我们根据《现汉》做出的《等级大纲》中未参与构词的传承语素可拓展词语举例。
表3-6 《等级大纲》中未参与构词的传承语素可拓展词语示例
表3-6 《等级大纲》中未参与构词的传承语素可拓展词语示例续一
表3-6 《等级大纲》中未参与构词的传承语素可拓展词语示例续二
表3-6 《等级大纲》中未参与构词的传承语素可拓展词语示例续三
表3-6 《等级大纲》中未参与构词的传承语素可拓展词语示例续四
表3-6 《等级大纲》中未参与构词的传承语素可拓展词语示例续五
表3-6 《等级大纲》中未参与构词的传承语素可拓展词语示例续六
表3-6 《等级大纲》中未参与构词的传承语素可拓展词语示例续七
表3-6 《等级大纲》中未参与构词的传承语素可拓展词语示例续八
经逐一考察,《等级大纲》中未参与构词的241个传承语素,在现代汉语中真正不具有构词能力的实际只有18个,包括“把、剥bāo、仓促、猖狂、盛chéng、冲 chòng、徘徊、畔、颇、叁、艘、梧桐、壹、曰、酝酿、兆、蜘蛛、拄”等,仅占该类总数的7.47%。若放入整个传承语素考察,《等级大纲》中不具构词能力的只为全部传承语素总数的0.74%,传承语素的构词能力由此可见一斑。
(三)《等级大纲》中构成合成词的传承语素
《等级大纲》中构成合成词的传承语素共2184个,其中,始出现于甲级构词的541个(见表3-7),始出现于乙级构词的606个(见表3-8),始出现于丙级构词的492个(见表3-9),始出现于丁级构词的545个(见表3-10),分别占该类总数的24.77%、27.75%、22.53%和24.95%,基本上呈现出一种均匀分布的状况。
表3-7 始出现于甲级构词的541个传承语素
表3-8 始出现于乙级构词的606个传承语素
表3-9 始出现于丙级构词的492个传承语素
表3-10 始出现于丁级构词的545个传承语素
此外,参与构成合成词的2184个传承语素,在《等级大纲》中同时作为单字词出现的有1175个,占整个总数的53.80%。其中有些语素作为单字词在《等级大纲》中分列两条,如“气”,分别为5019(名,丙)和5020(动,乙); “行”分别为7168(名,乙)和7169(动、形,甲),依据前述原则和方法,我们仍作为一个语素看待,但在计算构词数目时则根据实际条目予以统计。根据语料库显示结果,1175个语素作为单字词条目出现共1186个,包括甲级词327个,乙级词376,丙级词246个,丁级词237个,所占比例分别为27.57%、31.70%、20.74%、19.98%。只作为语素在《等级大纲》中出现的1009个,占整个总数的46.20%。
经统计,在参与构词并可以单用的1175个传承语素中,同时可以作为甲级词使用的327个传承语素始见于甲级构词的192个,达到该类总数的58.72%,而始见于丁级构词的仅20个,只占该类总数的6.12%。与之形成对照的是同时可以作为乙级词、丙级词和丁级词使用的传承语素,其始见于甲级构词的百分比分别为29.79%、24.39%、22.36%(见表3-11),这也充分说明了在汉语教学的起始阶段即启动语素教学的可行性。
表3-11
表3-11续表