汉语语汇学研究(三)
上QQ阅读APP看书,第一时间看更新

语料值视角下的固定语的固定性研究

王吉辉

1.1 既然是固定语,它自然就有固定性。不同的固定语,其固定性未见得都相同。这种情况下,固定语的固定性表述日益显示出其重要性和迫切性来。

当下,学界对固定语的固定性不是没有表述,而是通常表述得不够确切,甚或可以说比较模糊。较常见的表述不外乎借助增加一些限定性的修饰语,像“一定”“某种程度”等来加以实现。诸如“有一定的固定性”“有很强的固定性”“有某种程度的固定性”等都是这类表述中的典型。这些,表面上好像因为有了“一定”“某种程度”等的限定而使所在固定语的固定性得到了更为准确的表述,然而实际上,读者或听者对其所表述的程度仍然只能了解个大概,理解上的跨度以及不确定度都很大。

如何使表达和理解上的这种不确定性降到最低,如何尽可能避免甚或消除这种不确定性,这是固定语深入研究所必须面对和需要努力去解决的。为此,笔者试图另辟蹊径,通过量化的方式来寻求对这一问题的解决,并先后在拙文《从原型理论来看固定语的识别》《固定格式与固定语》等中进行了初步实践作者近日又专门撰文《固定语固定程度的影响因素及相关分析》(待刊),为该方法的实施提供理论上的支持。。不过应该看到,拙文量化所赖以依凭的基础还是属于定性的分析,是在定性分析的基础上、采用数值化的方法来衡量固定语自身内在的固定程度的——这还不能认为是严格意义上的量化方法。

1.2 固定语本身不具有“量”的特征,要想对固定语的固定性进行量化的分析,仅仅着眼于固定语自身,恐怕很难取得根本上的突破。

不妨先将这一问题放在一边,让我们来看看社会是怎么评判一个人“美不美”的。

“美”,一如固定语的固定性,其自身也不具有“量”的任何特性;而且,判断上的主观性更加突出,“情人眼里出西施”正是对它这一特性的形象写照。即便对像“美”这样的现象,社会还是透过这“见仁见智”的背后找出了存在着的共性的东西,并借助“量”表述出来,比如,人体上下肢比例符合所谓的黄金分割比就是一种美,等等。这种对“美”的判断,显然是基于所判断对象自身的实际情形而言的,——将着眼点放在了判断对象自身所具有的各项内在条件上。

此外,社会上对“美”的判断还存在着另外的一个角度、另外的一种标准,这就是通常提及的“回头率”。照理,“回头率”自身与“美”毫不搭界,拿它来作为“美不美”的标准似乎有些荒诞的确,从未见海内外有拿它来作为选美的标准或标准之一的。。不过,当使用在特定的语境中时,它与“美不美”之间倒的确能建立起某种程度的关联来。请看下面两个随手摘自于人民网的例子:

(1)从此,我充满自信,每天更注重打扮自己了,走在街上的回头率空前绝后。(http://lady.people.com.cn/GB/n/2012/0919/c1014—19050923.html

(2)身高1米72的……,走在大街上依然有着很高的回头率。(http://msn.people.com.cn/GB/n/2012/0915/c242548-19017251.html

依照社会约定俗成的理解,一个人在人群中博取的回头率越高,其美丽的程度也就越高,回头率的博取其实与多方面的因素有关,这儿只是想借此说明“美”的判断可以有多个角度。上述两例即是明证。

“回头率”能间接地反映出被观察对象的“美”的程度,“回头率”的高低表明了被观察对象“美”的程度,换言之,“美”可以通过“回头率”的高低得到体现。“回头率”等于在给“美”量化,而“美”也由此能以数值化的形式被表述出来。“美”的这种判断,思路上迥异于第一种标准,它不再以被观察对象自身为着眼点,而是以他人对所观察对象的反应作为参照点。

1.3 固定语固定性的“量化”,未尝不可以比照着“美”评判上的第二条思路来进行,——借助它们在一定语料中的具体表现来作为其自身固定性高低的判断依据。

假设在1000万字的语料统计中,某固定语总共出现了100次,但只有一次是结构或成分等被改变了的,其余99例都以同一形式出现,那么,该固定语以未改动形式出现的比例为99%,以变动形式出现的比例为1%。此处的99%可以解读为,该固定语被整体运用的概率高达99%,也即,社会成员绝大多数情况下是将它当作一个固定的整体来使用的。99%的比例从他者的角度表明了该固定语的固定程度。如果将这一百分比转化为数值的话,该固定语的固定性数值为0.99。由于这一数值产生于一定的语料,所以不妨称之为“语料值”。

将语料值用于固定语的研究,海外的学者走在了前面。Berry Rogghe在谈到英语中动词与后附的介词比如live in等(作者简缩为VPC)能否构成一个固定整体时提出了R值理论,其公式为:

作者指出,VPC的R值取决于:与P有紧密联系的VPC组合占全部VPC组合的比例,而后又分别以live in和believe in为例进行了说明。作者从语料库中找到了11个和live in形成的搭配,它们分别是:hut, house, town, country, London, room, world, place, family, happiness and ignorance,并认为,在这11个例子中,有6个可以与in单独形成密切关联的组合。这样一来,其R值是6/11=0.54,设定R值的理论范围在0—1之间,那么这个0.54的值表明,live in相当大程度上是组合性的。而believe in在所搜索的语料中总共出现了5个有意义的组合,分别是witchcraft, God, Jesus, devil and paradise,但其中没有一个能单独同in形成共享,所以,它的R值就是0/5=0。这意味着,believe in是非组合性中的一个典型例子。此处转引自Stefanie Wulff Rethinking Idiomaticity第41页的相关内容。

本文拟借鉴研究上的上述思路,以人民网中的《人民日报》报系为语料的收集对象语料收集对象为人民网中的《人民日报》《人民文摘》《人民日报海外版》《中国经济快讯周刊》《环球时报》《京华时报》《汽车族》。语料时间为2006.1.28—2011.7.1。,选取“红头文件”“走弯路”“走(开、留……)后门”“开门见山”等作为观察目标,尝试着就它们的固定性进行另一种方式的表述。