四、结 语
“开谈不说《红楼梦》,读尽诗书也枉然。”(14)《红楼梦》在中国古典小说中的地位之高,鲜有能与之匹敌者。然而,对其作者的争议从清代以来一直未曾断绝,并且常论常新。本文在前人工作的基础上,从计量风格学的角度出发:
1. 定量统计《红楼梦》整部小说中词长分布,并计算了平均词长,词长变化程度,发现前八十回在一字词的使用频率上高于后四十回,而在二字词的使用上则低于后四十回,同时平均词长、词长离散度也比后四十回要低,反映出前八十回的文本长词较少、可读性较强,并且语言变化较小。
2. 统计了《红楼梦》全部实词和虚词,并且对使用频率最高的6类实词和全部虚词在每十回中的使用情况进行了比较,发现后四十回在名词、动词、副词、助词、语气词上的使用频率要远远高于前八十回,而在数词、量词上要远远低于前八十回;并且,前八十回中,大部分章回的代词与形容词使用频率也高于后四十回,而前八十回内部的差异并不显著。同时,通过k-means聚类,发现前八十回与后四十回在所选的11种词类整体使用上具有明显的差异,并且前八十回与后四十回内部的差异较小;这些差异的产生,反映出前八十回更加注意人物、场景的细腻描写,更加重视细节的描绘,以增强小说的真实性;而后四十回则更加重视动作的描写。
3. 对所选择的41个虚词在前八十回与后四十回两个整体中的使用情况分别进行了检验,结果显示,所选的每个虚词在两个整体中的使用情况都具有明显的差异,并且前八十回的作者在文言虚词的使用频率上较高,而后四十回则更倾向于使用白话虚词。
4. 统计了前、中、后四十回三个部分以及三个部分两两组合成为八十回的独有词语,结果显示,后四十回独有的词语少于前四十回与中四十回,而前八十回独有的词语多于后八十回以及前、后四十回组成的八十回,反映出后四十回新出现的词较少,前四十回与中四十回在用词的连贯性上较高。
5. 进一步,统计了每十回的前300个高频词,并通过层次聚类,发现前八十回与后四十回在这些高频词的整体使用上差异较大。对前八十回与后四十回前三百个高频词进行了比较,发现二者各自独有的词语既反映了前八十回与后四十回作者在使用虚词上的差异,又从一定程度上反映了内容上的差异:前八十回主要描写贾府中富足、康泰、钟鸣鼎食的生活,而后四十回则对风雨飘摇中贾府进行了叙述。
总而言之,与前人主要从虚词或者部分特殊词语的角度采用分类或聚类的方法对《红楼梦》前八十回与后四十回关系考察不同,本文除使用假设检验对前人惯常使用的虚词特征进行考察外,还从前人较少涉及的词长、词类、高频词、各部分独有词等多个角度,系统运用频率统计、数据归一化、数据标准化、层次聚类、k-means聚类等多种方法,并且通过直方图、折线图、层次聚类图以及划分聚类图等多种形式将这些差异形象地描绘出来。这些差异,充分说明了前八十回与后四十回并非一人所作。
本文的工作从字、词、词类等层面说明了前八十回与后四十回的作者并非一人,下一步的工作可以句法、语义、语篇的层面进行,对《红楼梦》的风格进行研究,进而探究后四十回与前八十回之关系,推动《红楼梦》作者归属研究的发展。
(原载《红楼梦学刊》,2014年第4期)
(1) 陈炳藻:《从词汇上的统计论〈红楼梦〉的作者问题》,转引自施建军:《关于以〈红楼梦〉120回为样本进行其作者聚类分析的可信度问题研究》,《红楼梦学刊》,2010年第5辑。
(2) 陈大康:《从数理语言学看后四十回的作者——与陈炳藻先生商榷》,《红楼梦学刊》,1987年第1辑。
(3) 张卫东,刘丽川:《〈红楼梦〉前八十回与后四十回语言风格差异初探》,《深圳大学学报》(人文社会科学版),1986年第1期。
(4) 李贤平:《〈红楼梦〉成书新说》,《复旦学报》(社会科学版),1987年第5期。
(5) 施建军:《基于支持向量机技术的〈红楼梦〉作者研究》,《红楼梦学刊》,2011年第5辑。
(6) 韦博成:《〈红楼梦〉前80回与后40回某些文风差异的统计分析(两个独立二项总体等价性检验的一个应用)》,《应用概率统计》,2009年第4期。
(7) 李敏杰,朱薇:《基于平行语料库的〈红楼梦〉英译本文体风格研究》,《中南民族大学学报》(人文社会科学版),2012年第2期。
(8) 韩宝成:《外语教学科研中的统计方法》,北京,外语教学与研究出版社,2000,第64~65页。
(9) [美]道格拉斯·比伯,苏珊·康拉德,兰迪·瑞潘著:《语料库语言学》,刘颖、胡海涛译,北京,清华大学出版社,2012,第43页。
(10) 实词包括:名词(n)、动词(v)、形容词(a)、代词(r)、数词(m)、量词(q)、方位词(f)、处所词(s)、时间词(t)、区别词(b)。实词和虚词所包含的词类,见朱德熙《语法讲义》,商务印书馆1982年版,第40页。
(11)(12)(13) Jiawei Han, Micheline Kamber, JianPei:《数据挖掘:概念与技术》,范明、孟小峰译,北京,机械工业出版社,2012,第276页、第291页、第293页。
(14) 出自得舆《草珠一串·之一》,转引自林冠夫:《红楼梦纵横谈》,北京,文化艺术出版社,2005,第9页。