语料库驱动的短语配价型式研究
上QQ阅读APP看书,第一时间看更新

第一章 绪论

1.1 引言

半个多世纪前,第一个大型电子语料库——Brown语料库问世,其创建者W. Nelson Francis也首次正式使用corpus术语,用来指代大量语言材料的电子集成。1967年,Francis与Henry Kučera合作出版的《当今美式英语的计算分析》(Computational Analysis of Present-day American English),被称为现代语料库语言学(modern corpus linguistics)发展史上的里程碑。Brown语料库如星星之火,可以燎原,之后各类语料库像雨后春笋般涌现。到今天,语料库作为一种重要的语言资源和方法,已普及多个研究领域。而现代语料库语言学,经历了半个多世纪的风雨兼程,建构了系统的语言观、理论体系和方法论,发展成为一门成熟的学科,屹立于语言学研究之林。在语料库语言学领域也出现了许多著名专家,如John Sinclair、Geoffrey Leech、Susan Hunston、Wolfgang Tuebert、桂诗春、杨惠中等,他们的学术思想像一颗颗宝石,熠熠生辉、璀璨夺目。尤其是Sinclair提出的一系列宝贵思想和他开展的大量研究实践,奠定了现代语料库语言学的基石,Sinclair也因此被誉为现代语料库语言学之父。

然而,在语料库语言学发展初期,曾不乏质疑者和批评者。Chomsky(1962:159)曾这样批判语料库:“如果语料库收集自然发生的语言,那么它会是极尽扭曲的,描写这些语言只不过是做些列表罢了(The corpus,if natural,will be so wildly skewed that the description would be no more than a mere list)。”而语料库使用者对语料库语言学的认识也不一致,有人把它看成是方法,有人则强调其学科独立性。2008年的那场“训练营论战”(bootacamp debate)可谓争论的升级版,双方火药味十足。的确,随着学科队伍的壮大,各种学术思潮不断介入、相互激荡,语料库语言学也在发生着变化,变是客观存在,是必然,是发展的需求。但是,既要有变化,也要有传承,在变化中坚守,在传承中发展(甄凤超,2018)。语料库语言学无论怎么变化与发展,它的“根基”不会变,因为动摇了“根基”,就犹如沙上建塔,顷刻就会坍塌。笔者不揣浅陋,试从如下几点来谈谈对语料库语言学“根基”的认识,以飨读者。