现代汉语连词的语篇连接功能研究
上QQ阅读APP看书,第一时间看更新

0.3 语料来源

本书所使用的语料有书面语、口语以及留学生作文。

新闻是典型的书面语,因此书面语语料(以下简称“书面语”)选取的是《人民日报》(1998年1月份和2000年2月份),总字数为256万字。本书还以1997年的《作家文摘》作为书面语的补充语料。

口语语料(以下简称“口语”)指根据北京大学20世纪80年代调查的北京话口语整理而成的语料,是反映北京人日常生活的自然口语,共13万字。该口语语料不是严格意义的自然对话,因为采访者只是对被采访者提出问题,而采访者几乎不插话,不参与交谈,所以该口语语料接近于独白。对话体的口语语料为中央电视台的访谈节目《实话实说》《对话》的文本录音、情景电视连续剧《我爱我家》以及电话录音转写CallFriend[3],共170万字。

留学生作文语料来自北京语言大学留学生作文语料。该语料收集的留学生作文包括初级、中级和高级各个层次,单篇习作字数200~1500字,整个留学生作文语料的字数为25万字。

此外,书中有些例句来自北京大学中国语言学研究中心现代汉语语料库(以下简称“北大CCL”)及其他语料库,也注明了出处。对于部分内省语料,文中均注明“自编”。