第二节 研制步骤与数据处理
一、研制步骤
转载排名的研制工作主要包括整理和规范基础数据,组织专家在线论文评分,制作排名表并核查数据和撰写转载排名报告四个步骤。
1.整理和规范基础数据
需要整理和规范的数据包括如下四类(数据处理规则详见本节第二部分):
(1)复印报刊资料学术专题刊数据。整理和规范复印报刊资料专题,确定复印报刊资料系列刊中哪些为学术专题刊。只有被学术专题刊全文转载的论文才计入转载排名的转载量中。
(2)论文基本信息。整理和规范被复印报刊资料转载论文的主标题、副标题、作者、作者机构、原发期刊及其版别、原发刊期、转载专题号、转载专题名称等信息,确保其规范化和标准化。
(3)作者机构数据。修改、规范与补充复印报刊资料转载论文作者的机构信息(一级单位和所属机构),确保作者机构信息的完整性、准确性、规范性和标准化。
(4)期刊基本信息。整理和规范被复印报刊资料转载论文涉及的原发期刊名称、版别、国际刊号、国内刊号、报刊品种、是否核心期刊、是否重点期刊、期刊出版地、发文数、主办单位及其所属系统、特色院校等信息,确保这些期刊的基本信息完整、准确、规范和标准化。
2.组织专家在线论文评分
在整理和规范数据后,依据评价研究中心研制的“人文社科论文质量评估指标体系实施方案”[1],组织复印报刊资料编辑和顾问等同行专家,在人文社科论文质量评估系统中,对每篇论文的学术创新程度、论证完备程度、社会价值、难易程度四个方面进行评分,指标的含义与评估内容见表1-1。
表1-1 同行评议指标的含义与评估内容
除以上四个主要指标外,同行评议指标还包括课题立项和发表载体两个辅助指标,这两个指标与论文质量密切相关,体现了论文形成和发表过程中同行专家的评估意见,由评估系统按客观数据直接赋分。
课题立项是指资助单位所处的层级,包括国家级(21分)、省部级(14分)、其他立项(8分)、无立项(1分)四种。国际、横向和商业项目,将由评委根据实际情况,确定相应等级。由于国际项目较少,不再单独设置细分等级,根据国际资助机构层级,归入国家级、省部级或其他立项;高等院校研究基金资助项目,统一归入“其他立项”。
发表载体是指论文发表当年被认定的报刊分级结果,包括核心报刊(21分)和非核心报刊(11分)。2018年转载排名的核心报刊指以下四大评估体系中任何一个体系所认定的报刊:(1)北京大学《中文核心期刊要目总览》(2017);(2)南京大学CSSCI来源期刊(2017—2018);(3)《中国人文社会科学核心期刊要览》(2013);(4)复印报刊资料重要转载来源期刊(2017)。
在人文社科论文质量评估系统中,论文的刊载报刊信息、所属学科、作者机构名称、评价指标权重等已实现了标准化的元数据管理,还可以通过统计算法辅助评委了解评分分布情况,修正不同评委的不合理评分,完成论文总分的合成计算,自动计算形成每篇论文各项指标的得分和总分。
3.制作排名数据表并核查数据
人文社科论文质量评估系统不仅提供了所有被转载论文的按指标得分,还自动统计了期刊和作者机构的转载量、转载率、篇均分、综合指数等数据。我们按照一系列数据处理规则和制表要求(详见本节第二部分),从人文社科论文质量评估系统中导出数据用以制作排名发布的基础数据表。经过对基础数据表进行反复核查,并提供给熟知相关领域学术期刊和机构发展状况的复印报刊资料编辑和顾问审议,最后分别形成期刊或作者机构的转载量排名表、转载率排名表和综合指数排名表。
4.撰写转载排名报告
通过对转载数据的统计分析,确定每年转载排名报告的主题,撰写复印报刊资料转载系列年度研究报告,探讨当年中国人文社会科学期刊和学术机构学术布局、学术创新态势、竞争合作状况等呈现的新特征,为人文社会科学的研究和发展提供参考。2018年的研究报告关注“双一流”建设高校的转载情况,就从整体转载格局到多个学科的转载分布进行了深入的探讨与分析。
二、数据处理
如前所述,我们选取复印报刊资料95种学术专题刊,以每年1—12月全文转载原发期刊学术论文的转载数据和评分数据作为研制转载排名的数据样本。受发行周期和编辑出版过程的影响,原发期刊当年刊发的文章,有一部分被选入下年的复印报刊资料中,因此,每年发布的转载排名数据都以复印报刊资料出版年而非原发期刊的出版年为准。
2018年共有1 300余种原发期刊(不含报纸内刊)被复印报刊资料转载。因为一种期刊被转载1篇或2篇论文的情况具有较大的偶然性和随机性,统计意义不大,并且被转载论文数量呈现出集聚趋势,即约25%的学术期刊被转载了约85%的学术论文,所以我们选取2018年中被复印报刊资料转载论文不少于3篇的期刊和机构作为进入排行榜的基本标准。2018年期刊排名发布数量遵循以下规则:综合性期刊、三大系统前100名或前30名,各学科期刊前50名、前30名、前20名、前15名或前10名,基础教育教学类期刊综合性与专业性共排60名。[2]
在统计转载数和发文数、处理论文分数和排名次序时,遵循以下原则:
(1)严格按国家新闻出版广电总局批准的正式刊号逐一统计。对于一号多版的期刊,转载数、发文数一律合并计算,如《美与时代·创意》《美与时代·美术学刊》《美与时代·Beauty》均为同一刊号的不同版本,合并计算其转载数及发文数;对同一家学报有两个刊号、两个版的情况,发文数分开计算,如《华东师范大学学报(哲学社会科学版)》和《华东师范大学学报(教育科学版)》分别拥有各自的刊号,因而分别计算各自的转载数和发文数。
(2)增刊论文不在统计范围内。
(3)对于图书、报纸上发表的论文,不纳入期刊排名的转载量统计。
(4)集刊纳入期刊排名,在排名表中用标记“*”标识。
(5)剔除会议消息、报道、花絮、补白等明显的非学术性文章。
(6)被复印报刊资料不同专题刊重复转载的论文,转载量不重复计算,在各学科期刊或机构排名时,取论文最高得分。
(7)在同一种期刊上的论文被拆分为两篇及以上在不同刊期上发表时,转载量按复印报刊资料的实际转载量统计。
(8)若组文中的某篇论文的字数,处于复印报刊资料当年组文论文字数的后20%(含)或论文字数少于3 000字,则该组论文数相应减1;以此类推,若组文中的每篇论文都位于组文字数篇目的后20%或论文字数少于3 000字,则一组文章按1篇计算。
(9)复印报刊资料系列刊转载论文一般比原发期刊出版延迟3个月,如复印报刊资料2018年第1期转载的绝大部分论文是原发期刊2017年第10期刊发的论文,因此,期刊当年总发文数指上年10月至当年9月各期发文数之和。
(10)机构排名中,作者所属单位按照第一作者的第一单位进行统计。
(11)关于单篇论文得分,针对不同评委在按照指标体系对论文进行评分过程中容易出现松紧程度不一的情况,在计算期刊或机构的综合指数之前,首先通过数据修正公式,将同一评委对同一篇论文的打分,除以该论文平均值并乘以修正系数,以减少这一因素对评分结果的影响。[3]
(12)当期刊转载量相同时,按发文数从小到大排列(当转载量和发文数都相同时,按音序排列);当期刊排名榜的末尾出现并列名次且不能全部进入排名榜的范围时,删掉年发文数量相对较大的期刊;当期刊/机构的转载量、转载率或综合指数得分完全相同时,按音序排列。
注释:
[1]由中国人民大学人文社会科学学术成果评价研究中心研制的《人文社会科学论文质量评估指标体系及实施方案》,详见http://old.zlzx.org/files/otherFiles/2011rssi.pdf。
[2]因排名并列,部分数据稍有出入,下同。
[3]公式详情请参见《人文社科论文质量评估指标体系实施方案(试行)》,http://old.zlzx.org/files/otherFiles/2011rssi.pdf。