关于我国新时期学术评价讨论的评述
在中国当代学术发展史上,学术评价是到新时期才出现的重要新现象(笔者这里说的学术评价是指专门的甚至是专业化的学术评价,至于隐性的、潜在的、零散的学术评价活动则可能早就有了)。在新时期,学术评价从其出现之日(大致在20世纪90年代中后期)起就伴随着不同意见和争论,进入21世纪以后学术评价问题在学术界引起了越来越多、越来越强烈的争论。学术评价及其讨论在新时期的学术发展中产生了重要的影响,且越到近期影响越大。经过细致考察和粗略梳理,笔者发现新时期关于学术评价问题的讨论主要是围绕下述五个方面的问题展开的。
关于学术评价的界定
什么是学术评价,学术界对于这个问题的解释和界定不尽相同。“百度百科”的解释是:“学术评价实际上就是要将学术研究成果排排坐吃果果,分成三六九等。学术评价的基本方法有两种,一是基于内容的学术评价,即基于学术发展的内在规律和学科本身的逻辑结构的评价方法;另一种是基于形式的评价方法,即游离于学术研究之外,客观描述学术研究成果的外在特征和学术成果之间的形式联系,从而描绘出学术研究的形式化图景,从而达到学术评估的目的。这两种方法显然有主次之分,但又是相辅相成的,基于内容的评价显然是一种最符合逻辑的评价,形式化评价本质上是基于内容分析的评价方法的一种工具和补充方法。”刘明的解释是:“现代意义上的学术评价,即由学术共同体主持,以学术水准为对象,以推动学术的继承与创新为目的,与资源配置相联系,与物质-精神激励相结合,与学者学衔-地位挂钩的学术评价。”刘明进一步分析说:“学术评价问题,说到底是个分配正义问题。所谓分配的正义,就是‘对物质、利益和社会责任的公平配置’。学术评价的目的,就是期望学术劳动能够得到与其贡献相当的正当的回报,包括职称的评聘、荣誉的授予及经费的资助,并赋予其相应的社会责任。这里的关键是,如何做出‘给予每个人以其应得的’的判断,如何进行‘分配’。”刘明在该书另一处还说:“所谓‘学术评价’,就是对于学术这一思想游戏的产品,做出优劣高下的评判。”叶继元的解释是:“根据全信息理论,任何信息和知识都可以分成形式(语法)、内容(语义)和效用(语用)三个要素。学术评价可以被理解成是对评价客体生产出的知识的量和质的评价问题,而质又可以从知识的内容(含义)和效用(价值)上反映出来,因此从知识的形式、内容、效用三要素可以推广出‘三位一体’的新概念组合:形式评价、内容评价和效用评价。”
上述三种关于学术评价的解释和界定,都有一定的科学性,都有其成立的理由,只是各有其侧重点。“百度百科”的界定侧重在学术评价的目的和结果,即要“分成三六九等”,并在此基础上分析了学术评价的两种主要方法;刘明的界定是从多方位进行的,包括学术评价的主体(“学术共同体”)、标准(“学术水准”)、目的和作用等方面,进而阐述了学术评价的实质;叶继元的定义引进全信息理论,试图把握住学术评价的本质特征。总之,“百度百科”的定义简洁、直观、通俗,刘明的定义具有描述性的特点,叶继元的定义较具学理性、理论性。
关于学术评价基本内容的论述
关于学术评价的基本内容(包括从哪些方面开展学术评价及如何开展学术评价等)的分析和论述甚多,也较为繁复,这里对应本文第一部分中关于学术评价界定的三种有代表性的观点依次分述如下。
如前所述,“百度百科”在关于学术评价的定义中已经指出了学术评价的基本方法有两种:一种是基于内容的学术评价,另一种是基于形式的学术评价。所以其关于学术评价基本内容的论述就是围绕这两点展开的。“百度百科”首先论述了基于内容的学术评价,写道:“基于内容的评价模式就是以学术成果的内容特征来评价学术成果。显然,基于内容的评价模式是最符合逻辑的学术评价方式。基于内容的评价模式的先决条件是评价人应该能够读懂和理解学术成果的内容,应该对相关的学术领域有深刻的了解和非凡的洞察力。而要满足这样的条件,评价人非该领域的专家莫属。所以,基于内容的学术评价本质上就是专家评价,或同行评价。许多学术刊物采用的专家审稿就是一种典型的基于内容的学术评价方式。”“百度百科”接着说:“在各种基于内容的学术评价方法中,最典型的评价模式是学术综述,这是学术评价的最好方法。某一学科里的专家将近期这个领域里的研究情况作一总结,分析出某一时期本学科的重要进展和未来发展趋势,显而易见,这本身也是一种学术研究。”“百度百科”还分析说:基于内容的学术评价方法“也具有一定的局限性,主要体现在这种评价方法往往受到评议人主观因素的影响。基于内容的评价主要依托评价人对内容的理解,这往往受制于评价人学识、兴趣、情感等等个人因素的影响。这些因素会降低学术评价的准确性、公正性。为了尽量降低这种主观因素的影响,基于内容的评价往往需要多个评价人从不同的方面进行评价,就像一篇论文会有若干个专家评审一样,这样会有效降低主观因素对学术评价所产生的负面影响”。“百度百科”接着论述基于形式的学术评价,写道:“基于形式的学术评价和基于内容的评价方法相反,它主要利用学术研究成果的客观性参量来描述学术成果的客观特征及其与其他成果之间的相关关系,从而达到评价的目的。这些客观性参量主要包括三个方面:数量参量、聚类参量和关联参量。”“数量参量描述了学术成果的数量特征,即同一个研究者的相关研究成果的数量。”聚类参量“指的是学术成果是否聚类于相关的研究成果,这项指标描述了学术成果被同行认可的程度”。关联参量“是指学术研究成果与其他研究成果的相关关系,这个参数描述了该项研究成果对其他研究成果的影响,即描述了这项成果的影响力”。“研究成果的相关性指标主要是通过研究论文的引文特征表征出来的。我们知道,一个符合学术规范的研究论文总有引文部分来指示该论文和其他论文的逻辑关系,这是现代学术研究的基本范式。”
刘明在《学术评价制度批判》中先分析了学术评价的特点和施行时的困难,然后说:“人文社会科学的研究总是受到特定的文化传统和社会环境的制约,其成果的非实验性、范式的多重性,内行与外行界线模糊,使这种专业活动在谋求实体正义方面产生了更大的困难。因此,关注结果的实体正义不得不退居其次,而程序正义的重要性如是而彰显出来。”接下来,刘明分析说:“学术评价作为学术活动的重要方面,它的开展取决于两个要素,一是评价制度,二是评价者。两者的关系类似于法律和道德的关系。国家的治理首先要有一部良法,而法律需要人去执行,所以执法者的道德对于法治的实现也有重要意义,不过两者不能等量齐观。法毕竟是第一位的,道德则只是与执法者的自由裁量权相联系。同样,公正公平的学术评价活动的开展,首先需要我们制定一套好的制度,好的制度本身就意味着,只有那些既具公信力又具鉴别力的学者才有资格出任评价者的角色,而且会预设一系列机制,以防范评价者滥用公共权力。在此前提下,要求学者具有超出一般民众的道德操守,才能保证良性的评价制度的实施。”刘明继续具体分析说:“需要建构一个以学术评价制度为中心的三圈层制度研究体系:最内圈是核心层,即学术评价制度本身,它包括三个侧面,即宏观的学术机构评价,中观的学者评价,及微观的学术成果评价;中圈是环境层,即学术活动的内环境,它包括学术理念、学术机构的权力结构、学科结构与教学模式,等等;外圈是社会层,即学术活动发生的社会政治经济结构、意识形态取向、文化背景与道德状况,等等。”
叶继元根据他自己所界定的学术评价是形式评价、内容评价和效用评价“三位一体”的观点,在《概念创新是构建合理学术评价体系的基础》一文中依次对形式评价、内容评价和效用评价进行了分析。叶继元说:“所谓形式评价是指评价主体对评价客体内含知识的外部特征的评价,它既包含同行的定性评价,也包含定量评价,但最终的评价可用数字、数据反映,包括发表论著数、被引用数、被文摘量、获奖数、发表字数、获专利数、发表成果的级别、院士和教授人数等。形式评价也有同行评价,但不是直接对评价对象内容质量、效用的评价,而是与内容质量、效用评价有密切关联,它在一定程度上可以反映评价对象的知识含量,是一种简单易行、粗略、可测试、可核实的评价。根据一定的评价目的,如对成果一般性、非精确地评价,或对宏观、中观总体的估价(直接的评价因工作量太大不可能进行),此种评价是有效的,或是最不坏的评价方法。”“所谓内容评价是指评价主体对评价客体内含知识的本身特征的评价,由同行专家通过直接观察、阅读、讨论来进行。为了计算的方便,可能也会将定性评价转换成数字,但最终的评价通常用文字或数字加文字来反映……它是针对某一评价目的对知识内容的逻辑性、合理性、价值等的直接评价,是一种费时费力测试,核实更花时间,但却精细、较为可信、可靠的评价。”“所谓效用评价是指实践、时间、历史对评价客体实际作用、价值的验证或最终评价。它既强调用一段时间、有限的实践、已有的历史事实来评价,更注重长时间、更多实践和事实的评价。它既依赖于学术共同体的评价(因学术共同体最能认定实践,事实的意义),但又有独立性,不以任何人的主观意志为转移。在社会科学领域,其效用常表现为被社会机构作为有关政策、措施出台的依据,以及这些政策、措施实施后的结果;在人文学科,其效用则常表现为精神产品及其对人们思想、观念、社会风气、舆论等产生的作用。由于此种评价包含着无限的过程,因此它是一种‘进行时’加上‘未完成时’。”叶继元进一步分析说:“目前应用于人文社会科学的三种基本评价方法:文献计量方法、同行评议法和实践、时间最终评价法,大体可分别对应于形式评价、内容评价和效用评价。这三种学术评价都不同程度地包含定性定量评价,因此从定性还是定量的角度,很难说清文献计量方法、同行评议法和实践、时间最终评价法这三种方法的优劣和适当的使用范围,但用形式评价、内容评价和效用评价来解释则容易很多。”“只有学术共同体才有资格进行学术评价的命题是成立的,它与文献计量学的评价、定量评价不是‘二元’对立的关系……同理,那种将同行评价与实践、历史、时间最终评价对立的观点也是片面的,同行专家在最终评价中也发挥着主导作用,因为具有求真务实精神和专业知识的特质,使得同行专家在长时间的历史河流中比社会大众更能看清‘实践’的意义,更能识别非共识成果是否真的具有创新性。”
综合比较上述三种观点,可以看出,“百度百科”提出的“基于内容的学术评价”和“基于形式的学术评价”的观点,是学术界较早的、通常的、具有较普遍影响的看法;刘明在提出“评价制度”和“评价者”这两个作为前提的要素基础上,进而提出要建立“以学术评价制度为中心的三圈层制度”的观点,颇具创新性,也颇具学理意义;叶继元提出的形式评价、内容评价和效用评价“三位一体”的观点,既具创新性、学理性,也具有较强的可操作性。
关于新时期学术评价弊端的批评
如何看待和评价新时期学术评价的实际情况和实际效果,是一个争论甚为激烈的问题,以笔者的观察,从总体上看,可以说否定评价多于肯定评价,或者说批评看法多于表扬看法。考虑到批评新时期学术评价弊端方面的材料甚多,下面仿照抽样调查的方法,以两年左右为一个时段,抽取21世纪以来(实际也是新时期以来)若干有代表性的观点来做简略评述。
21世纪以来(实际也是新时期以来)较早对现行学术评价方法提出批评性看法的时间,可能是2000年(2000年既有人把它看作20世纪或者说上一个千年的最后一年,也有人将它看作新世纪、新千年的开始,笔者在这里将其模糊化)。《光明日报》2000年9月5日发表了学术随笔《谈谈科研成果的衡量》(王泽华),该文还没有直接使用“学术评价”这一术语,但其标题和文中所说的“科研成果的衡量”的内涵就类似于我们后来所说的“学术评价”。该文开头写道:“学术规范是一个关系科研成果的度量衡问题,而且更是如何培养良好学风、造就高素质科研人员的关键性问题,因此,应引起高度重视。借鉴国际学术规范的一些做法,应注意矫正与防止以下几个方面的问题。”我们要注意该文中使用的“矫正”与“防止”这两个词语,“防止”是针对未来说的,而“矫正”则是针对已发生的事情说的,就是说该文已开始对“科研成果的衡量”(学术评价)方面的问题提出了批评。该文接下来从三个方面谈了需要“矫正”与“防止”的问题,其中的每一个问题都与学术评价相关联。该文认为,需要“矫正”与“防止”的三个问题依次是:“重潜心研究科研成果,轻视价值评估体系”;“重获奖,轻同行专家评语与专家应用率、转载率”;“重成果申报立项与发表,轻成果后期的社会转化率”。从以上的引述中可以看出,后来比较严重的学术评价方面的问题有一些在当时已出现了端倪,并且已受到批评。
新时期较早对现行学术评价制度和方法明确提出批评的是李文海、张岂之等学者。《光明日报》2002年3月19日在《学界话题》专栏发表了《浮躁:学术创新的大敌——四教授畅谈学风问题》(主持人危兆盖,四教授分别为李文海、张岂之、章开沅、龚书铎),在“学风浮躁的原因”这个小标题下,李文海分析说:“近几年学风浮躁问题之所以愈演愈烈,决非偶然。它既与学者个人的学术素养、学术品格有关,也与社会的环境、氛围有关,还与我们当前的人文心态和管理体制有关。我先谈点社会因素。对于当前的人文社会科学评估办法,学术界早就有不同的声音,很多人认为,当前的评估办法在一定程度上助长了学风浮躁。现在的评估体系、评价标准,很多是从工程建设或者是从工科那里简单搬过来的,没有考虑到人文社会科学的特点和人文社会科学建设的客观规律。因此,我认为,对于酿成学风浮躁的社会因素要高度重视。”张岂之紧接着说:“学风浮躁的原因确实很复杂,我以为主要有五个方面。第一,人文社会科学评估体系存在明显缺陷。其表现,一是注重数量而不重质量,这就导致一些学人特别是中青年学人追求速度,而很难保持一种厚积薄发的治学心境。二是还没有找到一种公正、合理、科学的评估机制。三是学术界的商业炒作也给学术的健康发展带来危害。因此,如何建立一种适合我国人文社会科学实际的评估体系已非常迫切,需要学界共同研究。”“四是学术道德本是治学的起码要求,但就目前情形而言,学术道德还没有成为学人的普遍自觉行为,一些学人的学术道德自律做得很不够。”“五是我们当前还缺少一个让人潜心研究的学术环境……其一,我们每年都必须有若干论文发表,否则就填不好各种‘表’,显示不出研究成绩,因此谁还能坚持‘十年磨一剑’?五年磨一剑都不行。其二,教育行政管理机构每年都设有各种各样的‘申请’,申请成功还要接受各种检查、评审,研究者自然要为此耗心费力,哪里还能坚持独立的学术研究?”李文海、张岂之这里使用的词语还是“学术评估”,他们当时讲的“学术评估”就是我们今天所说的“学术评价”,两人不约而同地指出,“学风浮躁”(如果借用今天流行的概念应该称之为“学术腐败”)产生的重要原因之一是“当前的人文社会科学评估办法”(张岂之称之为“人文社会科学评估体系”)“存在明显缺陷”。不过,上述对于“当前的人文社会科学评估办法”缺陷的批评还是放在批评“学风浮躁”的大题目之下,似乎还不能称之为对现行学术评价制度和方法缺陷的专题批评。
《光明日报》2004年9月17日《光明视点》专栏发表的该报记者曹建文的访谈《学术研究:从“失范”到“规范”》,可以看作较早对现行学术评价制度和方法缺陷提出专题批评的有代表性的文章。该文共有四个小标题,其中第三个小标题是“学术评价体制亟待改进”(批评学术评价方面的问题已经进入标题)。该小标题下的内容引述了纪宝成、杨玉圣、温儒敏、张保生四位学者的观点,其中写道:“纪宝成教授曾在媒体上表示,目前的学术评价体制存在着一些亟待改进的弊端。并认为要防范学术失范行为、进一步发展和繁荣哲学社会科学,就亟须建立一套能够体现学术内在发展规律的学术评价机制,营造一个有利于人才脱颖而出的社会学术氛围,使得那些在本学科取得奠基性、开创性和前沿性成果的创新人才得到应有的学术荣誉和价值肯定。”杨玉圣的观点是:“目前的学术评价机制确实存在一些问题和弊端,比如评职称,要求数量、学位,出多少书,有多少获奖成果、项目等,如果按这个标准,已故的学界泰斗钟敬文先生现在要评个教授都会很难了,这岂不是荒谬之极?”“温儒敏教授也认为目前的学术评价机制确实有值得检讨改进的地方。”此前不久,2004年7月9日《人民日报》(海外版)发表了《科技论文:数量多而质量差》(康文华、张黛微)一文,该文指出:“论文数量增加和科技竞争力落后形成明显反差,反映出我们的科技成果评价体系和人才培养机制还存在问题。一个博士生能否答辩和取得学位,首先考察的是在规定的学术刊物上发表论文的数量,而对这些论文的水平、质量和他的实际科技创新能力却缺乏客观的评价标准。这种用简单的数量作为评价标准,会把许多具有创新性、创新意欲的青年扼杀在一个封闭的空间里。”该文批评的矛头也是直指现行的学术评价机制。
对现行学术评价制度和方法的批评一直没有停止,且有越来越多、越来越激烈的趋势。黄安年在《云梦学刊》2006年第2期上发表了《违背学术规律,漠视个性与人性——评目前高校流行的“量化”管理制》一文,从题目上看其措辞就比四年前的李文海、张岂之激烈多了,且也比两年前的纪宝成、杨玉圣、温儒敏他们言辞激烈,但可以说是基本符合实际并抓住了问题的实质的。黄文写道:“‘一刀切’的数字量化模式下,就必然出现只管数量不顾质量、见物不见人的异化现象,从而有悖于学术的健康发展。把学术管理的标准化等同于一刀切,就可能完全忽视个性化、多元化和人性化,不顾不同学术领域、不同学校、不同单位和不同个人、不同时间的区别,其结果是加剧了本已矛盾激化的人际关系,搅乱了学术和教育工作,使得学术领域更加不和谐,而且从根本上损害了学术事业本身。”“鉴于现行‘一刀切’学术机制绝大部分是教育行政主管部门和各大学自上而下推行的,具有明显的有利于官方行政管理的机制,因而称之为学术行政化、官僚化,并不为过。”“如学术机构的管理衙门化;职称评定、项目立项、评奖活动中的‘赛跑’现象;学术评价中的官僚主义和形式主义;政府官员兼任学术项目主持人日益增多;政府官员兼任院校长的现象有增无减;学术刊物主编官员化倾向突出……”黄文对“量化”管理制的批评,包括了(或者说主要是)对“量化”学术评价机制的批评。刘明在《学术评价制度批判》中对现行学术评价定量化取向具体分析后概括出八大弊端,依次是:“激励短期行为”“助长本位主义”“强化长官意志”“滋生学术掮客”“扼杀学者个性”“推动全民学术”“诱发资源外流”“误识良莠人才”。应该说,刘明的概括是比较深入、全面的,也是比较客观的。
2008年,任继愈、陈平原等学者继续对现行学术评价制度和方法进行批评。《光明日报》2008年1月30日发表该报记者王庆环的采访报道《著名学者呼唤扎实学术风气》,报道中有“让人堪忧的学术风气”“现行学术体制需要反思”两个小标题。在第二个小标题里,王庆环首先引述了任继愈的看法:“就人文学科而言,用理工科的方法管理文科,动辄要求发表多少文章,不太科学。文科人才不像工程师那样,很快就能培养出来,他需要一个比较漫长的成长时间,文科的学问要强调坐冷板凳,要十年磨一剑,这样才能既做了学问,又培养了人才。”其后,该文又引述了陈平原的话,“严绍璗教授取得的成绩,让我们反思目前的学术体制。看看一二十年来的好的学术著作,都和以下几个因素关联:个人、长期经营、没有资助或极少资助。紧赶着出来的东西,没有太好的。反观我们的学术奖励机制,在理工、社会、人文三类学科中,最不适应这一机制的是人文学科。目前我们的学术奖励机制一般都是采取事先资助,为了得到资助,很多学者们不得不把大量的功夫花在申报项目和做项目计划上,没有项目也得想出项目来,是紧赶着做学问。但人文学科中有另外一种学者,他们不会事先有课题,是一步步按照兴趣做出来的,对这种比较低调、慢热型的学者,我们的激励机制应该考虑在事后给予物质上的奖励,这样大家才可能二十年磨一剑,否则的话,大家都会‘短平快’。而北大这些年来还能做出一些事来,是因为针对人文学科的特点,北大采取了不是非常严格的学术评价机制”。任继愈、陈平原两位学者的用语比较温和,但批评现行的学术评价机制的态度是鲜明的。《人民日报》2008年3月26日“文化新闻”版发表纪宝成的文章《大学评估太多了》,纪文用如下三个小标题来表达他的看法:“第一,评估太多太滥,缺乏总体设计”;“第二,教育评估体系、方法单一,拉不开差距”;“第三,评估造假,敷衍了事”。纪文虽然谈的是大学评估,但这个问题和学术评价问题是无法分开的,在一定意义上,也可以说这是关于学术评价问题的看法。
2010年前后,学术界对现行学术评价制度和方法问题的批评更为全面、激烈,在一定意义上也可以说更显力度和深度。2010年,笔者与袁玉立在《学术界》第7期上发表《学术不端与学术规范、学术管理对谈》一文,提出了“学术评价过度症”的命题,指出:“近年来,我国学术失范、不端乃至学术腐败的事件不断出现,有着多方面的、深层的原因,这已有很多人进行了探讨,为避免重复,我这里只想指出其中特别重要而又较少有人注意到的一点,那就是近年来存在的越来越严重的‘学术评价过度症’,其严重程度与早些年公路的‘三乱’(乱设卡、乱收费、乱罚款)相比,有过之而无不及……现在的情况真正像复旦大学校长杨玉良最近接受《中国青年报》记者采访时所批评的那样,‘校园鼓乐齐鸣’、‘闹哄哄’的。因此,我把这种现象概括为‘学术评价过度症’,我自认为是非常准确的。”我们在文中将“学术评价过度症”的具体表现总结为如下几个方面:“一是过分量化。……现在的问题是让量化走向了极端,给人的感觉是:学术评价就是量化,量化就是学术评价;学术水平就是数字,数字就是学术水平。……在高校管理界的眼中便是:学术统计数字就是政绩,政绩就是学术统计数字。这样,病态的‘数字崇拜’、数字(学术)泡沫就自然地产生了。”“二是时间周期上过分短暂。……这是学术评价上的急功近利所致,其作用是导致人们更加急功近利,形成恶性循环,致使学术界的学术风气越来越浮躁。”“三是量化指标体系主观化、行政化。指标体系的设计首先不是着眼于尊重学术自身的特质和特点,而是首先考虑评价者操作的方便和领导掌握情况的方便,首先考虑追求政绩的需要。”“四是已经造成了非常不良的负面效果。其最严重的后果是颠覆了学术研究的本来目的。学术研究的本来目的是发现本质,探索规律,追求真理,但在学术评价过度症的高压、逼迫之下,学术研究被异化成主要是为了迎合评价体系、追求评价指标、打造政绩的行政行为,评价不但成了学术研究的指挥棒、导航灯,而且成了学术研究的出发点和终极目的,甚至成为一些学者进行学术研究的终极价值追求,学术研究的神圣性和学者献身学术的崇高性被完全消解。其直接效果是导致了越来越严重的学风浮躁、学术泡沫乃至学术腐败,造成的结果是,评价(评估)热热闹闹,各项指标、数据不断膨胀,真正的学术研究则是越来越受伤害。”
关于“CSSCI”的争论
关于“CSSCI”的争论,是新时期关于学术评价问题讨论的典型个案,或者说是新时期关于学术评价问题讨论的特别重要的组成部分,它与新时期关于学术评价问题的讨论紧密相关,或者说交融在一起,但又具有相对的独立性。因此,笔者将其单独作为一个重要问题来评述。
笔者在此先提供一点相关背景资料。据《光明日报》2000年6月1日发表的《〈中文社会科学引文索引〉面世》(记者宋喜群)报道,5月31日上午,由南京大学和香港科技大学共同研制、开发的《中文社会科学引文索引》(CSSCI)光盘在京首发。文中说:“引文索引思想最早在1955年由美国学者加菲尔德提出,有力地推动了科研工作的发展。南京大学根据当前中文信息资源建设的现状和信息服务的需要,于1997年底提出了研制开发电子版《中文社会科学引文索引》的设想,并于1998年在南京大学正式立项,1999年4月南京大学与香港科技大学签订了共同研制开发的协议,同年8月该课题被列为教育部重大项目。”此后,《中文社会科学引文索引》每隔几年出版一个新的版本,每次出版都引来了不小的争论。2010年1月,2010~2011年度《中文社会科学引文索引(CSSCI)来源期刊》的出版,更是引起了颇为激烈的争论,可谓引发了一场“CSSCI 风波”(《人民日报》语)。
引发2010年前后这场影响甚大的“CSSCI 风波”的,首先是杨玉圣(学术批评网创办人暨主持人)2010年1月26日发表于学术批评网的文章《炮轰CSSCI(论纲)——兼论学术腐败》。杨文开头就尖锐地指出:“因为教育部实施学术GDP战略,强制在各高校推行以CSSCI发表文章为学术评价标准的权威指数,结果CSSCI成为‘学术界的窃国大盗’。”杨文接着说:“CSSCI是否‘学术界的窃国大盗’,姑且不论,因为仁者见仁、智者见智。但是,CSSCI确实是中国学术病态的写照。”接下去,杨文为“CSSCI确实是中国学术病态的写照”这一观点提出了四点立论理由(论纲)。其一,“在2010~2011年度CSSCI中,来源期刊有明显的地域偏向,即凡是南京地区的刊物应有尽有”;其二,“有一些受到广泛批评、以收费而昭著的刊物被收入。可是,一些受到学界广泛好评的学术刊物居然被排斥在该来源期刊之外”;其三,“2010 ~2011年度CSSCI,在学科分布方面,各大一级学科数量严重不平衡”;其四,“作为教育部委托南京大学中国社会科学研究评价中心主持研制的有关人文社科学术期刊评价的参考体系,如前所说, CSSCI业已异化为高校学术评价标准的权威(乃至唯一)指数”。同时,文中提到,CSSCI还成为某些单位“敛财的工具”。
杨文在学术批评网上发表后,学术批评网等接着发表了多篇讨论文章,大多对杨文的观点或表示支持或做引申论述。同时,一些重要学术报刊也发表了不少讨论文章。限于篇幅,这里仅列举《光明日报》和《人民日报》发表的两篇具有代表性的文章。《光明日报》2010年5月18日“理论周刊·学术”以整版篇幅发表了该报记者薄洁萍的文章《聚焦“中文社会科学引文索引”:不能承受之重》。薄文有深入的背景挖掘,有多位专家观点的引述,亦有记者自己的分析和评论。薄文包括以下四个部分,即“何谓CSSCI”“谁赋予了CSSCI魔力”“CSSCI的回归”“学术评价,谁主沉浮”。薄洁萍在“何谓CSSCI”部分写道:“CSSCI是‘中文社会科学引文索引’的英文缩写,由南京大学中国社会科学研究评价中心研制,它采用数据统计的客观指标,从文献计量学的角度为学术成果评价提供参照,揭示科研成果的实际影响力。”“引文索引的主要功能是进行文献检索和科学研究关系的分析,是为科学研究与发展提供文献资料的重要检索工具,同时不可避免地延伸出一定的评价和推介功能。”薄洁萍在“谁赋予了CSSCI魔力”部分写道:“在当前学术界自主性评价地位不强、评价制度不完善的情况下,各科研和教育主管部门、各高校简单地把来源期刊与优秀期刊画了等号,把期刊评价等同于论文评价,把引文数据、来源期刊作为论文评价、期刊评价、作者评价、学术机构评价的最重要甚至唯一的标准,所谓‘以刊评文’愈演愈烈。”薄洁萍在“CSSCI的回归”部分写道:“如果要将主要用于检索和分析的引文索引改造为专门用于评价的数据库,则要对引文的性质和深度进行加工,研制出信息和知识含量更大的数据库,如‘引文评价数据库’、‘多元指标评价数据库’、‘评价专家基本信息、评价意见数据库’等。”“不论编制出的引文评价库知识含量多么高,都是为同行专家评价提供帮助,都不能完全代替同行专家的评价。”“对CSSCI功能的认识,必须回归到它的设计者们最初的目的上,即还原到为科研和学术研究提供独特的文献服务这个层次上。”薄洁萍在“学术评价,谁主沉浮”部分写道:“对人文社会科学成果的评价是非常复杂的工作,作为一种价值判断和历史评判,无法做到完全客观但又必须寻求共识;既要调动和激发学者的积极性、创造性,又要尊重人文社会科学自身的发展规律。”“如何建立一个公正合理、科学完善的学术评价机制,如何切实促进人文社会科学研究、传播、管理、评价的良性循环,依然任重而道远。”由上述对薄文的摘引可以看出,薄文涉及了有关CSSCI争论的几个主要问题,论述冷静、客观,且其视野由关于CSSCI争论的重要个案进入对整个人文社会科学成果评价机制的探讨,可以看作对CSSCI争论问题的系统小结。
《人民日报》2010年7月30日发表了笔者《岂能“只认衣裳不认人”——“CSSCI风波”引发的思考》一文。笔者指出,我们不应该把注意力放在CSSCI本身是否科学和准确的问题上(虽然CSSCI在科学性、客观性、准确性等方面的确存在一些问题。比如,来源期刊、评价因子等都值得商榷),而应该看到,“作为‘CSSCI’研制方的南京大学中国社会科学研究评价中心只是一个科研机构,其主要工作是进行文献检索和科学研究关系分析,完全可以自主地开展研究,也完全可以根据所掌握的资料发布自己的观点和结论”。所以“问题的关键在于,它现在承担着重要的学术评价功能。所以,与其说人们对‘CSSCI’不满,不如说是对‘CSSCI’背后的学术评价机制存在质疑”。
接下来,笔者对CSSCI背后的学术评价机制问题进行了较为具体的分析和批评。文章写道:“当前,一些部门和科研机构对学术成果的评价过于简单化和平面化,片面地将某项数据作为基地评估、成果评奖、项目立项、学科与专业建设、人才培养等方面的考核指标,这在无形中产生了许多负面影响。从眼前来看,会造成学术界病态的‘学术评价崇拜’。比如,很多人眼睛只盯着‘CSSCI',使尽浑身解数使自己的文章上 ‘CSSCI',而在有意无意中忽视了论文的质量。而一些论文评价机构和评价者也不看论文质量如何,甚至完全不阅读论文,只在评基地、评项目、评职称时核对一下该论文是否发表在 ‘CSSCI’来源期刊上。这就造成了学术评价和学术活动中‘只认衣裳不认人’的弊端,即原本作为一种手段的学术评价机制反而成为学术研究的目的。从长远来看,过度抬高这种学术评价机制,有悖于学术研究的原初目的和终极追求,会消解学术研究的崇高性和严肃性。在过分重视学术评价的压力下,许多学者背离了独立思考、坚持真理的价值操守,主动迎合这种学术评价体系,结果造成原本是守护人类精神家园的人却失去了精神家园。这种学术评价机制,不论对学术还是对学者都是一种伤害。”可见,在笔者看来,“只认衣裳不认人”的弊端并非由CSSCI造成,而是当今的学术评价机制造成的。
关于改进学术评价的期待和建议
在正面讨论这个问题之前,笔者想先引用《光明日报》2004年6月27日《高校哲学社科研究出台首部学术规范》中的两段话,一段是:“刚刚成立的教育部社会科学委员会日前通过了《高等学校哲学社会科学研究学术规范》(以下简称《学术规范》),针对近年学界日渐盛行的造假、浮夸甚至剽窃、抄袭之风,这部学术活动的自律守则做出了明确而具体的制度约定。”另一段是:“对于学术评价,《学术规范》规定应以学术价值或社会效益为基本标准。对基础研究成果的评价,应以学术积累和学术创新为主要尺度;对应用研究成果的评价,应注意其社会效益或经济效益。学术评价机构应坚持程序公正,标准合理,采用同行专家评审制,实行回避制度、民主表决制度,建立结果公示和意见反馈机制。”上述文字是七年前写下的,可以说,对当时学术界状况的分析是客观的,关于学术评价机制的要求也是正确的。可是,我们十分遗憾地看到,《学术规范》出台后,学术评价方面的问题并未见减少,反而是越来越严重了。因此,笔者特别赞同前引薄洁萍所说的话:“如何建立一个公正合理、科学完善的学术评价机制……依然任重而道远。”应该肯定的是,薄洁萍所说的,是一种从现实出发的、实事求是的关于未来学术评价活动的分析和预测。
面对学术评价机制的种种问题和弊端,不少论者提出了积极的建议。黄安年在《违背学术规律,漠视个性与人性——评目前高校流行的“量化”管理制》一文的结尾,对如何建设和谐健康的学术研究新秩序提出了四点建议,其中第一点是:“尊重学术研究规律,实事求是,制定学术研究管理的规定和制度,促进有利于学术自身运行规律的学术机制,淡化和废止那些体现长官意志的量化举措。”这里的要点在于希望“淡化和废止”学术评价中的非科学的“量化举措”。《人民日报》2007年12月26日“文化新闻”版头条报道《学术造假拷问大学精神》(记者王有佳)的末尾写道:“有关专家认为,制度建设最关键。首先,建立科学的学术评价机制和激励机制,同时增加评审的公开性和透明度;其次,制定学术规范,加强学术自律;在法律层面,要加强对社会危害大的学术造假者的法律制裁。”这里把建立科学的学术评价机制和激励机制摆在了学术制度建设的第一位。笔者与袁玉立在《学术不端与学术规范、学术管理对谈》中,就如何克服高校现行学术评价机制的弊端、推动高校以及整个社会学术的良性发展问题,分别对教育管理部门、高校、学者三方面提出了建议。我们认为:“教育行政部门要坚决治理学术评价过度症!我的基本观点是,在目前学术生态平衡遭学术评价过度症严重破坏的现实情况下,必须下重药、猛药。我郑重建议:必须淡化、弱化学术评价,甚至建议暂停学术评价(比如暂停5~10年),以改良学术风气,恢复学术的生态平衡。在学术管理、学术评价方面,教育行政部门出台的政策越少越好,设的‘法’越少越好,折腾的越少越好。”“高校则要回归高校的本位、本色,即要把教学和学术研究作为自己的天职和永恒追求,要远离官本位,要抛弃单纯的‘行政’管理方式,要抛弃学术管理中的单纯的数字追求和数字攀比,真正尊重学术、尊重学者、尊重学术规律,逐渐恢复高校校园里宁静、纯洁、神圣、学术至上的氛围。”“学者要分流:‘官’学者要认真当好‘官’,即全力做好管理工作,不要以官谋学,对于管理者来说,管理就是自己的专业,管理就是自己的事业;真正的学者一定要为探索真理,追求真理而学术,一定要做有操守的学者,绝对不要把‘学术’当成升官的敲门砖。”
(原载《云梦学刊》2011年第2期,《高等学校文科学术文摘》2011年第3期、中国人民大学“复印报刊资料”《社会科学总论》2011年第2期转载)