【摘 要】[目的] 利用撤稿数据分析中国学者发表的国际科技论文被撤销的特征,找出近年来撤销论文数量增速快的主要原因,并提出相应的意见和建议。[方法] 以Retraction Watch数据库中国别为中国的5167条撤稿声明为研究对象,从撤销论文的撤稿原因、期刊来源、发表时间、撤稿时间、学科分类等方面,分别对科技期刊撤销论文和学术会议撤销论文的分布规律及特点进行分析和总结。[结果] 60%以上的科技期刊论文的撤稿原因是作者存在学术不端行为,95%以上的学术会议论文的撤稿原因是虚假同行评议。被撤销的学术会议论文中95%以上来源于2009—2011年在中国召开的国际学术会议。[结论] 建议加强国内举办国际学术会议的监管工作,规范论文审稿流程,建立健全学术不端行为惩戒机制,并纳入科研诚信档案。
【关键词】撤销论文;Retraction Watch;数据分析;科技期刊;学术会议
近年来,随着科技创新能力的大幅增强,主要的科技创新指标稳步提升,2018年中国学者发表的国际科技论文总量和被引频次稳居世界第二[1]。但同时,中国学者发表的科技论文多次被国际科技期刊撤销,引起社会广泛关注。通常来说,科技论文被撤销的主要原因是学术不端或者论文存在错误[2],是科研项目失败的明确证据,也可能对科学知识的演变产生影响[3]。相关研究机构和科技期刊对论文进行撤销处理,主要是为了维护学术声誉,保证科研质量,以免其对学术界产生更大的影响[4]。撤销论文的数量和频率代表了学术界自我净化的能力,是科技创新能力发展的重要指标[5],也是科研机构健康状况的重要指标之一。
对于撤稿现象及其产生原因,国内外学者从不同角度进行了一系列研究工作,取得了一定的研究成果。现有的研究内容主要包括撤销论文数量统计、撤销原因分析、撤销时滞[6]和引文影响计算[5]、撤稿作者处罚机制[7]等,这些研究分析的撤稿声明和论文数据来自国内外多个数据库,包括ScienceDirect数据库[8]、PubMed数据库[9]、Retraction Watch数据库[10]、Web of Science数据库[5]、中国知网(China National Knowledge Infrastructure,CNKI)数据库[6]等。在利用综合性数据库进行撤稿原因分析的研究中,将论文按照作者国别、所属领域[11]、发表期刊[12]进行划分,并分析撤稿原因的研究较多,而根据科技论文类型,区分科技期刊论文和学术会议论文撤销原因的研究较少。
本研究在上述研究的基础上,选择Retraction Watch数据库收录的撤销论文数据,分析中国作者科技期刊撤销论文和学术会议撤销论文特征,分析近年来撤销论文数量不断增加的主要原因,并提出相应的意见和建议。
1 研究方法与数据来源
Retraction Watch数据库收录从20世纪70年代至今超过18000篇撤销论文和会议摘要。本研究通过检索“国别”,筛选出从开始收录年限至2018年11月19日涉及中国作者的撤稿声明共计5167条,对这些撤稿数据进行清洗,抽取撤销论文的标题、作者、学科、发表期刊、出版商、撤稿原因、发表时间、撤稿时间、文章类型等相关数据字段,采用数理统计的方法对中国学者发表的国际科技论文撤稿现象进行分析。
2 结果与分析
2.1 撤销论文时间分布
通过对5167条撤稿声明的“期刊”和“文章类型”字段进行筛选,识别出科技期刊论文撤稿声明2292条,学术会议论文撤稿声明2875条,这些撤稿声明对应的撤销论文共计5124篇,其中科技期刊论文2249篇,占比43.89%,学术会议论文2875篇,占比56.11%;41篇科技期刊撤销论文有2——3条撤稿声明。
学术会议撤销论文的发表时间分布较为集中,2009—2011年发表的论文共计2740篇,占学术会议撤销论文总数的95.30%。
科技期刊撤销论文的发表时间分布如图1所示,科技期刊撤稿声明的发布时间分布如图2所示。

图1 科技期刊撤销论文的发表时间分布

图2 科技期刊撤稿声明的发布时间分布
中国最早出现科技期刊撤销论文的时间是1995年,这篇论文于2012年在爱思唯尔集团旗下的《代数杂志》上发表,因为剽窃被撤销。从图1和图2可以看出,2014年之前中国的撤销论文数量总体上呈现逐年增加的趋势,2014年之后撤销论文数量有所回落,但撤稿声明数量还是呈现增长的趋势,主要原因是论文从发表到被撤销存在一定的时滞。
撤稿时滞反映了学术界的自我净化效率,时滞越短,说明净化效率越高[6]。本研究根据5167条撤稿声明的发布时间和5124篇撤销论文的发表时间,分别对学术会议论文和科技期刊论文的撤稿时滞进行分析。
在2875条学术会议撤稿声明中,只有1条声明的发布时间早于论文发表时间,4条声明的发布时间与论文发表时间相同,利用剩下2870条撤稿声明计算学术会议论文的撤稿时滞,最长的撤稿时滞为6025天,最短的为10天,平均时滞为56天,标准差为125天。
在2292条科技期刊撤稿声明中,19条声明的发布时间早于论文发表时间,75条声明的发布时间与论文发表时间相同,利用剩下2198条撤稿声明计算科技期刊论文的撤稿时滞,最长的撤稿时滞为6025天,最短的为1天,平均时滞为667天,标准差为746天。
从计算结果可以看出,科技期刊论文撤稿声明的平均时滞大于学术会议论文,说明学术会议的自我净化效率更高,而且同一场学术会议的撤销论文绝大多数是在同一天撤回的。
2.2 撤稿原因分析
经统计,5167条撤稿声明中,Retraction Watch数据库共给出了85种撤稿原因,其中每条撤稿声明包含有1——8个不同的撤稿原因。因为存在一篇撤销论文有多条撤稿声明的现象,所以对同一篇论文在不同撤稿声明中的撤稿原因取并集处理。
根据数据库中对这些撤稿原因的描述,就85种撤稿原因进行归类,将其中50种描述详细、责任明确的撤稿原因归纳为7类。具体分类如下:(1)作者自我抄袭,包括重复的文章、文本、数据、图像等5种因为作者重复发表造成的撤稿;(2)抄袭其他作者,包括剽窃文章、文本、数据、图像等5种因为作者未经引用使用了其他作者内容造成的撤稿;(3)论文存在造假,包括伪造结果、数据、图像,以及操纵结果、图像等5种因为作者主观对论文内容造假造成的撤稿;(4)虚假同行评议,指作者有意不按照期刊的指导方针或道德标准进行同行评审造成的撤稿;(5)论文存在错误,包括结果、分析、方法、材料、文字、数据、图像错误,不可靠的结果、数据、图像,关于对结果、数据、图像、引用的担忧,结果不可重复等19种因为论文科学性问题造成的撤稿;(6)论文存在争议,包括作者、公司、第三方的反对意见,伪造作者,缺少作者、公司、第三方批准、版权声明、出版禁令等14种因为论文存在争议造成的撤稿;(7)作者违反政策,指作者违反了期刊、出版商或机构政策造成的撤稿。
2.2.1 科技期刊论文的撤稿原因分析
在2249篇科技期刊撤销论文中,撤销论文数量最多的科技期刊为医学期刊《肿瘤生物学》,共撤稿127篇,除2017年4月因论文作者编造审稿人和同行评审意见集中撤稿107篇外,剩余的论文是在2012—2016年间被撤销的。撤销论文数量最多的5种期刊及其撤销论文数量如表1所示。科技期刊论文撤稿原因统计如表2所示。
表1 撤销论文数量最多的5种科技期刊及其撤稿数量
期刊名称 | 撤稿数量 /篇 |
Tumor Biology | 127 |
Acta Crystallographica Section E | 124 |
PLoS ONE | 43 |
Molecular Biology Reports | 32 |
Biochemical and Biophysical Research Communications | 25 |
表2 科技期刊论文撤稿原因分类统计表
撤稿原因分类 | 撤稿声明数 /条 | 撤稿数量 /篇 | 撤稿原因占比 /% |
作者自我抄袭 | 519 | 515 | 22.90 |
抄袭其他作者 | 396 | 395 | 17.56 |
论文存在造假 | 199 | 194 | 8.63 |
虚假同行评议 | 367 | 360 | 16.01 |
论文存在错误 | 799 | 783 | 34.82 |
论文存在争议 | 444 | 439 | 19.52 |
作者违反政策 | 53 | 53 | 2.36 |
在上述撤稿原因分类中,“论文存在错误”可能并非作者主观恶意造成的,而是由于作者能力有限,但是如果撤销论文存在“作者自我抄袭”“抄袭其他作者”“论文存在造假”和“虚假同行评议”这4类原因中的任何一类,可认定作者存在学术不端行为。经统计,包含以上4类中任何一类撤稿原因的论文共计1357篇,占撤销论文总数的60.34%。由此可见,作者存在学术不端行为是科技期刊论文被撤销的主要原因,其次是因为论文存在错误,占34.82%。
2.2.2 学术会议论文的撤稿原因分析
2875篇学术会议论文涉及81个学术会议,95%以上的撤销论文来源于2009—2011年在中国召开的国际学术会议。有2739篇学术会议论文是由电器和电子工程协会(Institute of Electrical and Electronics Engineers,IEEE)撤销的,其撤稿原因是学术会议对同行评审和技术计划开发质量审核方面存疑,不符合IEEE对高质量出版物的标准。
在全部学术会议论文中,撤销论文数量最多的是2010年在山西太原举办的计算机应用与系统建模国际会议,共撤稿412篇。撤销论文数量排名前5的学术会议名称、举办城市和撤稿数量如表3所示。
表3 撤销论文数排名前5的学术会议
会议名称 | 举办城市 | 撤稿数量 /篇 |
2010 International Conference on Computer Application and System Modeling (ICCASM 2010) | 太原 | 412 |
2011 2nd International Conference on Artificial Intelligence, Management Science, and Electronic Commerce | 登封 | 402 |
2011 International Conference on E-Business and E-Government (ICEE) | 上海 | 317 |
2009 International Conference on Management and Service Science | 桂林 | 266 |
2011 International Conference on Business Management and Electronic Information | 广州 | 240 |
2.3 撤销论文学科分布
根据5124篇撤销论文的学科领域,统计出不同学科中的撤销论文数量并进行排序,共涉及117个学科领域,撤销论文数最多的20个学科分类如表4所示。
表4 撤销论文数量排名前20的学科分布
排序 | 学科分类 | 撤稿数量 /篇 |
1 | 数学 | 1145 |
2 | 学会/协会刊物 | 1067 |
3 | 商务经济 | 866 |
4 | 技术 | 771 |
5 | 企业管理 | 753 |
6 | 生物学-细胞 | 633 |
7 | 教育 | 557 |
8 | 遗传学 | 534 |
9 | 生物学-分子 | 535 |
10 | 计算机科学 | 462 |
11 | 生物学-癌症 | 442 |
12 | 商业-基础 | 373 |
13 | 化学 | 365 |
14 | 生物化学 | 353 |
15 | 医学肿瘤学 | 321 |
16 | 材料科学 | 287 |
17 | 政府 | 272 |
18 | 工程-机械 | 199 |
19 | 环境科学 | 174 |
20 | 工程-基础 | 175 |
由表4可知,撤销论文数量最多的学科是数学,共计1145篇,在38个学术会议中撤稿1083篇,占总数的94.59%;第2位是学会/协会刊物,撤稿1067篇,在21个学术会议中撤稿752篇,占总数的70.48%;第3位是商务经济,撤稿866篇,在33个学术会议中撤稿848篇,占总数的97.92%;第4位是技术,撤稿771篇,在53个学术会议中撤稿701篇,占总数的90.92%;第5位是企业管理,撤稿753篇,在36个学术会议中撤稿743篇,占总数的98.67%。
3 结论与建议
3.1 结论
本研究以Retraction Watch数据库中“国别”为中国的5167条撤稿声明为研究对象,对应的撤销论文共计5124篇,对这些撤销论文的标题、作者、学科、期刊、出版商、撤稿原因、发表时间、撤稿时间、文章类型等相关数据字段进行分析和对比,主要得出以下结论:
(1) 科技期刊论文的平均撤稿时滞大于学术会议论文,说明学术会议的自我净化效率更高,而且同一场学术会议的撤销论文绝大多数是在同一天撤回的。
(2) 60%以上的科技期刊论文撤稿原因是作者存在学术不端行为,95%以上的学术会议论文的撤稿原因是虚假同行评议。
(3) 被撤销的学术会议论文中,95%以上来源于2009—2011年在中国召开的国际学术会议。
(4) 撤销论文数量最多的5个学科分别为数学、学会/协会刊物、商务经济、技术、企业管理,这5个学科中70%以上的撤销论文是学术会议论文。
3.2 建议
(1) 加强对国内举办国际学术会议的监管,规范论文审稿流程。科研管理部门需要加强对在国内举办的国际学术会议的监管工作,规范学术会议论文的审稿流程,减少人为操作的可能。同时,对于被发现在同行评议等方面有过疑议的会议组织者,也要建立健全相关惩戒机制,不允许其再次举办相关学术会议。
(2)建立健全学术不端行为惩戒机制,纳入科研诚信档案。对学术活动中有失严谨甚至有学术不端等行为的责任主体,应建立健全相关惩戒机制,根据情节严重程度做出相应处理,可以纳入其个人科研诚信档案,与个人科研活动挂钩,避免责任主体凭借学术不端文献获取相关利益,从源头上杜绝侥幸心理,以维护学术道德、净化国内学术环境。
4 结语
长期以来,中国科研机构各类考核评价和职称评定存在着“三唯”(即唯学历、唯资历、唯论文)现象。论文的数量是考核评价和职称评定工作的一项重要指标,这也是论文复制、抄袭等学术不端行为产生的主要原因。因此,科研机构应建立健全科学的人才评价机制,完善相关配套措施,根据不同的职业和工作性质确定考核评价和职称评定标准,改进以论文数量为标准的“一刀切”做法,将论文质量、研究贡献等作为研究人员的考核标准。
参考文献
[1]科技部.2019年全国科技工作会议[EB/OL].(2019-01-10)[2019-05-20].
[2]Hesselmann F,Graf V,Schmidt M,et al.The visibility of scientific misconduct: A review of the literature on retracted journal articles[J].Current Sociology,2017,65(6):814-845.
[3]Grieneisen M L, Zhang M H . A comprehensive survey of retracted articles from the scholarly literature[J].PLoS ONE,2012,7(10):e44118.
[4]范少萍,张志强.科学文献数据库中撤销论文分布规律研究——以Web of Science数据库为例[J].情报学报,2014(4):375-387.
[5]姚长青,田瑞强,杨冬雨,等.撤销论文及其学术影响研究[J].中国科技期刊研究,2014,25(5):595-604.
[6]周志新.中文科技期刊被撤销论文特征分析及启示[J].中国科技期刊研究,2017,28(11):1065-1070.
[7]Stavale R,Ferreira G I,Galvão J A M,et al.Research misconduct in health and life sciences research:A systematic review of retracted literature from Brazilian institutions[J]. PLoS ONE,2019,14(4):e0214272.
[8]刘红,胡新和.国际学术期刊撤销已发表论文的实证分析——以ScienceDirect数据库为例[J].中国科技期刊研究,2011,22(6):848-852.
[9]Fang F C,Steen R G,Casadevall A.Misconduct accounts for the majority of retracted scientific publications[J].Proceedings of the National Academy of Sciences,2012,109(42):17028-17033.
[10]刘清海.国际期刊我国学者论文被撤销情况与分析——基于Retraction Watch网站结果[J].中国科技期刊研究,2016,27(4):339-345.
[11]张晴,姚长青,潘云涛,等.中文学术期刊撤销论文研究[J].中国科技期刊研究,2014,25(5):611-615.
[12]张辉玲,白雪娜,崔建勋,等.学术不端文献的发表追溯及防范对策——基于185篇疑似学术不端文献的实证分析[J].中国科技期刊研究,2016,27(7):691-697.