业内信息

学术不端撤销论文施引文献引用态度分析——以哈佛大学心脏干细胞撤稿事件为例

2021-05-08 来源:《中国科技期刊研究》
  【作 者】袁子晗、张红伟:中国农业大学情报研究中心

  【摘 要】[目的]分析哈佛大学心脏干细胞事件撤销论文施引文献引用态度的变化轨迹,深入探究其背后原因,为科技期刊和科研管理部门对撤稿事件的预防与治理提供参考。[方法]在借鉴前人研究的基础上,构建出适合的引用态度标记体系和标记规则,对2314篇施引文献的引用态度进行标记和描述统计,并在研究发现的基础上展开相关讨论。[结果]不同引用态度呈现出不同的时序变化特征,大部分学者对撤销论文的引用态度是客观谨慎的,并且随着时间推移,越来越多的研究人员加入到质疑队伍中。[结论]建议将全文本引文分析引入到科研不端论文的预测与防治中,关注对科研不端撤稿论文持极端肯定态度的文章和作者,期刊要重视提出质疑声音的文献,并尝试追踪学术论文的连环造假等。

  【关键词】撤销论文;科研诚信;引用态度;引用内容分析

  科研诚信问题已经成为学界乃至全社会关注的热点问题[1],对撤销论文的相关研究也不断增多,大致可以分为三类:一是关于撤稿事件的研究,主要从出版伦理[2]、制度伦理[3]、科研诚信体系建设[4]等方面剖析撤稿事件带来的影响;二是关于撤销论文基本特征的研究,主要从文献计量学的角度入手,大多以Web of Science、Retraction Watch等数据库为数据来源[5],分析撤销论文的撤销原因[6]、撤销时滞[7]、国家地区分布[8]、期刊分布[9]、学科分布[10]等方面的基本特征,并讨论撤销论文对期刊[11]、临床研究[12]和科学家学术生涯[13]等产生的多重影响;三是关于撤销论文被引用情况的研究,分析了施引文献对撤销论文的引用态度[14],探究了论文被撤销后仍然被引用的原因[15]。这些研究对于治理撤销论文和管控学术不端具有重要意义[16],也为本研究提供了很有价值的启发和参考。尤金•加菲尔德较早地对撤销论文施引情况展开研究,以Breuning的20篇虚假论文及其200篇引文为数据,并将其分为自引和他引两个数据集,将引用动机分为积极、消极、中立三个层面进行讨论,研究发现施引文献的引用动机中约半数为中立、1/3为消极[17]。Luwel等[18]以Schön撤稿事件为例,在ScienceDirect数据库获取撤销论文施引文献全文,分为中立、积极、消极和欺诈4个语境进行分析,发现即使在论文被撤销后,绝大多数引用也是积极的。Bar-Ilan等[14]同样选择ScienceDirect数据库生物领域2014年被撤销的论文为研究对象,发现绝大多数引用都是积极的。上述几项研究更为具体地对撤销论文施引文献的引用态度进行了研究,为本研究提供了直接参考,但其基本选取某一数据库在某一时间段内或某一学科领域内撤销论文为研究样本,且多数研究仅对不同引用态度的数量进行了分析,并未探究不同引用态度的时序变化特征及其背后的深层原因,存在一定的局限性。

  基于此,本研究从引用态度入手,以轰动一时的哈佛大学心脏干细胞撤稿事件为例,分析心脏干细胞撤销论文施引文献引用态度的变化轨迹,考察相关文章从发表到被引用再到被撤销整个过程中,引用其文章的学术共同体对其研究持什么态度?他们在学术共同体的自我净化中发挥了什么作用?还存在什么不足?给科技管理部门和科技期刊带来什么启示?总之,通过研究哈佛大学心脏干细胞撤稿事件,探究其背后的深层原因,为相关撤销论文的研究和科技期刊、科技管理部门对撤稿事件的治理提供参考。

  1 研究设计

  1.1 哈佛大学心脏干细胞撤稿事件简介


  2018年10月,美国著名生命科学网SATA爆料[19],哈佛大学申请撤销国际知名学者、前哈佛大学医学院教授Piero Anversa有关心脏干细胞研究的论文共计31篇,原因是这些论文涉及数据或图片造假。此次撤稿事件的撤稿数量多,持续时间长,影响极其恶劣,甚至有媒体将其报道为“学术界大地震”,声称一个分支学科被“撤”没了[20]。此次撤稿事件可以追溯到2003年前后,Piero Anversa声称自己发现了可以修复心脏功能的c-kit心脏干细胞,此后在The Lancet、Circulation等国际知名医学期刊上连续发文数十篇,并获得美国国立卫生研究院(National Institutes of Health,NIH)等机构多项基金资助。直到2014年,Anversa有关心脏干细胞的论文才首次被撤稿。随后,实验室受到系统调查,2018年10月哈佛大学申请向有关期刊撤稿31篇。

  1.2 数据获取

  2018年10月,哈佛大学向Circulation等期刊编辑部申请撤销论文共计31篇,但是笔者详细核查相关期刊编辑部发表的关切声明(Concern),最终确认撤销了其中的12篇论文;在此之前,The Lancet等期刊已经撤销了4篇相关论文。因此,根据相关期刊编辑部发布的撤稿声明,哈佛大学心脏干细胞事件共计撤销论文16篇。在Web of Science 数据库中进行检索,检索时间为2019年9月9日,构建的检索式为AU=(Anversa Piero)and DT=(Retraction or Retracted publication),其中,Retracted publication为撤销论文,Retraction 为其对应的撤销声明。去重后共得到16条记录,这与笔者的人工核查结果一致。因此,截至2019年9月9日,哈佛大学心脏干细胞撤稿事件中共有16篇论文被撤销,其施引文献共计2520篇。从Web of Science中下载施引文献的题录信息,并从全文数据库中下载16篇撤销论文及其2520篇施引文献的全文,以此作为本研究的数据集。需要说明的是,施引文献中有153篇为书的章节(Chapter),有18篇为德语、西班牙语等小语种论文,有35篇通过文献传递等方式多方查找后仍然无法获取原文,以上206篇文献并未纳入分析范围。因此,实际纳入分析范围的施引文献数量为2314篇,共计2942条引用记录。

  1.3 研究方法

  引文分析是指利用统计分析、矩阵分析等数学工具方法,对学术期刊、论文、作者、机构等主体间的引证关系进行定量化的分析,从而完成文献计量与科学评价任务的一种研究方法或手段[21]。引文分析包括引文著录信息的分析和引用内容的分析[22],后者又包括引用态度等方面的分析[23]。引用内容分析通过文本挖掘、情感分析等技术对引文的引用情况和引用动机等进行挖掘、分析和展示,从而更加准确地测度和评价被引文献并透视作者的引用动机[24],已经在内容挖掘、论文推荐和论文评价等领域得到了广泛应用[25]。本研究主要采用引文分析法,对心脏干细胞撤销论文施引文献的引用态度进行统计分析。具体研究步骤如下:首先,构建施引文献引用态度标记体系,并拟定标记规则;其次,通过人工阅读逐条判断施引文献的引用态度;最后,对统计结果进行描述分析,梳理不同引用态度的时序变化特征,深入探究其背后的深层原因。

  1.3.1 构建标记框架

  国内学者对施引文献的引用动机开展了大量的研究,目前可追溯到的最早研究是1989年梁春阳发表的《<哲学研究>引文分析》一文,其首次将引用动机划分为继承性引用、指示性引用和批判性引用[26]。此后的研究基本将引用动机划分为正面(积极)、负面(消极)和中立(中性)3种类型[27-29]。2015年,张晴[30]将引用动机的划分应用到撤销论文的研究中,将其进一步明确为肯定性引用、弱肯定性引用、中立性引用、怀疑性引用和明确否定性引用5种类型。2019年,德国学者Schmidt将引用动机的分类与撤销论文的研究结合[31],把引用动机归纳为肯定(Affirmative)、中立(Neutral)、否定(Negative)3类,并对肯定和否定2种类型进行了具体的划分。

  前人关于引用动机和引用态度的研究为本研究引用态度标记框架的构建奠定了重要的理论基础。其中,张晴[30]和Schmidt[31]对于引用态度的划分均是针对撤销论文展开的,因此,本研究主要借鉴这两位学者的研究成果,将引用态度划分为肯定、中立与否定3种类型,并以本研究中1篇撤销论文的203篇施引文献为样本进行标记实验,根据实验结果对初步拟定的标记框架进行完善与修改,最终确定适合本研究标记的实际使用框架(图1)。与前人的研究相比,本研究构建的标记框架的完善之处在于:对否定部分构建了三级体系,首先将否定部分划分为“否定原因”和“否定类型”2类,然后对其下位类进行划分与说明。后续判断与标记的过程也验证了本框架的科学性与合理性。



图1  施引文献引用态度标记框架

  1.3.2 拟定判断规则

  本研究在借鉴张晴[30](2015年)和Schmidt[31](2019年)两位学者研究成果的基础上,结合实验标记的实际情况,拟定了施引文献引用态度的判断方法和步骤,具体如下:

  首先,初步确定引用态度标识词,将其作为线索与依据,对施引文献的引用态度进行初步判断。本研究确定的标识词示例如表1所示。


表1  引用态度标识词示例
引用态度 标识词示例
肯定 suggest、demonstrate、discovery、confirm、predict、prove…
中立 report、document、cite、address、remain、debate、controversy…
否定 disagree、fail、inadequate、insufficient、deny、refuse、negative…

  判断示例如下:

  (1) As noted above, multiple studies have demonstrated that the heart does indeed have some capacity for regeneration and renewal …(引用态度:肯定)

  (2) Moreover, our findings disagree with earlier data reporting turnover rates up to 50% per year.(引用态度:否定)

  其次,当标识词前后出现though、but、while等含有转折意义的介词或其他具有否定含义的词语时,根据引用处的具体语句/语段进行判断。

  判断示例如下:

  Recently, it has been demonstrated both experimentally and in patients that the heart has the capacity to replace cardiac myocytes throughout life, but that this response is inadequate to compensate for major injuries such as myocardial infarction.(引用态度:否定)

  再次,对于无明显标识词和情感词的语句,结合语句本身和上下文语境进行判断。大量的实验结果表明,这种语句的引用态度基本为中立,对前人研究作客观描述或为自己研究提供背景阅读材料。

  判断示例如下:

  There are currently several clinical studies in progress testing the efficacy of different cell therapies for repairing damaged myocardium.(引用态度:中立)

  最后,对于通过以上步骤仍然无法确定引用态度的语句,汇总后进行小组讨论或专家咨询,最终确定引用态度。

  需要说明的是,每一次判断都是对引用语句本身以及上下文甚至整个语段进行阅读,而非单单凭某一句话进行判断,因此这样的判断更为精准。

  2 结果分析

  在结果分析方面,首先对撤销论文引用态度的整体概况进行分析,然后对肯定和否定不同引用态度的具体情况进行详细分析。

  2.1 引用态度概况分析

  对引用态度整体概括的分析发现:肯定和中立引用态度呈生命周期变化,否定引用态度随着时间的变化有所增加;中立的引用态度占比最高,肯定的引用态度次之,否定的引用态度最少;半数撤销论文无否定引用。

  2.1.1 肯定和中立引用态度呈生命周期变化,否定引用态度随时间变化有所增加

  撤销论文施引文献引用态度的时序变化特征在一定程度上可以反映撤稿事件的发展过程,也可以体现出学术界对其研究态度的变化趋势。对引用态度标记情况进行统计,发现在2314篇施引文献的2942条施引记录中,肯定引用态度有914条,中立引用态度达到1977条,否定引用态度仅有51条。从施引文献引用态度变化趋势来看(图2),肯定和中立引用态度均呈现出明显的生命周期变化过程,其变化曲线在一定程度上存在拟合趋势,并且二者均在2013年达到了峰值,数量分别为194条和376条,此后呈现波动下降趋势。否定引用态度的数量在2015年和2017年达到最高的11条,总体上随着时间的推移有所增加。



图2  施引文献引用态度时序分布图

  从图2可以清晰地观察到2014年和2016年为分水岭,结合引用态度的动态变化过程,本研究将其划分为3个阶段:上升期(2008—2013年)、波动期(2013—2016年)和下降期(2016—2019年)。(1)在上升期的前两年(2008—2009年),持中立和肯定态度的施引文献数量均非常少,到2010年该数量迅速增加,而2011年持中立引用态度的施引文献数量几乎呈现直线上升的趋势。16篇撤销论文中有11篇发表于2011年前后,这段时间引用数量的激增应该与此有关。(2)在波动期(2013—2016年),持中立和肯定态度的施引文献数量虽然呈现波动下降的趋势,但数量一直很高,持否定态度的施引文献数量随着时间推移不断增加。由撤稿声明可知,这16篇撤销论文中有一篇在2014年被撤销,因此,持中立和肯定引用态度的施引文献数量在2014年大幅下降可能与此有关。(3)在下降期(2016—2019年)内,持中立和肯定态度的施引文献数量均大幅下降,持否定态度的施引文献数量也逐渐表现出下降趋势。2018年10月哈佛大学申请撤销相关论文,2019年引用数量骤降应该与此有关。

  综上所述,持肯定和中立态度的施引文献数量变化和撤稿时间密切相关,持否定态度的施引文献数量总体上一直在增加,表明随着时间推移,越来越多的研究人员加入到质疑的队伍中。这在一定程度上说明科学共同体具有一定的自我净化功能,随着时间的推移和相关研究的深入,在第一个“吹哨人”对科研不端论文提出质疑之后,会有越来越多的人加入到质疑的队伍中。

  2.1.2 中立引用态度占比最高,肯定次之,否定最少

  撤销论文施引文献的不同引用态度反映了科学共同体对其研究的认可程度或批判态度。对不同引用态度的占比结构进行分析(图3),发现在心脏干细胞撤销论文的施引文献中:(1)持中立态度的施引文献数量占比最高,约占67%,数量达到1977条。结合具体的标记情况来看,中立态度的施引语句往往出现在引言(Introduction)以及文献综述(Literature Review)部分,通常只有一句话,为自己的研究提供背景阅读材料或对前人研究进行简要介绍。(2)持肯定态度的施引文献数量次之,达到914条,占比约为31%。结合具体的标记情况来看,肯定态度施引语句常常出现在引言(Introduction)或讨论(Discussion)部分,有的是对前人“开创性”研究的肯定,也有的是将前人的研究作为自己实验成果的佐证。(3)持否定态度的施引文献数量最少,仅有51条,占比约为2%。在长达10年的施引时间内,大多数施引文献表现出中立引用态度,对撤销论文的研究结论较为谨慎;少部分文献表现出肯定的引用态度,极少数文献对撤销论文发出质疑声音。由此可见,质疑科学家队伍的数量并不是很大,这可能是因为科学家们开展相关的实质性研究较少,不能明确地判断撤销论文的真假,也就不敢轻易下结论提出质疑;也可能是因为哈佛大学Piero Anversa教授在这一领域的绝对权威性,使其他科学家过于盲从。但无论是哪种情况,都说明科学共同体在科学研究的自我净化中有很大的局限性,这需要学术共同体反思,也需要期刊编辑部和科研管理部门对这些问题给予关注。



图3  施引文献不同引用态度数量占比分布

  2.1.3 半数撤销论文无否定引用

  在16篇撤销论文中有8篇无否定引用,有1篇仅有1条否定引用。表2列出了这8篇零否定引用的撤销论文,这些论文发表在Circulation、Circulation Research和Journal of Clinical Investigation这3种期刊上,累计被引了515次,平均被引频次为64次,平均撤稿时滞为85.6个月。根据期刊编辑部发布的撤销声明,这8篇论文被撤销原因是图片造假(序号14)和数据造假(序号5、7~12)。虽然平均被引频次和平均撤稿时滞均低于16篇撤销论文的整体平均水平,但是每篇撤销论文平均最少有64人次的施引者和64篇施引文献被误导,尤其是其中有7篇文章是数据造假,意味着其结论并不可靠,而对这些虚假文章的引用带来的严重后果可想而知,甚至是直接影响施引文献的结论。而且,这8篇撤销论文在平均长达85.6个月的撤稿时滞和累计多达515次引用中,无任何否定引用,意味着没有施引者对其中任何一篇文章提出质疑,这也在一定程度上说明,识别学术不端论文的造假行为存在很大困难,也提醒研究者们在自己的研究过程中不仅要站在前人的肩膀上继续攀登科学高峰,同时也要时刻注意用批判的眼光对前人研究进行识别和判断,不能盲信盲从。


表2  零否定引用撤销论文一览表
撤销论文序号 出版物名称 发表时间 撤销时间 撤销时滞/月 被引频次/次
5 Circulation Research 2010-06-10 2019-02-15 105.7 91
7 Circulation Research 2011-04-29 2019-02-15 94.9 56
8 Circulation 2013-11-12 2019-02-12 63.9 33
9 Circulation 2014-01-14 2019-02-12 61.8 31
10 Circulation Research 2012-09-14 2019-02-15 78.1 29
11 Circulation Research 2009-11-20 2019-02-15 112.5 24
12 Circulation 2011-03-29 2019-02-12 95.9 146
14 Journal of Clinical Investigation 2013-01-02 2018-12-03 72.0 105

  2.2 不同引用态度的具体分析

  施引文献有“肯定”“中立”“否定”3种引用态度,“中立”的引用态度对于分析撤稿事件、发现科研不端意义不是很大,因此本研究主要分析肯定和否定引用态度的具体情况。

  2.2.1 肯定引用态度分析

  在914条肯定引用记录中,有5条既可以归入“被他人已有研究证实”,也可以归到“被自己已有研究证实”中,这里将其重复计算,因此共计919条记录。

  在919条肯定引用态度记录中(图4),“未证实”一类数量最多,高达809条,占比达到88%。结合具体标记情况来看,“未证实”一类的具体施引语句中discovery、promising、encouraging等正面评价的词语较多,进一步统计后发现在809条引用记录中这3个词语共出现了122次,说明相当一部分施引文献对撤销论文取得的研究成果给予了较高的肯定评价,这也从侧面体现出撤销论文产生的严重学术危害。“被他人已有研究证实”和“被自己已有研究证实”数量虽然较少,但分别也有80条和30条。如果撤销论文通过造假的手段取得的研究成果被他人的研究证实,那么就有理由怀疑后者的研究成果也存在造假的嫌疑。由于哈佛大学心脏干细胞撤稿事件涉及的撤销论文多达16篇,“被他人已有研究证实”一类可能存在不同撤销论文之间相互引证的情况;而“被自己已有研究证实”一类,施引者的研究成果和学术诚信应该受到质疑。



图4  持肯定态度的施引文献数量分布

  2.2.2 否定引用态度分析

  在51条否定记录中,有3条既可以归入“与自己研究相悖”,也可以归入“与他人研究相悖”,此处重复计算,故共有54条记录。研究发现在“否定原因”中(图5),有31条记录明确表示,撤销论文的研究成果与他人(16条)或自己(15条)的研究相悖(占比58%),说明这些施引论文的作者,尤其是15条“与自己的研究相悖”的施引论文作者真正发现了这些不端论文的可疑之处。但是本研究也发现有23条(占比43%)记录未说明原因,这就很难判断施引作者是否自己真正做了相关研究证明不端论文的可疑之处,但是最起码这些施引作者并没有盲从和崇拜权威,也在学术共同体自我净化的道路上作出了贡献。在“否定类型”中(图6),有43条记录否定研究结论,占比达到84%,尤其是瑞典学者Olaf Bergmann多次在文献中明确表明撤销论文的研究成果无法重现(could not reproduce),这就给人们质疑其研究造假提供了可能。这说明大多数提出质疑的科学家还是发现了其研究结论的问题,在一定程度上提示我们从研究结论出发,才更有可能发现数据是否有可能造假,如果单纯从数据看,可能并不容易发现数据的真假问题。另外,仅有8条记录(占比16%)否定研究设计,具体包括:(1)提出研究方法存在潜在缺陷(have substantial shortcomings);(2)认为数据来源不可靠(these data are based on several unproved biological and mathematical assumptions);(3)质疑研究样本数量太少(involved very few patients)等。这在一定程度上说明研究设计部分可能不太容易发现造假问题,这是因为既然造假者是知名学者,他在研究设计的“包装”上可能做得很到位,一般不会被发现存在问题,即使有一些瑕疵,也无关大雅,所以即使这部分只有8条否定质疑,也是分布在不同的方面。



图5  否定原因数量分布


图6  否定类型数量分布

  此外,本研究对持否定态度的施引文献来源刊物进行统计,发现:(1)51条否定记录分布在37种期刊上,其中不乏The Lancet、Nature、Cell等国际顶尖期刊;(2)持否定态度的施引文献来源刊物的平均5年影响因子为11.58。数据表明,大部分持否定态度的施引文献发表在高影响因子刊物上,甚至有一些发表于国际顶尖学术期刊。由于这些期刊具有很高的影响力,传播的范围也更广,其质疑的声音更有可能引起研究人员和相关部门的重视,从而推动科研不端行为被尽早发现。因此,期刊是否可以有意识地多发一些有争鸣性的、对其他研究有所质疑的文章,以帮助学术共同体自我净化。

  3 结论与讨论

  通过上面的研究分析,发现:(1)从变化趋势来看,肯定和中立引用态度呈现出明显的生命周期变化特征,二者均在2013年达到了峰值,数量分别为194条和376条,此后呈现波动下降趋势。否定引用态度的数量在2015年和2017年都达到了最高的11条,总体而言随着时间的推移有所增加。(2)中立引用态度数量最多,达到1977条,约占67%,说明大部分学者对论文的引用态度是谨慎客观的。但是质疑科学家队伍的数量并不是很大,只有46人,显得极其珍贵。(3)在所有的16篇撤销论文中有8篇无否定引用,有1篇仅有1条否定记录,在一定程度上说明识别学术不端论文的造假行为存在很大困难,所以科学共同体的自我进化,以及科研管理部门和科技期刊打击科研不端、治理科研诚信仍然任重而道远。(4)在肯定引用中,“被他人已有研究证实”和“被自己已有研究证实”的数量分别是80条和30条,那些声称“被自己已有研究证实”的施引文献作者应该受到科研诚信的质疑,很可能成为新的科研不端的线索。(5)在否定的引用记录中,有43条记录(占比为84%)否定研究结论,仅有8条记录(占比为16%)否定研究设计,相比较而言,发现研究结论的真假可能比发现研究设计的真假更容易。持否定态度的施引文献来源刊物的平均5年影响因子为11.58,其中不乏The Lancet、Nature、Cell等国际顶尖期刊。高影响力期刊对相关否定引用态度文章的发表,有利于推动质疑声音的传播,有助于尽早地发现科研不端和推动撤稿,降低不良影响。

  基于如上结论,本研究有针对性地展开相关讨论且提出以下建议。

  3.1 将全文本引文分析引入到科研不端论文的预测与防治中

  信息技术的发展为全文本引文分析奠定了基础,使得对施引文献引用态度的大规模分析成为可能[24]。本研究通过对撤销论文施引文献引用态度的分析发现,在撤稿前针对撤销论文的质疑声音越来越多,对发现科研不端意义重大。因此,本研究认为将全文本引文分析引入到科研不端论文的预测与防治中,运用机器学习、情感分析等工具,结合全文本引文分析的理论与方法,对与撤销论文有相似特征但未被撤销的论文进行分析与预测,有利于科研不端的发现,也有利于及时止损并提出相应的解决策略,有效控制撤销论文带来的不良连锁反应[16]。

  3.2 关注对撤销论文持极端肯定态度的文章

  本研究发现,一部分肯定引用态度施引文献对撤销论文给予了高度评价,有学者竟然声称他们得到了与撤销论文一致的研究结果,并援引撤销论文对自己的研究成果加以佐证。如果撤销论文通过造假的手段取得的研究结论被他人的研究证实,那么我们有理由怀疑后者研究结论的获得也存在造假的嫌疑。本研究认为,这部分对撤销论文持极端肯定态度的施引文献,很有可能成为揭发新的学术不端的线索。

  3.3 及早发现科研不端论文并给予撤销及明确标注

  本研究发现,2018年10月爆出撤稿丑闻后,在2019年仍有60条引用记录,对比撤销论文的撤稿时间和施引文献的收稿时间后发现有5篇论文在撤稿后表达出明确的肯定引用态度。有研究指出论文撤稿后仍然被引用可能是施引者并未注意到撤稿声明[32],也有施引者认为即使被撤稿,该论文也存在一定价值[14]。但无论从哪方面考虑,论文被撤销后的正面引用都是一个值得深思的现象。一方面,这提示我们及早发现科研不端论文非常重要,尤其是发现知名学者的造假论文意义更为重大,可以最大限度地降低其造成的不良影响;另一方面,科技期刊对于造假的学术论文要及时撤销,并给予明确的标签,明确标注撤销的理由,如伪造撤销(Fabrication Retraction)、篡改撤销(Falsification Retraction)和剽窃撤销(Plagiarism Retraction)等详细信息,以防不明真相的学者继续引用。建议科研管理部门、科技期刊和数据库要对撤销声明的撰写内容和格式制定统一的规范[33],并按规范处理撤销论文,以尽可能地避免撤销论文后续的不良影响。

  3.4 科技期刊应重视发出质疑声音的文献

  科技期刊作为科学交流和知识传播的平台,在科研失信行为查处中承担着主体责任[34]。目前,国内科技期刊多采用规范投稿流程、建立查重制度的方式来预防论文的学术不端行为[35]。本研究认为,科技期刊还应对论文的具体内容进行详细审读,尤其是要重视因无法重现前人研究结果、对其提出质疑的论文,甚至是可以发表一些无法重复重大研究结果的实验性文章。如果被质疑论文发表于自己的期刊,则可以要求该文作者作出回应,及时揪出那些学术造假者,同时也给予潜在造假者威慑和警示,守住科研诚信和学术伦理的生命线[36]。

  3.5 重视追踪学术论文的连环造假

  本研究发现此次撤稿事件中半数撤销论文都没有否定引用,在一定程度上说明学术造假的发现存在一定难度。这也启示我们要重视追踪学术论文的连环造假,即由一篇造假的论文,连环追击该作者其他相关的造假论文,及早发现、及早撤销,将其不良影响控制在最小范围内。本次撤稿事件给心血管领域乃至整个医学领域带来深远影响,除Piero Anversa本人外,撤销论文的其他合著者是否参与了学术造假,应该承担什么责任,他们今后的学术生涯将会受到哪些影响等,这些都值得我们继续关注。因此,科研管理机构应该围绕重大科研不端撤稿事件进行持续追踪,深入分析撤稿事件带来的影响,加大打击科研不端行为的力度,为科研诚信体系的建设提供有力抓手。

  4 结语

  当前科研诚信问题依然严峻,对如哈佛大学心脏干细胞撤稿事件等重大学术不端事件进行研究很有意义。本研究的创新之处在于:(1)在研究方法上,基于前人的研究构建了新的引用态度标记框架和标记规则,尤其是在否定引用部分构建了三级体系,并在标记规则上设计了非常详细的具体步骤,都可以为其他研究者提供有价值的参考;(2)本研究从时序变化趋势、否定引用的原因及类型、零否定引用的施引文献等相关研究较少关注的角度进行了分析,拓展了对撤销论文研究的视野;(3)本研究探寻了数据背后的深层次原因,一些发现和启发对其他相关研究,以及对科技管理部门和科技期刊都有一定的参考借鉴意义。当然,本研究尚存在一些不足,希望在后续研究中得到解决:首先,研究数据较为单一。仅从学术论文的角度考量学术界对一项研究的态度或许有些单一,也许有学者将其肯定的态度或质疑的声音发表在学术博客或个人网站上,如果对这些信息进行收集并分析,相信能够得出更为全面的判断。因此,下一步研究可以借鉴替代计量学的相关理论和方法,从学术社交媒体上扩展数据来源。其次,本研究对引用态度的标记采取的是手工提取和人工判断的方式,费时费力,不利于推广到其他领域的研究中,相关研究者可以探索使用自然语言处理等技术进行机器标记与处理,提高对全文本引用态度的识别效率。

  参考文献

  [1]田瑞强,姚长青,潘云涛.被撤销论文的学术不端行为及应对策略研究[J].中国科技期刊研究,2019,30(9):937-943.

  [2]张秀峰.从撤稿事件论学术期刊对出版伦理把关的责任[J].编辑学报,2017,29(6):517-519.

  [3]陈清江,周志新.生物医学论文被撤销现象的制度伦理分析[J].中国医学伦理学,2018,31(10):1233-1236.

  [4]石丹妮,徐阳,江胜强.从“集中撤稿事件”谈我国科研诚信体系建设[J].江苏卫生事业管理,2018,29(10):1202-1204.

  [5]Schneider J,Ye D,Hill A M,et al.Continued post-retraction citation of a fraudulent clinical trial report,11 years after it was retracted for falsifying data[J].Scientometrics,2020,125(3):2877-2913.

  [6]Wray K B,Andersen L E.Retractions in science[J].Scientometrics,2018,117(3):2009-2019.

  [7]张丽华,田丹.不同学科论文被撤原因及撤销时滞对比分析[J].数字图书馆论坛,2019(8):40-44.

  [8]刘清海.国际期刊我国学者论文被撤销情况与分析:基于RetractionWatch网站结果[J].中国科技期刊研究,2016,27(4):339-345.

  [9]陈小清,邢美园.PubMed数据库撤销论文文献计量分析[J].中国科技期刊研究,2016,27(4):352-358.

  [10]范少萍,张志强.科学文献数据库中撤销论文分布规律研究:以Web of Science数据库为例[J].情报学报,2014,33(4):375-387.

  [11]张春博,丁堃,王贤文,等.撤销论文对所在期刊的影响研究:基于期刊引证指标的定量分析[J].中国科技期刊研究,2020,31(3):337-345.

  [12]Steen R G.Retractions in the medical literature:How many patients are put at risk by flawed research?[J].Journal of Medical Ethics,2011,37(11):688-692.

  [13]Azoulay P,Bonatti A,Krieger J L.The career effects of scandal:Evidence from scientific retractions[J]. Research Policy,2017,46(9):1552-1569.

  [14]Bar-Ilan J,Halevi G.Post retraction citations in context:A case study[J].Scientometrics,2017,113(1):547-565.

  [15]da Silva J A T,Dobranszki J.Highly cited retracted papers[J].Scientometrics,2017,110(3):1653-1661.

  [16]范少萍.撤销论文的文献计量分析及其学术不端行为防治研究[D].北京:中国科学院大学,2015.

  [17]Garfield E,Welljams-Dorof A.The impact of fraudulent research on the scientific literature.The Stephen E. Breuning case[J].Journal of the American Medical Association,1990,263(10):1424-1426.

  [18]Luwel M,van Eck N J,van Leeuwen T.The Schön case:Analyzing in-text citations to papers before and after retraction[J].Proceedings of the 23rd International Conference on Science and Technology Indicators,2018:1025-1030.

  [19]Harvard and the Brigham call for 31 retractions of cardiac stem cell research-STAT[EB/OL].(2018-10-14)[2020-12-08].https://www.statnews.com/2018/10/14/harvard-brigham-retractions-stem-cell/.

  [20]哈佛大学调查:心肌干细胞发现者被撤稿31篇,该领域“濒临团灭”?[EB/OL].(2018-10-24)[2020-09-27].https://zhuanlan.zhihu.com/p/47365078.

  [21]杨思洛.引文分析存在的问题及其原因探究[J].中国图书馆学报,2011,37(3):108-117.

  [22]刘盛博.科学论文的引用内容分析及其应用[D].大连:大连理工大学,2014.

  [23]胡志刚.全文引文分析方法与应用[D].大连:大连理工大学,2014.

  [24]赵蓉英,曾宪琴,陈必坤.全文本引文分析:引文分析的新发展[J].图书情报工作,2014,58(9):129-135.

  [25]徐琳宏,丁堃,陈娜,等.中文文献引文情感语料库构建[J].情报学报,2020,39(1):25-37.

  [26]梁春阳.《哲学研究》引文分析[J].图书馆理论与实践,1989(3):11-15.

  [27]刘盛博,丁堃,张春博.基于引用内容性质的引文评价研究[J].情报理论与实践,2015,38(3):77-81.

  [28]廖君华,刘自强,白如江,等.基于引文内容分析的引用情感识别研究[J].图书情报工作,2018,62(15):112-121.

  [29]彭秋茹,阎素兰,黄水清.基于全文本分析的引文指标研究:以F1000推荐论文为例[J].信息资源管理学报,2019,9(4):82-88.

  [30]张晴.基于引用动机的高被引撤销论文学术影响研究[D].北京:中国科学技术信息研究所,2015.

  [31]Archive other sessions[EB/OL].[2020-05-25].https://wcrif.org/programme/archive-other-sessions.

  [32]Bornemann-Cimenti H,Szilagyi I S,Sandner-Kiesling A.Perpetuation of retracted publications using the example of the Scott S.Reuben case:Incidences,reasons and possible improvements[J].Science and Engineering Ethics,2016,22(4):1063-1072.

  [33]文敏.关于论文“撤销声明”标注的调查及建议[J].编辑学报,2020,32(3):278-281.

  [34]印波.科技期刊编辑部在科研失信行为查处中的主体责任[J].编辑学报,2020,32(4):367-371.

  [35]谈桂春.学术出版规范下科技期刊科研诚信建设[J].新闻研究导刊,2020,11(12):179-181.

  [36]朱邦芬.中国科技期刊要守卫科研诚信和学术伦理的生命线[J].中国科技期刊研究,2019,30(1):2-5.

国家广播电视总局 | 湖北省人民政府 | 中国邮政集团公司 | 武汉市人民政府 | 中国期刊协会 | 中国图书进出口(集团)总公司 | 中国邮政集团公司报刊发行局 | 湖北省广播电视局 | 湖北日报传媒集团 | 长江广电传媒集团 | 长江日报报业集团 | 知音传媒集团 | | 湖北中图长江文化传媒有限公司 | 决策信息网 | 湖北新闻出版广电传媒周

copyright(c) 2013 湖北省新闻出版局 版权所有 技术支持

鄂ICP备19004605号-4  鄂公网安备 42010602004016号