业内信息

国际优秀生物医学期刊深度查证学术图片的特色流程——data integrity analysis专岗审核

2021-05-08 来源:《编辑学报》
  【作 者】韩磊、郑云飞、邱源:山东第一医科大学附属省立医院;叶青:浙江大学学报英文版编辑部

  【摘 要】介绍国外优秀生物医学期刊深度查证学术图片的特色流程——图片数据完整性分析(data integrity analysis)专岗审核。期刊在审稿流程中设置了图片数据完整性分析的专门岗位,由具备丰富Photoshop软件操作经验的图片分析师,对经同行评议后稿件中的图片进行技术分析,配合作者提交的源数据,审查图片是否存在各类问题尤其是造假的情况。审核效果表明,在经过同行评议后的稿件中仍存在各类图片问题甚至图片造假,该流程对于查证图片造假是非常有效和必要的。

  【关键词】生物医学;科技期刊;图片;学术不端;数据完整性

  近年来,图片造假已经成为世界上最常见的学术不端行为之一[1],因图片造假而被撤稿的中国论文数量仅次于美国而排名第2位[2]。Photoshop、ImageJ等强大功能的制图软件在为作者制作、调整图片提供便利的同时,也容易被一些企图操纵图片的作者滥用[3],图片造假手段更加技术化、隐蔽化。面对当前这一严峻形势,作为科研诚信守门人的科技期刊,防范图片学术不端就显得迫切性和重要性,需要积极探索图片审查理念,丰富对图片深度查证的技术。但总体来看,我国科技期刊对图片造假的认识尚不够充分,且缺乏有效的审查流程与技术,期刊的审图能力尚待加强[4]。

  目前,国外部分优秀生物医学期刊开始实施一种新的图片深度查证流程,即图片数据完整性分析(data integrity analysis)专岗审核,设置了专门的审核岗位进行学术图片的审核。其中,欧洲分子生物学组织(EMBO)出版社引领了这一世界潮流,并极大丰富了该流程的内涵和技术,近年来其经验被多个国际生物医学期刊借鉴[5]。本文介绍图片数据完整性分析的相关内容和国际优秀生物医学期刊的实施效果,以期为我国科技期刊认识这一新型的学术图片深度查证理念、流程及技术提供借鉴。

  1 图片数据完整性相关概念

  图片数据完整性分析,即在审稿流程中,期刊设置图片数据完整性分析审核专岗,由图片分析师针对图片进行系统性的分析,配合作者提交的源数据,审查图片中是否存在重复、过度美化、畸变甚至严重的操纵等,以确保图片所反映的数据完整性。

  以EMBO为例,据其官网“数据透明性政策”页面(data transparency,https://www.embopress.org/sourcedata)介绍,该流程中所指的数据特指“源数据(sourcedata)”,不等同于由实验原始过程所直接输出的“原始数据(rawdata)”。EMBO主编Bernd Pulverer指出,源数据特指对原始结果经过初步处理、用于生成图片的数据,既包括用于生成定量图的测量值数据,也包括未经图像处理的凝胶电泳蛋白条带、显微照片等各种原始实验图片[6]。

  EMBO鼓励作者在投稿时提交源数据,并在论文发表时发布主要结果图片的源数据,以保证出版物中的科学记录具有高标准的完整性[6]。同时,EMBO开发了源数据平台(http://sourcedata.embo.org),不仅便于作者投稿时提交源数据,也供其他科研人员从该平台下载数据进行重新分析和利用[7]。

  为了保证图片数据完整性分析的实施,EBMO有3个重要措施。一是制订了完善的编辑政策[6],对图片格式、数据完整性基本准则、图片问题分级标准和处置方式作出明确指引。二是要求作者提交各类源数据,无论是鼓励作者在投稿时提交,还是在审核图片时要求作者提交,都试图寻求到源数据,进而与最终版本图片进行对比、分析,评价最终版本图片的完整性、真实性。三是设置了专门的图片数据完整性审核岗位,由专业的图片分析师采用人工和软件方式分析图片。

  2 国内外生物医学期刊相关岗位的设置情况

  《Journal of Cell Biology》(JCB)是最先开展此项工作的期刊[8],其原总编辑Rossner是图片审查政策的发起人。他于2002年提出,稿件在最终决定接收前,由专门的图片分析师审查稿件中的图片,从而形成了图片数据完整性分析的雏形[9]。

  2011年,EMBO开始开展图片完整性分析项目,并设置了专门的图片分析师岗位,对EMBO旗下的《The EMBO Journal》《EMBO Reports》《EMBO Molecular Medicine》《Molecular Systems Biology》《Life Science Alliance》等期刊的稿件进行图片数据完整性分析。EMBO在多年的探索中,极大丰富了该流程的内涵和技术,形成了以源数据为核心的数据透明模式,被认为是期刊出版的标准[10]。

  之后,《Molecular and Cellular Biology》(MCB)于2013年、欧洲生物化学学会联盟(FEBS)旗下的期刊于2016年、《The Journal of Clinical Investigation》(JCI)于2016年先后建立了此种流程。

  目前设置该流程的国际生物医学期刊仍是少数,只是近年来逐渐有一些期刊开始尝试。而国内生物医学期刊中,浙江大学期刊社已开始应用Droplets工具包检测可疑图片的流程[2],但尚未设置独立的专门岗位,其他期刊尚未发现有类似流程的开展及岗位的设立。

  3 岗位设置及专业要求

  以EMBO为例,其图片分析师通常作为编辑助理。该岗位最核心的专业要求是有使用Photoshop软件的丰富经验,而并不对科学专业背景有过高要求。

  在Photoshop软件经验方面,蕴含着对图片分析师的2个要求:一是操作Photoshop软件的熟练程度,能够快速明确地使用各种命令,找到最适合显示出图片异常的模式;二是对图片的敏锐程度和空间想象能力,能够对图片中的异常特征有敏锐的感知,对不同位置、形状的局部图像进行想象和重构,从而有利于发现存在翻转、旋转或局部雷同的图片。EMBO图片分析师Boxheimer认为,对图片的敏锐程度和空间想象能力对于查证各类图片问题是尤其重要的。

  从专业要求及实际工作内容可以看出,图片分析师岗位已明显不同于科技期刊传统上对科学编辑、文字编辑、排版编辑等岗位的学科要求和工作内容。这一特色岗位的出现,体现出在开放数据这一学术发表新理念及应对新型学术不端的背景下,国际优秀生物医学期刊已在探索多学科融合、高技术手段的审稿方式,以有效应对学术不端行为的高技术性特征,值得我国科技期刊研究者关注。

  4 先进理念

  理念1:同行评议是一种非常成功的质量保证机制,但它并不足以防范异常的图片。完成同行评议流程后,对稿件进行图片数据完整性审查是非常必要的[11]。

  体会:Pulverer主编是图片数据完整性分析流程的积极倡导者和探索者,他的理念诠释了进行图片数据完整性分析的必要性。同行评议对于评价稿件的学术质量具有不可或缺的作用,但审稿专家的侧重点多为稿件的学术性,对于学术不端的关注程度和审查方法往往是不足的。研究表明,审稿专家在审稿时对学术不端的审查意识相对较低[12]。尤其是当前抄袭行为呈技术化倾向及隐蔽化表现的趋势,对图片的操纵存在多种方式,审稿专家对其筛查更加有难度,这表明期刊要立足于自身,丰富对隐蔽性学术不端行为的审核方法[13]。EMBO在对通过同行评议的图片数据完整性审查流程中,审核出约20%的稿件存在图片问题,说明同行评议对于防范图片异常是不足够的,图片数据完整性分析是对审稿流程的重要补充。

  理念2:图片数据完整性分析的目的是保证科学记录的准确性,以便在发表前解决异常的图片问题,减少发表后再进行更正、撤回的情况[14]。

  体会:图片数据完整性分析的重要出发点是将图片审查的重心设置于期刊审稿环节,尽可能减少存在异常图片论文的发表,而不是在发表后再做被动处理。实现这一目标,需要有明确、严格、全面的编辑政策和审核流程去保障。在这方面,EMBO在其官网“作者指南”页面(Author Guidelines,https://www.embopress.org/page/journal/14602075/authorguide)详尽规定了在实验对象、利益冲突、科研伦理、科研诚信、数据收集、图表格式、源数据、统计学方法等3大类44项具体要求,同时在发表前进行图片数据完整性分析,从而尽可能地筛查出存在异常的稿件,保证所发表的论文具备可靠的科学性、准确性。

  理念3:用图片软件来改变论文图片的某一部分,如色彩、亮度和对比度,是对图片的美化;如果这种美化达到了增加或隐藏局部某个图像的程度,就成为造假行为;蓄意在图片上编造实验中没有的数据,是严重的欺诈行为[15]。

  体会:期刊对图片修饰程度作出清晰界定,对于期刊和作者都具有非常积极的作用。对期刊而言,可用于评判图片是否存在过度修饰甚至造假,并设置相对应的分级评价方法,更明确地界定图片的修饰程度和所对应的处理方式。对作者而言,可作为加工图片时把握合理程度的规范指引,避免因过度修饰图片而造成“诚实错误”。

  理念4:期刊需要能够发现这些图片问题,并采取相应的行动[11]。

  体会:面对这些非常隐蔽的造假形式,期刊增设专门的流程就显得尤为必要。针对图片审核的特点,一是要配备专业性的图片审核人员,能够达到“见招拆招”还原出图片调整前的表现,从而使隐藏的图片造假露出真实面目;二是要通过制订和完善开放数据相关政策,规范作者对源数据的认识和明确提交要求,保证图片数据完整性审查的可靠性、准确性。

  理念5:审查越深入,发现就越多[11]。我们担心的不是图片操纵的数量越来越多,而是这些问题被期刊发现的机会太低[9]。

  体会:近年来,隐蔽、复杂的深度不端行为呈现出主流化和常态化,数据问题、方法与结果问题、图片问题这类非常隐蔽的造假方式为其主要表现,且呈现出普遍化的趋势。对于这类新型、隐蔽、复杂的造假论文,只有进行更加深入、针对性、多层次的审查,才能筛查出隐藏的造假稿件。如果期刊在审稿过程中没有进行深入有效的审查,非常容易忽略从而导致这类论文的发表。这其中值得期刊编辑思考和分辨的是,审稿中没有审查出造假,是因为稿件确实“不存在”造假,还是因为审查方法不足而“未能”发现造假。我们曾采用多种方法深入审查低复制比的投稿稿件,在文字查重后,进一步联合采用包括检索中英文题名、检索作者团队已发表文献、检索中英文摘要及关键词、多个查重软件复测复制比等,从这些看似“正常”的稿件中发现了多篇存在确凿的抄袭证据[13],也表明深入的审查非常有助于对隐蔽性造假论文的检出。因此,在当前学术不端行为更加隐蔽、深度的形势下,期刊在审稿中不应将“没发现”造假简单等同于“没有”造假,丰富审查方法、深度审查对于筛查造假论文具有非常重要的意义。

  5 审核流程及方法

  图片数据完整性分析的流程是对经过同行评议、作者修回的拟接收稿件,期刊在最终决定发表前,由图片分析师对稿件中的图片进行逐一审查,采用人工识别+软件分析的方法分析图片。对于存在明显的重复、裁剪、涂抹痕迹的图片,可通过肉眼识别;对于其他比较隐蔽、复杂的图片,则使用Photoshop软件及美国研究诚信办公室(Office of Research Integrity,ORI)提供的Droplets工具包,通过调整灰度、色差、滤镜等方法,分析图片中是否存在复制、旋转、翻转、插入、擦除、裁剪、拼接、畸变、背景不连续或其他方式的过度修饰,并进行细节比对。

  EMBO在审核流程方面探索出了更加有可操作性的措施。当图片分析师发现图片存在异常时,为避免因缺乏学科背景而导致误判,会列出所发现异常情况的清单,与科学编辑共同判断,从科研诚信角度来分析哪些可以排除异常、哪些需要进一步确认。EMBO制订了图片异常的三级分类标准[11],当发现潜在异常的图片时,则对图片异常的严重程度进行分级,对应采取相应的措施,包括要求作者提供源数据、对图片异常情况进行解释,通报作者的研究机构,拒稿等[16]。在达到最严重的第三级程度时,EMBO将予以拒稿并通报作者单位[11]。

  6 审核效果

  EMBO:在20%的拟接收稿件中发现存在各类图片问题,其中0.5%的稿件被确定存在图片造假并被拒稿[11]。

  《JCB》:在20%的稿件中发现存在各类图片问题,其中1%的稿件被确定存在图片造假而被拒稿[15]。

  《FEBS》:在约30%的拟接收稿件中发现存在各类图片问题,其中95%的稿件为单纯美化、疏忽及诚实错误所致,2%~3%的稿件被确定存在图片造假而被拒稿[17]。

  《MCB》:2009—2012年未实行图片完整性分析时,发现在7.08%的已发表论文中存在各类图片问题;而在2013年引入图片完整性分析流程后,这一比例降至3.96%[18]。

  《JCI》:在27.5%的拟接收稿件中发现存在各类图片问题,其中1%的稿件被确定存在图片造假而被拒稿[3]。

  综合各个期刊的审核效果表明,在同行评议后的稿件中仍存在一定数量的图片问题,包括严重的图片造假。因此,图片数据完整性审查流程对于防范这类隐蔽性的造假行为是非常有效和必要的。对于达不到造假性质的图片修饰问题,也可在发表前得到及时的发现与更正,有效保证了研究数据的真实性、准确性和科学性。

  但另一方面,在审核效率与工作量方面,Pulverer也表示,这个过程非常耗时,使得期刊的工作量增加一个数量级[5]。Bik等[18]研究表明,在出版前审查一篇稿件中的图片时间为30min左右,而在出版后再查出此类问题论文的时间则为6h,是前者的12倍,认为在发表前审查图片比在出版后所耗费的时间更少。因此,结合审核效果来看,在出版前进行图片审查仍是以相对较小的时间成本,获得相对较大的科研诚信收益,是具有重要意义的防范学术不端的前置手段。但目前,在尚未研制出高效、自动化图片识别软件的情况下,如何看待图片数据完整性分析流程的效果与效率,可能是影响更多期刊决定是否开展这项流程的重要因素。

  7 对图片分析技术的初步实践

  本课题组对图片分析技术进行了初步实践,由熟练掌握Photoshop技术的美术编辑担任图片分析师,采用Photoshop软件及Droplets工具包,对课题组所在《山东医药》期刊的20篇可疑投稿稿件中的图片进行分析。图片均为PNG格式。

  Droplets工具包下载网址为https://ori.hhs.gov/droplets,免费下载,导入Photoshop后即可操作。Droplets工具包包括FORENSIC-Gr-MAP、OVERLAY-BLOTS-Light-Bkgrd、OVERLAY-FIGURES-White-Bkgrnd、FEATURES-IN-DARK-or-LIGHT-AREAS、LEVEL-O-VERLAY-BLOTS-White-Bkgrnd、LEVEL-OVERLAY-DARK-BLOTS等多种类型,可以根据目标图片所属的实验类型选择不同的工具包进行图片分析。例如:对于蛋白质免疫印迹实验中的蛋白条带图片,可选用FORENSIC-Gr-MAP工具包;对于细胞实验中的免疫荧光图片,可选用FEATURES-IN-DARK-or-LIGHT-AR-EAS工具包。

  经过美术编辑对图片的分析,发现其中3篇存在明显异常的图片,经与科学编辑共同评议,确定存在图片造假问题,包括复制蛋白条带、重复利用蛋白条带、局部复制免疫荧光背景等(图1-3)。结果表明,该技术的确为查证造假图片提供了有效和富有操作性的方法,能够发现隐藏的图片造假。



(b)图为经Droplets工具包FORENSIC-Gr-MAP调整后图片,发现箭头所指的2个条带的轮廓、内部细节高度雷同。
图1 第1篇稿件中WesternBlot蛋白条带图片的调整前后


(b)图为经Droplets工具包FORENSIC-Gr-MAP调整后图片,发现(b)图2个不同指标的蛋白条带的条带轮廓、内部细节及背景噪点高度雷同。
图2 第2篇稿件中WesternBlot蛋白条带图片的调整前后


(b)图为经Droplets工具包FEATURES-IN-DARK-or-LIGHT-AREAS调整后图片,将右上角图片垂直翻转,发现与另一张图片的周边区域高度雷同(同形状箭头示雷同区域)。
图3 第3篇稿件中免疫荧光图片的调整前后

  8 结束语

  综上所述,图片数据完整性分析作为一种已在国际优秀生物医学期刊得到认可和关注的新型理念,其Photoshop查证技术也表现出了富有成效的效果,这些理念和技术非常有助于丰富我国科技期刊的审稿理念和图片查证技术,为我国科技期刊防范图片学术不端提供了有益的借鉴和启示。

  建议国内生物医学期刊高度重视图片造假的严重性、表现形式,充分认识到审稿中对图片进行审查的重要意义,积极探索在审稿流程中引入图片数据完整性分析流程的价值及相关的图片检测技术,并尽快制订完善的开放数据政策。有条件的期刊编辑部,可借鉴国际优秀生物医学期刊如EMBO的图片审核经验,设立图片数据完整性分析专职岗位,吸纳具有丰富Photoshop软件操作经验的专业人员担任图片分析师,并制订相配套的图片审核及数据共享政策,对拟录用稿件中的图片进行分析。通过增加这一针对性、专业性的反学术不端审查流程,期刊可在发表前更加有效地防范图片造假这一新型学术不端行为。同时,由于Photoshop软件查证技术在国内尚属于新生事物,一方面需要积极学习借鉴国际先进经验,例如可以寻求这项技术的引领者如《JCB》原总编辑Rossner、EMBO主编Pulverer、《FEBS》图片分析师Christopher等进行技术培训,另一方面也需要国内期刊在初步探索的基础上,加快进行经验的相互交流与传播,以促进这项技术的推广应用。

  鉴于我国生物医学期刊尚未设置类似岗位并开展图片数据完整性分析,对Photoshop技术方面的应用及研究报道也处于起步阶段,因此这将是科技期刊未来非常有前景的实践与研究方向,值得对图片数据完整性分析这一新概念进行深入、全面的研究。针对当前图片审核技术在效率方面的制约性,开发高效快捷的图片自动识别软件是亟待研究的前沿课题,也是非常值得科技期刊联合计算机、情报学等相关学科进行交叉研究的方向,例如建立和共享已发表文献图片的数据库、应用人工智能(AI)技术进行图片比对分析等。此外,国际优秀生物医学期刊的经验表明,实现图片数据完整性分析流程需要高标准的期刊导向、完善的开放数据政策、跨学科的专业人才配备等,图片数据完整性仅是其开放数据政策的一部分,整体的开放数据政策架构也非常值得国内生物医学期刊继续进行深入研究。研究。

  9 参考文献

  [1] 刘清海.国际期刊我国学者论文被撤销情况与分析:基于RetractionWatch网站结果[J].中国科技期刊研究, 2016,27(4):339

  [2] 叶青, 林汉枫, 张月红.图片中学术不端的类型与防范措施[J].编辑学报, 2019,31(1):45

  [3] WILLIAMS C L, CASADEVALL A, JACKSON S.Figure errors, sloppy science, and fraud:keeping eyes on your data[J].The Journal of Clinical Investigation, 2019,129(5):1805

  [4] 段姚尧, 李宏伟, 赵爱源, 等.关于医学论文图片真实性的研究[J].编辑学报, 2013,25(4):342

  [5] DECLAN B.Researchers have finally created a tool to spot duplicated images across thousands of papers[J].Nature, 2018,555(7694):18

  [6] PULVERER B.Transparent, reproducible data[J].The EMBO Journal, 2014,33(22):2597

  [7] LIECHTI R, GEORGE N, GTZ L, et al.SourceData:a semantic platform for curating and searching figures[J].Nature Methods, 2016,14(11):1021

  [8] Image doctoring must be halted[J].Nature, 2017,546(7660):575

  [9] ROSSNER M.Figure manipulation:assessing what is acceptable[J].Journal of Cell Biology, 2002,158(7):1151

  [10] POLKA J K, KILEY R, KONFORTI B, et al.Publish peer reviews[J].Nature, 2018,560(7720):545

  [11] PULVERER B.When things go wrong:correcting the scientific record[J].The EMBO Journal, 2015,34(20):2483

  [12] 王育花, 童成立.科技期刊编辑和审稿专家对学术不端的认知及其防范对策[J].中国科技期刊研究, 2018,29(11):1127

  [13] 韩磊, 邱源.源文献挖掘方法在筛查低复制比抄袭论文中的应用[J].中国科技期刊研究, 2020,31(5):524

  [14] BOXHEIMER E W, PULVERER B.Self-correction prevents withdrawal syndrome[J].The EMBO Journal, 2019,38(18):e70001

  [15] 王丹虹.《自然—细胞生物学》主编Bernd Pulverer谈不端科学行为:剽窃是老问题 篡改是新现象[N/OL].科学时报, 2006-07-10(3)[2020-07-20].http://news.sciencenet.cn/dz/dznews_photo.aspx?t=gk&id=17977

  [16] BOXHEIMER E W.The data detective[EB/OL].(2019-03-29)[2020-07-20].https://www.embo.org/news/articles/2019/the-data-detective.html

  [17] CHRISTOPHER J.Systematic fabrication of scientific images revealed[J].FEBS Letters, 2018,592(18):3027

  [18] BIK E M, FANG F C, KULLAS A L, et al.Analysis and correction of inappropriate image duplication:the molecular and cellular biology experience[J].Molecular and Cellular Biology, 2018,38(20):e00309-18

国家广播电视总局 | 湖北省人民政府 | 中国邮政集团公司 | 武汉市人民政府 | 中国期刊协会 | 中国图书进出口(集团)总公司 | 中国邮政集团公司报刊发行局 | 湖北省广播电视局 | 湖北日报传媒集团 | 长江广电传媒集团 | 长江日报报业集团 | 知音传媒集团 | | 湖北中图长江文化传媒有限公司 | 决策信息网 | 湖北新闻出版广电传媒周

copyright(c) 2013 湖北省新闻出版局 版权所有 技术支持

鄂ICP备19004605号-4  鄂公网安备 42010602004016号