【作 者】胡正君、曾文、刘颖:《环境化学》编辑部
【摘 要】学术期刊的原始数据承载着科学发展的重要使命,但期刊的开放数据进程仍相对滞后。对于大多数中文期刊来说,原始数据的开放只是处于讨论阶段,期刊对于数据开放存在诸多考虑。本文研究了目前国内外学术期刊开放数据现状,比较了国内外学术期刊开放数据的不同历史背景和现实环境,就中文期刊开放过程中需要思考的几个问题进行梳理,并提出建议,以期为各界人士提供参考。
【关键词】开放数据;中文学术期刊;大数据时代
科学数据不仅是科技创新和国家发展的战略资源,也是政府部门制定政策、进行科学决策的重要依据,还是学者们进行科学研究的基础支撑。随着大数据时代的到来,数据的重要性更加凸显,进而开放数据成为全球瞩目的热点。2009年时任美国总统奥巴马签署了《开放透明政府备忘录》,同年Data.gov数据门户网站上线,标志着全球开放数据正式展开[1]。2014年8月,我国开放数据中心2014年峰会宣布成立开放数据中心委员会[2]。在各界人士的努力下,国内外在很多专业领域建立了不少免费或可服务的开放数据库、数据交流共享平台[3],尤其是在政府层面上,公开了很多公共数据。学术期刊作为学术成果交流的重要媒介,其周围汇集了大量的科研人员,拥有广阔的学术传播渠道,其成果的背后承载了成千上万的原始数据。因此,学术期刊的开放数据将大大提升我国开放数据程度,最大限度地提升科学数据价值。然而,期刊原始数据的开放才刚刚起步,只有不多的期刊要求作者在投稿时或是在录用后提供所有的原始数据,大多数中文期刊并未对原始数据进行强制要求,因此有必要对中文期刊全面开放数据过程中可能存在的问题进行分析。本文研究了目前国内外学术期刊开放数据现状,比较了国内外学术期刊开放数据的不同历史基础和现实背景,就中文期刊开放过程中需要思考的几个问题进行讨论,并提出建议。
1 国内外学术期刊开放数据现状
目前,很多国际著名期刊和出版机构已陆续开始开放数据,它们要求作者在投稿时或录用后提交支持文章论点的全部原始数据[4]。文章发表后,原始数据将作为论文的一部分同时发表,如《Science》[5]、《PNAS》(《Proceedings of the National Academy of Sciences USA》)[6]、PLoS[7]、《BMJ》[8]以及《nature》[9]。美国生态学会ESA(Ecology Society of American)旗下期刊,《Ecological Applications》《Ecological Monographs》要求作者在投稿时或录用后提供原始数据,《Ecology》虽然对原始数据并非强制性要求,但是要求作者在需要时提供相应的原始数据[10]。PLoS要求作者在论文出版的同时立即公开支持文章内容的所有数据,并从2014年3月3日开始,所有向PLoS递交论文的作者必须提供数据可访问性声明。《Science》和《PNAS》也在投稿须知中花费大量篇幅以强调作者需上传所有能提供证据的数据,详细说明了数据的提供方法,建议作者将数据上传于《Science》《PNAS》本身的数据存储网站,或根据学科方向上传于相应的数据平台(或数据库),如:Worldwide Protein Data Bank、Gen Bank、Coalition on Publishing Datain the Earth and Space Sciences(COPDESS)及Electron Microscopy DataBank(MSD-EBI)等。其目的就是要保证文章中所有论点所依据的数据“易于评估”“易于使用”“易于追溯”。
目前,数据开放在中国学术期刊界还处于起步阶段。在中文期刊中,明确有数据期刊政策的并不多,而在投稿时要求将论文相关数据递交到指定数据存储库,或明确表示不附数据则退稿的期刊更是寥寥无几[11]。只有较少的期刊(如《中国科学数据》《全球变化数据学报》《数据分析与知识发现》等)要求上传所有的原始数据,且在这3种期刊中,其中两种属于数据期刊。更多的中文期刊对原始数据并无特殊要求,对开放数据处于观望状态。在全世界逐步走向开放数据的环境下,中文期刊编辑部对期刊开放数据政策还存在诸多疑问与顾虑。这些顾虑既来自中国学者长期以来对外文期刊和中文期刊的区别对待,也来自于目前我国学术论文发表的整体状况,以及开放数据进程在我国整体推进相对比较落后的实际情况。
2 国外期刊和中文期刊开放数据存在不同的历史基础和现实环境
2.1 历史基础
在开放数据还未进入期刊领域时,为保证文章的完整性、论述的可依据性,国外期刊就要求作者将重要的实验数据、实验过程附于supporting information或supplementary information中,这其实就是小程度的开放数据。只是在数据开放后,期刊强制要求的数据不仅有加工后的数据,还必须有最原始的数据。这给作者的数据提供提出了更加严格的要求。虽然对作者来说是一个挑战,但是随着国外期刊近年来“数据出版”“加强出版”的全面推进,提供所有的原始数据相对较为容易接受。但在我国,政府开放数据还处于初级探索阶段[12]。据统计,2016年122个政府强制性开放数据的国家中,中国排名第93位[13-14]。国内中文期刊中,发表补充数据的期刊非常少[11],在近些年才偶尔有一些文章带有补充数据,而且该补充数据并不能在大家常见的中文数据库中下载,只能在期刊主页中下载。目前,技术问题已经不是大问题,但是让作者立刻去适应期刊论文的全面数据开放还需要时间,还需要一个过程。相比之下,中文期刊开放数据难度较大。
2.2 现实环境
开放数据,对于投稿作者的心理是一个挑战。投稿作者需改变以往数据不开放的常态,也需考虑数据开放后会带来某些不利影响。如数据开放后,可能会被同行很快进行二次开发和利用,而这样的二次开发在数据未开放时,仍然有机会由自己来完成;有的则担心数据开放后,其研究结果会遭到其他科学家的挑战和反对;也有的研究者担心数据公开后自己的工作会被求助请求淹没,并且要花很多时间反复核对数据的准确性[15]。
但是,像《Science》《PNAS》等这样的国际顶级期刊不存在这样的忧虑。即使数据开放会带来某些不利或不便,但这仍然不会减少投稿作者对这些期刊的崇尚,也不会成为作者投稿的阻碍,反而会使得作者更加严谨、仔细地审查自己所有的数据。对于知名度一般的SCI收录期刊,在期刊开放数据发展的起步阶段,作者难免会有一些顾虑,这有可能导致部分作者放弃发表部分有创新但并不是很成熟的内容,也有可能导致作者在投稿选择期刊时,优先选择知名度高的期刊。但是,随着期刊开放数据的推进,这些都将不是问题。我国的科研工作者会很快适应开放数据这样的国际环境,即使是对于一些影响因子一般的SCI期刊,相信在不久之后,也能逐步建立自己的作者群。强制要求原始数据不仅不会导致作者源减少、稿源量减少,反而对科研人员提出了更加严格的要求,从而推动科学发展。
但我国科研人员对中文期刊的重视不够。因此,强制性要求其花费大量精力整理、审核、补充原始数据,难免会使其有抵触的情绪。这将使中文期刊编辑部在决定是否强制性要求所有原始数据时,犹豫不决[14]。
3 中文学术期刊开放数据过程中需要思考的几个问题
3.1 开放数据对中文期刊发展的影响
目前国内普遍存在的共识是:中文期刊论文的含金量总体上小于SCI期刊论文的含金量,而且也小于我国学者发表的SCI论文的含金量。研究人员一般会将讨论深度相对较浅、分析较简单的文章发表在中文期刊上,而将讨论更加深入、透彻、全面,且具有前瞻性的文章投稿于SCI收录的期刊。在开放数据后,若中文期刊强制要求上传所有的原始数据,将有可能导致部分作者放弃发表中文文章,从而使中文期刊流失掉这些可能涵盖前沿元素(前沿主题)的文章。如果没有得力措施,这可能会导致中文期刊整体水平下降。但是随着国家对期刊的发展越来越重视,目前已经逐渐出现了在项目结题、项目申请或者奖项申请时,必须有中文文章发表的案例。
从另一种角度考虑,中文期刊的开放数据将有可能促使发表的文章可信度更高,从而使中文期刊的文章质量进一步提高,提高期刊的品牌效应,随之将可能会凸现一批优秀的中文期刊。这些期刊的文章质量不仅不会降低,反而会提高。
3.2 开放数据对于期刊编辑部、审稿人以及我国的期刊监管具有极大的挑战
抄袭、剽窃一直是困扰中文期刊发展的重要问题。对于某些专业领域来说,科研数据本身就存在即时性,数据一旦被编造后,真伪无法考证,若被二次利用以后,造成的后果不堪设想。虽然数据的真伪不只针对期刊,也是所有原始数据出版面临的最核心的问题,但是这无疑增加了期刊编辑部内容审查的工作难度,这对中文期刊将是一个极大的挑战,对审稿、期刊监管都是挑战。目前虽然有针对中文期刊的监管政策,但是中国有6000多种学术期刊[16],而且多为双月刊、月刊,甚至半月刊,监管人员不可能去审查每种期刊的每篇文章。数据开放后,监管人员审查所有的实验数据的可能性较小,这就要求审稿人和期刊编辑对数据严格把关。审稿人以及编辑需要花费更多的时间审查论文和原始数据。因此,数据开放必将极大地挑战我国的期刊审查,考验我国科研工作者的科研道德,影响我国科研环境的发展。
3.3 文章原始数据的存储、管理需要考虑
目前的开放数据,作者一般将原始数据上传于专业的开放数据平台或者是期刊自身的数据存储平台。我国在很多专业领域已经建立了数据共享平台,但多是一些国家部门、政府机构或研究型高等院校(如中国科学院)建立的公共数据共享平台[14,17-18],总体数量并不多。就目前技术发展来说,建立数据存储平台并不是问题,问题是如何管理数据,如何与中文期刊进行对接,以及对接过程中涉及的版权问题、利益分配问题才是着重需要面对的问题。
3.4 开放数据过程需要强大的制度保障
二次开发使用已发表数据需承担怎样的义务?数据被使用后应具有怎样的权利?期刊编辑部在开放数据时应有怎样的责任和义务?数据开放后原始数据的存储需有什么样的技术或制度保障?数据开放后,利益如何分配?这些问题都是中文期刊数据开放过程中应考虑并需解决的问题。中文期刊数据开放需要建立相关保障、制约机制,这需要所有中文期刊的共同配合,需要各大高校、科研院所提供制度上的有力支持,更需要所有科研学者的认可。目前,我国已经逐步开展了很多科学数据开放共享的运行模式、保障机制、优化策略、许可协议甚至法律义务等问题的讨论[19-23],相信在前期经验的基础上,期刊领域内形成统一的、可执行的方案指日可待。
3.5 如何推进中文期刊开放数据进程
2012年6月,英国皇家学会科学政策咨询小组开展了“科学:开放的事业”(Science as an open enterprise:open data in open science)的项目研究,呼吁科学各界推动科学数据的开放获取(开放数据),强烈建议科技期刊要求作者发表论文的同时须提供所有支持文中论点的原始数据[24]。在此之后,关于期刊的开放数据讨论频繁在多个国家和地区展开,得到了很多科研人员和出版界人士的支持,并且部分国际著名的期刊已经带头进行开放数据。在我国,SCI收录期刊数量还不多。据统计,截至2011年SCI(E)收录的纯中文期刊大约只有20种,中英文混合的期刊为90多种[25]。因此很多人认为,各个中文期刊差别并不大。这种情况下,这些“差别并不大”的众多中文核心期刊如何推进开放数据就成了问题。若只是少部分期刊强制执行开放数据,难免会影响投稿量及期刊质量。若是大规模、强制性要求数据开放,则涉及各个单位的制度及互相之间的协调,实际操作的可行性也需要仔细探讨。
4 建议
首先,加强科研人员和期刊编辑对于期刊尤其是中文期刊开放数据的认识,提升期刊工作者对开放数据的信心,使开放数据成为科研和期刊文章发表的常态。其次,进一步建立并完善各种保障制度。科研数据开放与共享需要复杂的利益调试机制[26],因此在期刊开放数据的过程中,需明确审稿专家、作者、期刊编辑部应有的权利、义务,建立完备的数据存储平台,完善的数据使用制度、奖惩制度与版权保护制度。再者,逐步推进中文期刊的开放数据。部分优秀的中文期刊可率先实行开放数据。如SCI(E)、EI等权威数据库收录的期刊;或获得过重要奖励、资助或称号的期刊;或可让部分文章先开放原始数据,如获得过基金赞助的文章;或利用公共平台数据撰写的文章可先开放原始数据。
近年来,学术研究正从过去的单一领域向多方位方向发展,各学科互相借鉴,交叉融合,使研究内容不断扩展,对数据的需求也呈现出多角度、多方位的特点。而且,当今社会正处于“开放”“共享”的大时代潮流中,在这种环境下,数据开放将会成为学术期刊一条很好的发展之路。目前,虽然中文期刊开放数据还处于起步阶段,科研人员和期刊编辑的思想意识还需要改变,各项政策保障制度还需要建立与完善,推进期刊开放数据还需要解决诸多问题。但是随着开放数据理念的不断深入,社会各界对于数据开放的需求逐步增大,中文期刊的开放数据将会成为必然。作为期刊开放数据的主体,期刊编辑部只要积极面对困难,解决问题,一定会在开放数据进程中绽放光彩。
参考文献:
[1]谭健.开放数据及其应用现状[J].图书与情报,2011(4):42-47.
[2]马海群,蒲攀.国内外开放数据政策研究现状分析及我国研究动向研判[J].中国图书馆学报,2015,41(219):76-86.
[3]高丰.开放数据:概念、现状与机遇[J].大数据,2015(2):9-18.
[4]吴蓉,顾立平,刘晶晶.国外学术期刊数据政策的调研与分析[J].图书情报工作,2015,59(7):99-105.
[5]Sciences.Editorialpolicies[EB/OL].[2019-03-07]..
[6]PNAS.Editorial Policies[EB/OL].[2019-03-07]..
[7]PLOS ONE.Submission guidelines[EB/OL].[2019-03-07]..
[8]BioMed Central.Availability of data and materials[EB/OL].[2019-03-07]..
[9]Nature.Data polices[EB/OL].[2019-03-07]..
[10]ESA.Author guidlines[EB/OL].[2019-03-07]..
[11]傅天珍,陈妙贞.我国学术期刊数据出版政策分析及建议[J].中国出版,2014(23):31-34.
[12]高丰.开放数据:概念、现状与机遇[J].大数据,2015(2):9-18.
[13]宋戈,胡文静.国外强制性开放科学数据政策调研与分析[J].图书情报工作,2016,60(9):61-69.
[14]曹雨佳.政府开放数据生存状态:来自我国19个地方政府的调查报告[J].图书情报工作,2016,60(14):94-101.
[15]PENG C H,SONG X Z,JIANG H,et al.Towards a paradigm for open and free sharing of scientific data on global change science in China[J].Ecosystem Health and Sustainability,2016,2(5):e01225.
[16]国家新闻出版广电总局第一批认定学术期刊名单公示[EB/OL].[2019-03-07]..
[17]李志芳,邓仲华.国内开放科学数据的分布及其特点分析[J].情报科学,2015,33(3):45-49.
[18]刘海房,莫世鸿,范冰冰.开放数据最新进展及趋势[J].情报杂志,2016,35(9):163-167.
[19]王晴.论科学数据开放共享的运行模式、保障机制及优化策略[J].国家图书馆学刊,2014,23(1):3-9.
[20]黄如花,李楠.开放数据的许可协议类型研究[J].图书馆,2016(8):16-21.
[21]蒲攀,马海群.大数据时代我国开放数据政策模型构建[J].情报科学,2017,35(2):3-9.
[22]顾立平.科研模式变革中的数据管理服务:实现开放获取、开放数据、开放科学的途径[J].中国图书馆学报,2018,144(6):43-58.
[23]相丽玲,王晴.论开放数据的法律属性、责任义务及其相关机制[J].国家图书馆学刊,2013,5(89):38-44.
[24]Royal Society.Scienceasan Open Enterprise[R].London:The Royal Sociey of UK,2012.
[25]付晓霞,李贵存,石朝云,等.SCI-E收录中国期刊现状分析[J].编辑学报,2014,26(5):492-494.
[26]张晓林.实施公共资助科研项目研究数据开放共享的政策建议[J].中国科学基金,2019,33(1):79-87.