业内信息

科学数据出版——我国科技期刊出版之内容创新

2017-04-13 来源:《编辑之友》

  【作 者】邓英 饶莉 西华大学学术期刊编辑部,四川 成都 610039;李桂东 西南石油大学期刊中心,四川 成都 610500。

  【摘 要】大数据时代,科技期刊出版具有自主知识产权的科学数据对提高期刊影响力、保护科研工作者的知识产权以及提高科学数据的利用率等都具有重要意义,因此,科技期刊有必要创新出版内容进行科学数据出版。在分析国外科技期刊数据出版现状的基础上,利用网络调查法对国内100种不同类别科技期刊进行调查,发现国内期刊出版界的数据出版尚处于萌芽状态。为此,文章提出四条建议:出台政策加以引导、统筹规划专业数据仓储或者公共数据仓储、统一出版与引用规范、建立高效评价机制。创新出版内容,实现新兴的数据出版与传统的论文出版融合发展将是科技期刊出版的发展方向。

  【关键词】科技期刊;科学数据;数据出版;数据共享;内容创新

  创新驱动发展,期刊出版形式和传播手段的创新催生了数字化出版,实现了纸媒传播向网络化、数字化传播的转化,极大地拓宽了期刊的影响范围,促进了期刊出版的发展与繁荣。2013年9月,中国科协开始牵头实施中国科技期刊国际影响力提升计划,2015年11月,中国科协要求“进一步提高我国科技期刊的学术质量、学术影响力和国际竞争力”,在此背景下,各期刊出版单位纷纷探索提升影响力的有效途径和方法。创新出版内容,把传统的论文出版拓展到科学数据的出版,在出版科技论文成果的同时出版相关的科学数据,不失为提升科技期刊影响力、促进其快速健康发展的有效方法之一。

  一、我国科技期刊进行数据出版的意义

  对传统的科技期刊出版而言,科学数据是全新的出版内容。传统的科技期刊出版,是将科技论文作为重要的科研成果,经过同行审议后结集出版,其出版的内容为科技论文;而科学数据出版,是指将科学数据作为一种重要的科研成果,按照科技论文的出版流程,经过对数据进行同行审议和公开公布,并且创建标准和永久的数据引用信息,供其他研究性文章引证。科学数据(包括原始数据、过程数据、结果数据等)是进行科学研究所产生的、形成重大学术成就的坚实基础,历来被世界各国所重视。为催生重大学术成果,世界各国每年都会投巨资到各类科学研究项目之中,进而产生大量宝贵的科学数据,我国科技期刊创新出版内容对这些科学数据进行出版具有重要意义。

  1.对国家的科研工作而言,有利于保护我国自主知识产权和信息安全

  一方面,我国作为科研大国,每时每刻都有海量的科学数据产生和形成。然而,由于我国的学术期刊发展水平和国外顶级期刊相比还存在一定差距,在现行学术评价体系的导向下,科研工作者对这些数据进行整理和分析后形成的大量优质科研论文纷纷涌向国外的科技期刊,这些国外的期刊往往需要作者在投稿时提供原始的科学数据以实现对投稿论文的支撑,因此造成我国宝贵的科学数据外流,其知识产权也随之外流,我国科研工作者要二次利用这些数据时,还需要支付高额的费用购买,这对我国的自主知识产权保护极为不利。另一方面,这些流向国外的相关原始科学数据给我国的国家安全造成了极大的隐患:表面上,科研工作者们提供的只是单一的论文原始数据,似乎并无不妥;但在高速发展的大数据时代,云计算和数据挖掘技术突飞猛进,不管这些原始数据当前是否涉及国家机密,当它们被国外的机构库或数据仓储收集管理后,极易被进行深层次挖掘,难免会有不利于国家安全的信息被分析,因此,极不利于我国的信息安全保护。我国科技期刊在出版科研论文的同时也对原始科学数据进行出版,可以使数据被相对安全地存储、掌握在国内,从而有效保护知识产权、保证数据被合理有效地共享而不被过度分析挖掘形成信息安全隐患。

  2.对期刊而言,新兴的数据出版与传统的论文出版融合发展,有助于提升科技期刊影响力

  我国虽然是期刊大国,但我们刊物的国际认可度还有很大的提升空间。按CNKI2015年的统计数据,2014年我国公开出版发行且被CNKI影响因子年报评价的科技期刊多达3776种,但2015年被SCI收录的期刊仅173种,而且这些被SCI收录期刊的国际影响力和国际认可度相较顶级期刊如Nature、Science等来说还存在相当大的差距。为减小差距,期刊界的同仁们正积极创新,寻找切实可行的提高我国期刊国际影响力的措施。要提高我国期刊的国际影响力,其中提高传统论文可信度是一个关键点。而提升论文的可信度,一个很重要的举措是:期刊出版论文时同步出版原始数据、过程数据。在2016年引起学术界轩然大波的韩春雨事件中,韩春雨论文成果的可信度被质疑,就在于读者称不能根据论文的指导重现实验结果。当期刊同步出版原始数据与过程数据后,读者能够按照期刊论文所给定的步骤以及这些同步出版的数据进行重复性实验并且获得与作者相同的实验结果,刊物所发表论文展示的科研成果就有高可信度。只有刊发论文具有高可信度,国际同行专家对刊物的认可度才会同步得到改善,期刊的影响力才会得到进一步提升。期刊影响力的提升相应又会吸引更多研究者通过期刊发表其论文和科研数据或引用这些论文或数据,这样,刊物的影响力会再次提升。由此,数据出版和论文出版相互促进,形成良性循环,期刊的发展将不可限量。因此,期刊拓展传统的出版内容对科学数据进行出版,对期刊影响力提升有较强的促进作用。

  3.对数据提供者(作者)而言,有利于拓宽其所拥有数据的利用面、有利于快速展示其研究成果同时保护其知识产权

  科学数据的获取往往会耗费科研人员大量的心血和劳动,一般情况下科研人员都会珍视这些数据而不会轻易将其随意扩散。当这些数据保存在科研者手中或某个研究项目小组内部时,分析者往往只从自己所关注的方面对数据进行分析处理而忽略了从其他角度去分析。数据的多角度分析或跨学科分析受到严重局限,这就很大程度上降低了数据的有效利用率。若实现数据出版,数据可被其他各个领域的科研工作者查阅、引用、分析,从而实现对数据最大化利用以创造更大的价值。在网络传播极为迅捷的大数据时代,科研成果的首发往往标志着作者对其拥有知识产权。现有的期刊论文出版要求作者取得的突破性成果要在形成论文后才能发表,这个过程往往比较漫长;而期刊实现数据出版以后,科研人员得到有意义的过程数据时即可随时将其发表,从而使作者因阶段性研究成果得以快速公布和推广而实现成果首发。这个首发即标志着作者获得了阶段性成果的知识产权。所以,期刊数据出版对作者来讲也意义非凡。

  4.对使用已出版数据的研究者(读者)而言,能够有效节约研究成本

  在传统论文出版时期,呈现给读者的主要是科研的最终成果,其中涉及的数据只是对结果起支撑作用的必备数据,且经过仔细筛选、处理,数据形式单一且数据量极其有限。这势必造成科研项目大量的数据被闲置或丢弃。这些被闲置或丢弃的数据对其他科研工作者来说可能正是他们所需。实现数据出版,读者可根据自己课题的需要,重新从不同的角度对相关数据进行分析,这样就能大大节省重复研究的人力、时间和资金等各项成本。

  二、科技期刊数据出版的现状

  科技期刊进行数据出版,是指科技期刊出版单位作为出版的主体,承担数据出版的组织工作,负责数据的收集、评审、规范整理和公开公布。

  1.国外科技期刊数据出版现状

  通过文献调查发现,在国外,科学数据的出版研究已得到极大的重视,期刊界也开展了深入的研究,部分期刊已具体施行,如Nature、Science(Eaeth System Science Data)、ESA(Ecological Society of America)等。这些期刊出版数据的方式各不相同。有的期刊认为数据决定了论文的质量,是论文的重要组成部分,需要在论文正式发表前先将相关数据公开,如Nature、Science、ESA等著名期刊。Nature要求作者在投稿时就提供和论文相关的数据,并有提交到可被公开访问的相应数据库的证明,而且这些存储到相关数据库的数据从出版之日起就能被免费获取。美国生态学会ESA旗下的所有期刊从2000年开始,就要求作者把和论文相关的数据注册到该学会创建的数据库Ecological Archives中,由数据库负责实现科学论文和科学数据之间的链接。有的期刊则白己负责管理发表数据。ESSD从2009年创办开始就只出版原始的科学研究数据,其目的在于实现以原始状态存储的高质量科学数据的永久保存和跨学科充分共享。Ecosphere等期刊则将相关数据作为论文的附件一同发表,并要求作者在提交论文时,将和论文相关的数据同时提交,期刊则将这些数据以TXT、EXCEL、WORD、PD等格式写成附件对论文做补充说明。

  2.我国科技期刊数据出版现状

  笔者在2015年4月至8月间采用网络调查法刘我国100种科技期刊进行调研。调研前将期刊按收录情况进行分类,分成SCI收录期刊、EI收录期刊、CSCD收录期刊、北大核心期刊要目总览收录期刊、中国科技核心期刊,普通期刊六大类。考虑到收录情况向下包含的关系,即SCI收录的期刊一般会被EI收录,EI收录的期刊一般会被CSCD收录等,因此,在选择下一类别刊物时,选取该类中不被上一类别包含的,由此保证每一类别都有20种期刊被调查。

  按照中国知网评价中心发布的《2014中国最具国际影响力学术期刊(自然科学与工程技术)》,选取SCI收录期刊20种,EI收录期刊20种,再根据中国科学引文数据库发布的CSCD(2015-2016)收录期刊20种,北大核心期刊要目总览(2014版)收录期刊20种,2015年中国科技核心期刊(中国科技论文统计源期刊)20种进行了调研。这些期刊有高校主办科技期刊也有研究院所主办期刊,有中文期刊也有英文期刊。调查时,登录这些期刊的网站,查看其投稿须知及对已发表文章的数据处理情况,从而了解该刊对数据进行出版的现状。

  调查发现,虽然所有的科技期刊均对正文中要使用的科学数据作了版式上的要求,但仅有两家SCI收录期刊涉及对相关原始数据的出版处理。这两家刊物分别是Chines Science Bulletin和《物理化学学报》。Chines Science Bulletin规定,必要的补充数据(如一些大的数据表及有关方法的详细描述)可作为附加文件同时上传,文章录用后这部分内容作为附加材料在网络版发表;《物理化学学报》规定,若一些图、表对文章主题有辅助作用,可只作为“Supporting Information”发布到网站。这两个刊物对科学数据的处理,都仅限于将其作为论文的补充附件出版,且提出只是“可以”,而未作必须要求。可见,我国期刊的数据出版意识才刚刚萌芽。

  三、加速我国科技期刊数据出版进程的建议

  1.出台相关政策积极引导科技期刊出版数据

  由于科技期刊进行数据出版不仅可以提高我国期刊的出版水平,还可以在一定程度上保护我国的知识产权和信息安全,因此,建议从国家战略角度出发出台相关政策积极引导国内科技期刊进行数据出版。美国国家科学基金会(NSF)从2010年开始就要求其资助项目的申请者要提交数据管理计划,美国国家航空航天、英国理事会等均要求其基金支持项目团队提供可以公开获取的科学数据。这些措施均是从项目支持者的角度要求进行数据出版。而从期刊的角度,早在2008年,H.A.Piwowar等的研究已表明,有强政策要求进行同步数据出版的期刊的影响力明显高于弱政策要求或无政策要求的期刊,如Nature、Science就有非常强的数据出版要求。而在我国,2015年11月,中国科协发文“要加大对科技期刊的扶持力度”,“重视精品科技期刊建设,大力推进中国科技期刊国际影响力提升计划”,但通过调查发现,我国2014年“中国最具国际影响力学术期刊”中没有一家期刊真正实现对科学数据的出版。借鉴国外顶级期刊实现科学数据出版的案例,要提升我国精品期刊的国际影响力,除加强期刊论文出版的建设外,还应出台政策引导期刊快速启动和推进科学数据出版。要保证这一工作起步晚但发展快,需要双管齐下,即各基金委和期刊双方均出台数据出版的政策。在强有力的政策引导下,数据出版工作和论文出版工作在期刊界真正地快速实现融合发展,精品期刊建设工作就会有大的飞跃,期刊的国际影响力才会得到快速提高,我国资助的各项优质科研成果及各类数据才可能保留在国内,从而确保这些数据和成果能被安全、合理地再利用。

  2.统筹规划,建立专业数据仓储或公共数据仓储

  我国到目前为止仅有极少数学者开始探索学术论文与科学数据集成出版的问题,还没有期刊真正开展这项工作。这未尝不是一件好事——从零开始,便于统筹规划、预留发展空间。根据对国外期刊的调查发现:其科学数据的出版模式主要是依托第三方数据仓储、自建机构库以及作为论文附件出版等类型;公共数据仓储对数据质量要求高,其数据格式非常严格、数据的稳定性和独立性都非常强、实现的技术难度高;专业机构库的数据质量要求也高,但其数据格式的严格性稍弱、数据的稳定性和独立性也不如前者强,需要的技术支持也较小;数据附件对数据质量的要求较弱,数据的稳定性和独立性也较弱。由于中国科技期刊发展水平参差不齐,各刊影响力各不相同,能收集到的数据资源质量也各有千秋,因此可以结合国外的出版现状进行国内数据出版的统筹规划:对专业性强的期刊,按公共数据仓储的要求建立专业数据仓储,如生物学、地球物理学、医学等,供相关专业期刊集中进行数据出版;对专业性不突出的综合类期刊,建立统一的公共数据仓储;而且建议数据仓储由国家基金建立,免费向国内期刊、读者开放;涉及保密的学科领域设定独立的专用数据仓储,并且设定极其严格的共享权限,保证资源在安全的范围内共享。

  3.统一制订科学数据出版和引用的规范与标准

  科技期刊要实现科学数据的出版并且保证这些数据能够像论文一样被全世界范围内的科研工作者所检索查询、阅读和引用,必须有大家共同遵守的出版及引用规范和标准。虽然在科技论文出版过程中有一部分关于数据的标准与规范,但其仅适用于经过处理的数据,对未经处理的原始数据出版仅具有参考作用。由于元数据是出版内容的基本单元,对各平台进行数据交换共享以及跨平台实现互操作都具有十分重要的意义,因此对元数据结构标准进行统一规范是保证各期刊出版数据无缝衔接高度共享的决定性举措。在制订规范与标准时,要特别注意由于原始数据中的数值型数据与非数值型数据的结构和数据表达完全不同,因此在进行元数据结构构建时要充分考虑将二者的表述统一;同时也要注意,尽管不同出版模式中对具体数据格式的要求不相同,但作为数据出版的标准应充分考虑数据格式的完整性。在科学数据引用规范问题上,虽然科技论文引用的规范和标准具有一定的导向性,而且王丹丹也作了初步的探讨,指出要明确引用数据的版本、粒度、数据验证方式及引用对象等问题;但在数据出版时,针对大量的原始数据,如何规范独立的数据使用者的行为,也需要有严格的引用标准加以规范。这些规范和标准要具有普适性和通用性,不能由某一家期刊确定,而应从行业的角度统一制订标准,统一遵从。

  4.建立高效评价机制,保证数据出版质量

  由于科学数据是支撑科技创新的基础,为让科学数据能最大化地发挥作用,催生更多的新成果,对期刊出版的数据质量进行有效监督和评价以保证其质量尤为重要。笔者建议将评价分为两大部分:出版前的同行评价及出版后的社会评价。出版前的同行评价是杜绝数据伪造、数据篡改等学术不端间题的重要手段,也是保证数据能规范科学地表达以确保其被有效地再利用的基础。期刊出版单位经过历年的发展,积累了大量优秀的同行评议专家,形成了一个庞大而稳定的审稿专家库。这些专家原来在对作者的来稿进行质量把关时,已包含对相关数据可靠性的判断;进行数据出版时,可以拓展专家的把关内容,请这些专家对数据及数据说明的完整性、数据格式的标准性、产生或形成数据的方法及过程的严谨性和科学性进行有效评价。只有通过专家评价的数据方可出版。出版后的社会评价是指在数据出版后一段时间内,通过数据的被阅读、被下载量、被引用次数以及由此得到的新成果数来评价数据的质量。这个评价借鉴了传统的对期刊的引文评价方法,又引入了在此数据基础上形成的新成果这一指标。通过这一指标的引入,可以彰显对数据提供者知识产权的保护,鼓励更多的作者提供更优质的数据进行出版。通过出版前后的高效评价,可使数据质量得到有效保证以促进科学数据的高质量共享。

  结语

  大数据时代,科学数据作为重要的战略资源,已成为国际社会争夺的重点。科技期刊进行数据出版一方面可提升期刊的国际影响力,另一方面可在实现资源共享的同时减少国家数据资源外流,有效保护我国科学数据的知识产权和信息安全。因此,科技期刊创新出版内容,将新兴的科学数据出版与传统的科技论文出版相融合,将会成为其未来发展的方向。当然,科技期刊进行数据出版会面临诸多困难,如:数据标准、安全保密、出版模式选择、科研人员积极性调动等等问题,均需在建设初期从国家层面加以统一规范,以避免期刊各自为政形成信息孤岛,也需各期刊出版单位系统地针对各刊的情况精心分析,制订相应的出版措施。



























国家广播电视总局 | 湖北省人民政府 | 中国邮政集团公司 | 武汉市人民政府 | 中国期刊协会 | 中国图书进出口(集团)总公司 | 中国邮政集团公司报刊发行局 | 湖北省广播电视局 | 湖北日报传媒集团 | 长江广电传媒集团 | 长江日报报业集团 | 知音传媒集团 | | 湖北中图长江文化传媒有限公司 | 决策信息网 | 湖北新闻出版广电传媒周

copyright(c) 2013 湖北省新闻出版局 版权所有 技术支持

鄂ICP备19004605号-4  鄂公网安备 42010602004016号