【作 者】解贺嘉、刘筱敏:中国科学院文献情报中心
【摘 要】为了解国外预印本平台的研究进展,本文梳理了国外预印本平台论文提交、发布、讨论、传播、利用全流程的研究成果。结果表明,国外预印本平台处于繁荣发展的态势、学术质量较高、具有引用优势与广泛的社会影响力,学术交流系统参与主体支持预印本平台的发展,预印本平台也存在开放评论活跃度较低、学术规范缺失等问题。未来研究可关注新兴预印本平台发展、开放评论机制、影响力评价指标体系、科研人员等主体对预印本平台利用环节的认知、态度、行为。
【关键词】国外预印本平台;学术交流;发展态势;影响力
作为开放获取运动的先驱,预印本平台具有悠久的发展历史。1961—1967年,在美国国立卫生研究院(National Institutes of Health,NIH)的支持下,由相同领域或共同研究兴趣的科学家组成了“信息交换小组”(Information Exchange Groups,IEGs),该小组吸引了3600名研究人员并产生了2500篇预印本[1]。斯坦福大学国家加速器实验室(SLAC National Accelerator Laboratory)从1962年就开始收集预印本并编目[2]。第一个电子化预印本平台arXiv由物理学家保罗•金斯帕(Paul Ginsparg)于1991年在美国洛斯阿拉莫斯(Los Alamos)国家实验室建立,arXiv起初主要收录高能物理领域的预印本,如今,学科领域扩展到数学、计算机、计量生物、计量金融、统计学等[3]。2011年,《Nature》在arXiv创建20周年之际以专文报道,足可见arXiv在科学领域的重要性[4]。
预印本平台的重要作用与影响,体现在对以出版商为主导的学术交流系统的解构与科学家自治的新型学术交流系统的构建,预印本平台不仅促进了科学知识及时传播、开放共享,加快了知识交流与再生产的效率,也已经在特定的学科领域建立了学术话语权[5],进而使正式学术交流和非正式学术交流之间的边界日益模糊[6]。相比国内,国外对预印本平台的关注与讨论较早,定量成果较为丰硕。围绕预印本平台论文提交、发布、讨论、传播、利用的整个流程,预印本平台的发展趋势,预印本平台论文质量、开放讨论、平台影响力,学术交流主体对预印本平台的认知、态度、行为,这几个关键问题可以较好地反映预印本平台的发展现状与前景。本文从以上研究热点入手,对国外预印本平台研究进行梳理总结与评价,并提出预印本平台未来的研究方向。
1 文献来源
笔者使用Web of Science(以下简称WoS)数据库检索相关文献。具体为,选择WoS核心合集,在主题字段输入“Preprint”or“arXiv”or“bioRxiv”or“ChemRxiv”,在检索结果中首先基于标题筛选出相关论文119篇,其次对论文内容逐篇甄别,最终确定83篇论文与国外预印本平台相关。
2 国外预印本平台相关研究的内容分析
2.1 国外预印本平台发展趋势
现代科学技术的发展与应用,以及开放科学的学术环境,均为预印本平台带来了重要的发展契机。同时,预印本平台得到各方力量的关注与支持。欧盟第三期“地平线2020计划”旨在建设一个开放的研究成果发布平台,从科学出版物发布研究成果转向在研究过程中更快地分享知识,注重创新成果的扩散与科学数据的开放获取[7]。国际科技医学出版社联盟(STM)2018年度报告指出,预印本平台是学术交流结构的最大变革[8],STM最新发布的2023年技术展望中提到,开放出版平台是未来学术出版的重要趋势[9]。科技电子在线图书馆(Scientific Electronic Library Online,SciELO)在2018年20周年纪念活动上提出与公共知识项目(Public Knowledge Project,PKP)达成协议,合作构建期刊的预印本平台[10]。《美国国家医学图书馆战略规划:2017—2027》强调,发展预印本平台作为学术交流的重要补充[11]。截至2020年5月,全球预印本平台数量达55个,2016年以来,预印本平台更是大量涌现。其中,多学科预印本平台20个,专业的预印本平台分布在自然科学、社会科学、应用科学、生命科学与生物医学等细分学科。统计数据表明,天文与天体物理学、核物理与粒子物理[12]、生物医学学科作者在预印本平台发文较多[13]。在开放获取面临发展瓶颈的阶段,预印本平台成为新的突破口和转折点,SeverR等[14]提出了Plan U计划,希望所有资助者要求作者将研究成果先发布在预印本平台上,并以此推动同行评议、文本挖掘、数字资源的长期保存。
2.2 国外预印本平台质量
国外预印本平台已采用初步的格式和内容审核机制来控制论文质量,学者也对论文质量问题展开了讨论,arXiv预印本平均发表率达65%,其中,凝聚态物理预印本的发表率高达80%[12];bioRxiv预印本2013—2016年的发表率为73%,其中,进化生物学的发表率最高为51.5%,大量论文发表在《Scientific Reports》《eLife》等高影响力期刊上[13]。从发表率、出版流向来看,arXiv、bioRxiv已具有较高的可靠性。从内容差异上看,预印本和已发表论文版本的差异较小[17],这也证明了预印本平台的学术质量较高。
2.3 国外预印本平台开放评论活跃度
预印本平台的及时性、开放性与互动性促进了知识共享、交流与传播,作者能够通过Twitter、blog、E-mail、GitHub等渠道获得同行专家的评论与反馈,进而更新论文版本[16]。但是,预印本平台开放评论的活跃度较低,比如,arXiv版本更新率仅为30%[15];bioRxiv平台上,作者发布预印本与投稿的间隔时间很短,这就意味着,作者获得反馈进而提升论文质量的可能性较小[17]。可见,科研人员更多地将预印本平台作为成果发布、建立优先权的平台,而非交流讨论的平台。
2.4 国外预印本平台的影响力分析
2.4.1 国外预印本平台的学术影响力
引用量是衡量学术成果具备的学术价值的重要依据。学者多从预印本被引次数、预印本对论文被引次数的影响展开研究。不同学科的学术交流行为具有一定的差异[18],物理学、经济学、生物与临床医学预印本文化突出,均建立了权威的预印本平台,研究成果表明,上述学科预印本在正式学术交流系统的被引次数不断提升[19-21],与没有预印本的论文相比,预印本可以获得更多引用,影响力也更大,这在高能物理、太阳物理学、生物医学等学科得到了验证[21-23]。然而,也有学者提出相反的看法,Lariviere V等[12]统计了1995—2010年arXiv和WoS物理学、数学、天文学、天体物理学不同版本论文的被引次数变化,结果显示,预印本的被引率最低。有学者根据预印本平台的特征提出引用优势的影响因素,包括开放获取(OA)、先见优势(EA)、作者自选择(质量)偏倚(SB)的假设[24]。OA对提升预印本平台引用优势的作用较小已形成一定共识,EA和SB的影响不能确定,特别是在数字出版环境下,网络首发和正式出版时滞在缩短,预印本平台的先见优势有待进一步讨论,此外,杰出的作者是否倾向于将优秀的论文发布在预印本平台上有待研究[24-26]。
2.4.2 国外预印本平台的社会影响力
新媒体技术与平台的发展,不仅为学术资源的广泛传播、开放利用提供了多样化的渠道,也提升了学术成果的可获得性以及用户的参与度。传统的引文分析已不能全面评价预印本平台影响力,因此,有学者引入下载量、阅读量、Altmetrics等社会影响力指标。当前的统计结果显示,预印本在Altmetrics值(Twitter转发数、blog条数、Wikipedia提及数、Mendeley读者数)、阅读量方面具有较大优势[16][21]。但不可否认的是,预印本平台在主流媒体的显示度较低,且仅用网络平台相关数据作为预印本平台影响力指标的计算方法也有缺陷[27]。
2.4.3 国外预印本平台的社会网络
预印本平台凭借其开放包容的平台优势,在科学共同体中形成了联系紧密的学术社群。学者已经关注到预印本平台的集聚效应,并将其视为复杂的网络,对其中的关系结构及属性加以分析,以建立社会网络分类模型[28],挖掘学术合作网络,识别跨学科高影响力的预印本[29]。
2.5 学术交流主体对预印本平台的认知、态度、行为
科学共同体的认可和参与是预印本平台可持续发展的根基。学术交流供需链主要由四个部分构成,即产生和利用学术成果的科研人员;支持科学研究的资助者和科研机构;控制论文质量,加工、传播学术成果的出版商;获取、组织学术资源并开展服务的图书馆。在资金端,资助机构、科研管理机构对支持发布预印本已基本达成共识[2][30]。在服务端,图书馆已将预印本平台作为开放获取资源纳入馆藏建设、服务[31]。在知识资源产生与流动端,作者认可预印本平台在加快论文传播、提高成果显示度、建立优先权、传播无法发表但具有学术价值的研究成果、快速评议、优化研究设计与质量、促进合作创新、帮助科研人员早期职业发展的作用[32-34]。同时,各方也表达了对预印本平台缺少严格的同行评议、缺乏明确的使用许可、缺失学术伦理审查的担忧,这些因素可能导致论文质量良莠不齐、科研成果被剽窃、作者一稿多投等问题[35]。可以看出,若预印本平台能够保证较高的学术质量,同时保障作者的权益,科研人员对预印本平台的态度还是积极的。为积累优质资源、抢占市场先机、争夺学术出版话语权,学术期刊对预印本平台的态度逐渐开放并支持。早期的研究表明,数学和物理学的编辑更倾向于录用预印本[27]。如今,开放存储政策登记数据库RoMEO显示,14家大型出版集团中,有78%的集团允许作者发布预印本[36]。实时更新的Wikipedia统计了27家主要出版机构的预印本投稿政策,其中25家机构允许或支持发布预印本[37]。此外,预印本平台在公共卫生突发事件中共享数据与快速传播最新研究成果的优势得到关注与认可,埃博拉和塞卡疫情期间,全球30多个最负盛名的公共卫生期刊发布声明,允许在出版之前共享预印本[38];新冠肺炎疫情期间,预印本平台是快速共享研究数据和成果的重要渠道[39]。预印本平台通过与学术期刊的关联也加快了论文正式发表的速度。
3 国外预印本平台研究现状总结
科学研究的本质在于学术交流[40],学术交流的方式有正式交流与非正式交流之分,情报学家米哈依洛夫将预印本平台视为5种非正式交流方式之一[41]。互联网通讯技术的发展使预印本平台走向数字化管理的新形态,21世纪初,Herbert Van de Sompel等人通过arXiv学术生态系统描述科学交流的通用路径模型[42],可见,预印本平台在学术交流系统中的作用日益重要。当前,预印本平台向多领域拓展并被纳入全球开放获取计划,处于繁荣发展的阶段。
权威预印本平台的质量具有较强的资源汇聚能力,科研人员可将其作为获取学科前沿热点的知识库,信息服务机构需将其纳入数字资源建设路径。预印本平台汇聚并提供自由获取学术资源的优势,让出版商重新思考其价值定位,并致力于在加强数字出版技术运用、提升知识服务能力与创新产品布局等方面实现战略转型升级。预印本已成为被引文献来源,注册数字对象标识符(DOI)能提升预印本的引用规范与显示度。预印本具有引用优势,其中的影响因素有待探索。预印本平台构建的开放评论机制与数字传播矩阵促进了学术社群的交流互动,并形成了广泛的社会影响力。规范化的网站建设也为拓展预印本平台影响力评价维度提供了可分析的数据集。学术交流系统的参与主体大多认识到预印本平台在促进知识共享,加快知识传播、开放创新,成果首发等方面的重要作用,均以积极的态度支持预印本平台发展。当然,预印本平台也面临发展瓶颈与阻碍,缺少同行评议不能完全阻挡低质量论文的发布;平台的开放评论活跃度较低,科研人员参与讨论的激励机制缺失;论文科研道德、学术伦理审查等学术规范存在缺陷。
4 预印本平台未来研究展望
预印本平台作为学术交流系统的重要组成,从诞生之日就引起了学界的关注与讨论,国外的研究成果已经涉及多个层面,但仍有许多亟待解决的问题,未来需要在理论体系构建与实践应用上不断深化。第一,预印本平台的发展趋势以调研arXiv、bioRxiv权威平台为主,研究样本具有局限性,且主要关注发文量等外部特征,对预印本平台内部运行机制,比如,运营主体、经费来源、发展规划等缺乏关注。第二,对新兴预印本平台仅限于数量、学科分布的介绍,缺乏系统化的持续跟踪。第三,在预印本平台开放活跃度方面,缺少激励作者参与开放评论有效机制的探讨。第四,在预印本平台影响力评价方面,学术影响力主要基于引文分析,针对预印本平台论文影响力是否比传统期刊论文更有优势,学界尚有争论。第五,当前研究缺少对发文机构影响力分布、作者影响力分布的评价。有学者结合Altmetric等社会影响力指标来评价预印本平台的影响力,但未与引文分析指标结合起来讨论指标间的相关性,也未形成合理的指标评价体系。第六,在学术主体的认知、态度、行为的研究上,对预印本平台利用环节的关注较少。比如,科研人员发布预印本的最终目的是否是为了将成果发表在学术期刊上?科研人员倾向于引用预印本还是学术期刊上的论文版本?期刊对科研人员引用预印本的态度如何?科研管理机构对预印本引入科学评价体系的态度如何?这些问题的解答都有利于全面了解用户需求,提升预印本平台的服务质量,规范科研人员的论文引用行为,健全科研评价体系,改进预印本平台与正式学术交流系统的双向互动机制,构建高效率传播、开放共享、规范透明的学术交流生态圈。
通过以上分析,本文认为未来值得关注的研究方向有:
第一,持续研究新兴预印本平台发展态势,对其中主办机构、经费来源、发展规划、质量控制方法、学术规范等现状进行研究,探索有效的平台管理运行模式。
第二,加强科研人员自治的预印本平台开放评论机制研究。
第三,深入探讨预印本平台影响力指标体系的构建,为客观评价预印本平台在学术交流系统的地位提供事实依据,从而制定有针对性的预印本平台发展政策。
第四,关注科研人员、学术期刊、科研管理机构对预印本平台的认知、态度、行为,从而有效解决预印本平台与学术期刊之间的矛盾,明确预印本在学术评价体系中的地位与作用。
5 结语
当下,预印本平台已实现繁荣发展,其在加快学术交流、提高科研成果传播效率、增强科研成果的可见性与可获取性等方面的重要作用,已获得学术共同体的广泛认可,预印本已成为众多领域科研人员发布成果的首选。此外,新兴预印本平台大量涌现,权威预印本平台的学术资源汇聚能力不断增强,影响力持续扩大。展望未来,预印本平台还须强化学术规范、控制内容质量、开放评论功能。
参考文献
[1]COBB M. The prehistory of biology preprints: A forgotten experiment from the 1960s?[J]. Plos Biology,2017 (11): 12.
[2]GUNNARSDOTTIR K. Scientific journal publications: On the role of electronic preprint exchange in the distribution of scientific literature[J]. Social Studies of Science,2005 (4):549-579.
[3]arXiv[EB/OL].(2019-12-11)[2020-05-21] .
[4]GINSPARG P. ArXiv at 20 [J]. Nature,2011(476): 145-147.
[5]CARRIVEAU K L Jr. A brief history of e-prints and the opportunities they open for science librarians[J]. Science & Technology Libraries,2001(20):2-3.
[6]ANTELMAN K. Do open-access articles have a greater research impact? [J].College& Research Libraries,2004 (5):372-82.
[7]欧盟发布第三期“地平线2020计划”(2018—2020年)[EB/OL].(2019-07-22)[2020-05-21]. .
[8]STM Report 2018[EB/OL].(2019-12-22)[2020-05-21]. .
[9]STM launches Tech Trends 2023 [EB/OL].(2019-07-22)[2020-05-21]. .
[10]PKP and SciELO Announce Development of Open Source Preprint Server System[EB/OL].(2019-07-22)[2020-05-21]. .
[11]National Library of Medicine. A Platform for Biomedical Discovery and Data-Powered Health: Strategic Plan 2017—2027[EB/OL].(2018-09-22)[2020-05-21]. .
[12]LARIVIERE V,et al. “arXiv E-Prints and the Journal of Record: An Analysis of Roles and Relationships.”[J].Journal of the Association for Information Science and Technology, 2014 (6):1157-1169.
[13]ABDILL R J, Blekhman R.Tracking the popularity and outcomes of all bioRxiv preprints[J]. Elife,2019(8):21.
[14]SEVER R, EISEN M, INGLIS J. Plan U: Universal access to scientific and medical research via funder preprint mandates [J]. Plos Biology,2019(6):4.
[15]KLEIN M, BROADWELL P, FARB S E,et al. Comparing Published Scientific Journal Articles to Their Pre-print Versions[J]. International Journal on Digital Libraries, 2018.
[16]SCHLOSS P D.Preprinting Microbiology [J]. Mbio,2017 (3):11.
[17]ANDERSON K R. bioRxiv: Trends and analysis of five years of preprints [J]. Learned Publishing,2020,33(2):104-109.
[18]JENNY, SPEZI, VALERIE C L,et al. Towards an understanding of the relationship between disciplinary research cultures and open access repository behaviours[J]. Journal of the Association for Information Science & Technology,2015,67(11):2710-2724.
[19]BROWN C. The E‐volution of preprints in the scholarly communication of physicists and astronomers[J]. Journal of the American Society for Information Science and Technology,2001,52(3):187-200.
[20]Li X M,et al.The role of arXiv, RePEc, SSRN and PMC in formal scholarly communication [J]. Aslib Journal of Information Management,2015,67(6): 614-635.
[21]NICHOLAS F, FAKHRI M, PHILIPP M,et al. The effect of bioRxiv preprints on citations and altmetrics[EB/OL].(2019-06-22)[2020-05-21]. .
[22]Gentil-Beccot A, MELE S, BROOKS T C. Citing and reading behaviours in high-energy physics [J] . Scientometrics,2010,84(2):345-355.
[23]METCALFE T S. The citation impact of digital preprint archives for solar physics papers[J].Solar Physics,2006,239(1-2):549-553.
[24]KURTZ M J, EICHHORN G, ACCOMAZZI A,et al. The effect of use and access on citations [J]. Information Processing & Management,2005,41(6):1395-1402.
[25]MOED H F. The effect of "Open access" on citation impact:An analysis of ArXiv's condensed matter section [J] .Journal of the American Society for Information Science and Technology,2007,58(13):2047-2054.
[26]DAVIS P M, Fromerth M J. Does the arXiv lead to higher citations and reduced publisher downloads for mathematics articles? [J]. Scientometrics,2007,71(2):203-215.
[27]HARTER S P, PARK T K. Impact of prior electronic publication on manuscript consideration policies of scholarly journals [J]. Journal of the American Society for Information Science,2000,51(10):940-948.
[28]CATANZARO M, CALDARELLI G, PIETRONERO L. Assortative model for social networks [J]. Physical Review E,2004,70(3):4.
[29]GOPALAN P K, BLEI D M. Efficient Discovery of Overlapping Communities in Massive Networks [J] .Proceedings of the National Academy of Sciences of the United States of America 2013,110(36):14534-14539.
[30]解贺嘉,刘筱敏,景然. 预印本平台bioRxiv影响力实证研究及建议[J]. 中国科技期刊研究,2019,30(11):1218-1224.
[31]HEY T, HEY J. e-Science and its implications for the library community [J]. Library Hi Tech,2006,24(4):515-528.
[32]BOURNE P E, POLKA J K, VALE R D,et al. Ten simple rules to consider regarding preprint submission [J] .Plos Computational Biology,2017,13(5):6.
[33]EYAENBACH G. The impact of preprint servers and electronic publishing on biomedical research [J] .Current Opinion in Immunology,2000,12(5):499-503.
[34]SARABIPOUR S, DEBAT H J, EMMOTT E,et al. On the value of preprints: An early career researcher perspective [J]. Plos Biology,2019,17(2):12.
[35]KAISER J. THE PREPRINT DILEMMA Biologists are posting unreviewed papers in record numbers. Here's a survival guide[J]. Science,2017,357(6358):1344-1345.
[36]DA SILVA J A T, Dobranszki J[J]. Preprint policies among 14 academic publishers. Journal of Academic Librarianship,2019,45(2):162-170.
[37]List of academic journals by preprint policy. [EB/OL]. [2020-04-05] .
[38]JOHANSSON M A, REICH N G, MEYERS L A,et al. Preprints: An underutilized mechanism to accelerate outbreak science [J] . Plos Medicine,2018,15(4):5.
[39]程冰,檀博,孟连生,等. 新冠肺炎疫情初期国内外专业文献出版情况分析[J]. 科技与出版,2020(4):40-45.
[40]GARVEY W D.Communication: The Essence of Science[M]. New York: Pergamon,1979.
[41]徐丽芳,严玲艳,赵雨婷,等. 攻守之间的嬗变:2019海外科技期刊出版动态研究[J]. 科技与出版,2020(3):35-46.
[42]孙玉伟. 数字环境下科学交流模型的分析与评述[J].大学图书馆学报,2010,28(1):41-45