关键词: 大数据 流程优化 选题策划 精准约稿 学者画像
英文关键词: Big data Process optimization Topic selection Accurate manuscript invitation Scholar portrait
作 者:周洁 上海飞机设计研究院《民用飞机设计与研究》编辑部,上海市浦东新区金科路5188号 201210
摘 要:【目的】 利用大数据优化科技期刊出版流程,助力科技期刊发展。【方法】 结合《民用飞机设计与研究》的出版实践,分析大数据环境下科技期刊传统出版流程存在的不适应性,提出可以在选题策划、组稿约稿、审稿专家选择和编辑校对4个环节引入大数据分析的技术和工具,改进现有工作流程。【结果】 利用万方和中国知网等数字出版服务商提供的大数据服务,能够及时发现学科热点,精准组稿,精确选择审稿专家,提高编校工作效率。【结论】 科技期刊应当在出版流程中引入大数据分析的技术和工具,以提高科技期刊出版质量和工作效率。
信息时代带来了数据大爆炸。研究发现,通过对海量数据进行收集整理、挖掘分析,可以预测事物的发展趋势或用户的行为规律。2009年,“大数据”作为新的专业术语和商业模式引起各界关注。实力雄厚的互联网企业纷纷利用大数据分析推出新的服务模式,比如亚马逊利用大数据开展图书推介活动,今日头条通过分析用户的浏览记录为用户推荐其感兴趣的内容等。由于海量数据的出现,许多商业模式正在重塑,随之而来的是工作流程的改变。
大数据同样给科技期刊出版行业带来深刻影响,许多学者对此进行分析。在大数据应用方面,学者们从整个行业的角度出发,分析大数据时代科技期刊面临着生存环境的重构,指出科技期刊面对的机遇和挑战,并提出相应的转型对策。部分学者则基于编辑个人视角,从科技期刊编辑工作的不同细节,探讨利用大数据促进编辑工作的方法。在出版流程优化方面,梁瑛探讨大数据分析在图书出版流程中的具体应用,张凤丽从管理角度分析科技期刊稿件处理流程的优化,徐清华等则论述了编校排版流程的优化。国内文献调研发现,很少有研究从编辑部管理者的视角,系统分析如何利用大数据优化科技期刊出版流程。
从科技期刊编辑部管理者的角度分析,科技期刊出版流程在大数据时代存在2点不适应性亟需优化。(1)不适应科学交流的需要。科研工作者的诸多互联网行为,例如在线交流、主题检索、社交媒体使用等,在互联网上积淀了大量的行为数据,据此可以了解其科研动态。科技期刊传统的约稿组稿方式未能很好地利用这些数据,导致期刊编辑对科研工作者的动向了解得不够及时、全面,组稿约稿缺乏精准性。(2)不适应大数据的应用趋势。科技期刊传统出版流程中,在选题策划和寻找合适的作者以及审稿专家方面,严重依赖编辑的个人经验和判断,属于编辑个人隐性知识,未能外化为整个编辑部的显性知识。大数据时代下对知识管理产生的积极影响有助于将个人的隐性知识转化为组织的显性知识,即由“经验判断”向“数据分析”转变。然而现阶段很多科技期刊并未在出版流程中很好地利用大数据辅助出版工作。
本文从科技期刊编辑部管理者的角度出发,探讨如何利用大数据优化出版流程、辅助出版工作,从而有效克服上述不适应性,提高科技期刊的出版质量和工作效率。
1 、利用大数据优化科技期刊出版流程的思路
当下,国内科技期刊界已经开始关注大数据对于科技期刊出版的积极意义,并且开发了一些大数据分析工具。基于当前科技期刊出版流程在大数据环境下表现出的不适应之处,结合已有的探索实践,笔者从选题策划、约稿组稿、审稿专家选择和编辑加工4个环节探讨利用大数据优化科技期刊出版流程的思路。
1.1 、发现学科热点,优化选题策划
目前,我国科研经费逐年上涨,科研产出日益增加,新技术和新成果不断涌现。面对科研新课题层出不穷的局面,编辑显然难以准确和全面地把握本期刊学科热点研究方向并进行选题策划。大数据所具有的“从海量数据中发现规律和趋势”的特征则可以帮助编辑在选题策划方面作出更优的决策。
科技期刊编辑在选题策划时,要善于利用各种网络工具获取大量数据并进行深度加工分析,对数据进行归类、整理和优化,拓宽选题视野,优化期刊选题。《民用飞机设计与研究》属于航空类期刊,在中国知网航空知识服务平台(http:/ / avia.cnki.net/ #xms)首页“科研服务”类目的“学术趋势搜索”服务项目中,利用关键词进行检索后,系统反馈“学术关注度”和“用户关注度”2个曲线图。其中“学术关注度”指该选题关键词对应的文献随时间的变化被学者所关注的程度,以被引频次衡量;“用户关注度”指该选题关键词对应的文献在一定时间段内被用户研读的频率,以下载次数衡量。被引频次客观地说明论文被使用和受重视的程度,以及在学术交流中的作用和地位;下载次数反映了期刊在网络环境下的网络传播影响力。下载次数较高但被引频次尚低的文献具有成为热点文献的潜质。通过学术趋势搜索,分析下载次数和被引频次,可以准确地判定该选题是否热门,是否受到读者关注,是否有可能产生高被引频次论文。此外,中国知网“大数据研究平台”中的“学术热点”查询模块的检索结果包括热点主题、主要知识点、热度值、主题所属学科名称、主要文献数量、相关国家课题数量、主要研究人员和主要研究机构数量等信息,这也可用来分析确定当前研究的热点、难点以及空白点,把握选题方向。
2017年5月国产大飞机C919首飞成功,笔者以“首飞”为关键词搜索学术趋势,其历年该主题词的学术关注度总体呈上升态势,说明航空业界学者非常关注飞行器的首飞。据此判断,围绕大型客机首飞的选题很可能成为航空界的热点关注话题,因此,笔者所在的编辑部就该主题向相关学者约稿,在学者中获得了很好的反馈。
1.2 、洞察学者动态,强化组稿的精准性
有了切合科研热点的选题,还需要寻找合适的作者完成选题。传统的科技期刊出版流程中,稿件来源以作者投稿为主。在编辑由传统编校型向选题策划型转型后,这种“等米下锅”的组稿方式越来越不能适应现代快节奏的传播环境,应当向“主动出击”的约稿方式转变。撰稿专家要么由组稿专家推荐,要么由编辑根据工作中所掌握的作者信息进行选择,而最终确定需要召开定稿会讨论,决策的依据多来自个人工作经验,效率低下,并且缺乏准确性。主动约稿工作对编辑洞察学者动态、寻找合适作者的能力提出了挑战。
组稿与约稿应该目的明确、有的放矢,确保为选题找到最契合的撰稿人。当前,全球科研人员数量众多,每年科研产出体量庞大,据联合国教科文组织发布的《2015年科学报告》数据:全球范围内约有780万科学家和工程师从事科研领域工作,自进入21世纪,科研人员的数量是过去的2倍多。在此情况下,科技期刊要从中寻找合适的本学科领域内的撰稿人,则有赖于准确掌握与科学分析科研人员情况及其研究动向。大数据技术的出现,可以为编辑组稿与约稿提供基于数据分析结果的参考依据,强化组稿的精准性。
为此,科技期刊编辑一方面需要建立和完善主动投稿的作者信息库,实时跟踪他们的研究进展和成果,适时提出约稿要求;同时,长期跟踪本领域国家重大科技项目、重点基金项目、权威科学家的研究成果等,通过挖掘和分析数据,掌握该领域重要专家学者正在进行的研究方向,有的放矢地重点约稿。另一方面,还要定期回溯分析本期刊过往论文情况,对于高被引频次、高影响力论文的作者给予适当奖励,将其培育成期刊的忠实作者。在策划了热点选题后,即可从这些作者中选择最合适的作者,实现精准约稿。
1.3 、构建学者画像,精确选择审稿专家
近年来,我国科研工作者的论文被国际知名学术期刊撤稿的事件频繁发生。2015年3月,英国现代生物出版集团撤销了旗下12种期刊的43篇论文,其中41篇来自中国;2015年8月,施普林格撤回了旗下10种学术期刊已发表的64篇中国作者的论文;2017年4月21日,施普林格自然出版集团撤销旗下《肿瘤生物学》所刊登的107篇中国作者论文。频发的撤稿事件均直指科技期刊出版流程的重要环节——同行评审,其根源反映的是基于作者推荐制下的同行评审专家选择的漏洞和弊端。如何精准地选择同行审稿人是长期困扰科技期刊的一大难题。
要规避作者推荐制下同行评审专家选择的弊病,健全同行评议制度,较为可行的方法就是由编辑选择同行评审专家。为此,科技期刊必须构建一个信息完备的审稿专家库,以便将论文送给合适的审稿专家审议并及时出具权威的同行评审意见。借鉴互联网行业的“用户画像”概念,笔者提出了“学者画像”的概念。“学者画像”指科技期刊编辑依据学者提供和主动挖掘而获得的学者相关信息,通过建立学者的相关学术行为和审稿行为的模型,构建每位学者的独特画像,并在此基础上建立本期刊的审稿专家库。构建学者画像的核心工作是给学者“贴标签”,标签是通过对学者的注册信息与行为信息进行分析而得到的高度精炼的特征标识。其中,学者注册信息在实际提取中还需要清洗数据;学者动态的行为信息隐藏于用户的随机互联网行为和过往审稿行为中,具有隐蔽性,需要通过数据分析进行挖掘。结合实际工作情况,笔者提出了利用大数据构建完整学者画像的流程。
首先,收集基础数据。编辑部通过学者提供的姓名、性别、年龄、毕业院校和学历、研究方向、工作单位和职称,以及通信地址和联系方式等信息,按照学历、研究方向或职称分类整理,据此可对学者有初步了解。
其次,建立学者行为模型。包括建立学术行为模型和审稿行为模型,前者为扩充审稿专家提供依据,后者为指定审稿专家提供参考。学术行为建模指收集、挖掘、分析学者的研究趋势画像、学术关系画像和学科影响画像等动态标签信息,掌握学者科研动态。其中,研究趋势画像基于学者主持的重大科研基金项目、发表论文总数以及核心期刊论文数量、发表论文年度分布以及发文期刊名录等信息挖掘;学术关系画像则基于该学者的导师、与学者之间存在合作关系的其他学者以及机构等信息得出;学科影响画像基于学者学术成果的总被引频次、高被引论文、引用该学者论文的作者和期刊等信息提取。审稿行为建模指深入挖掘审稿专家过往的审稿行为信息,对于审稿专家的时间安排、审稿速度和态度、退稿率、研究论文的偏好、年均(月均)审稿数量等指标建立模型,以此作为指定审稿专家的依据。
最后,构建学者画像。基于学者的基础信息和行为信息对应匹配,据此为学者构建详细的画像,从而较为精确地判断学者的科研能力、学术动向、合作关系、审稿意愿等。
在构建学者画像过程中,编辑要善于利用数字出版服务商提供的各种工具。例如,在挖掘学者信息时,万方数据知识服务平台“万方学术圈”的服务能够提供强有力的帮助,凡学术成果被万方收录的作者均可申请成为认证学者,并且可以在学术圈中被检索到,由此万方数据也积累了大量的学者数据。
1.4 、辅助编校工作,提高出版效率
在期刊编校工作中,校对参考文献是一项非常繁琐的工作,包括引文著录格式的校对和引文内容的校对。引文著录格式的校对主要包括参考文献著录格式是否规范、引文标注序号是否连续等内容的校对;而引文内容的校对尤其需要引起注意,因为科技论文中涉及大量的其他文献实验数据、流程的引用,其准确性的要求极高。以前,这些工作主要靠手工完成,效率低,并且容易产生错误,拖长了期刊的出版周期,不适应科学技术迅猛发展背景下及时发表科研成果的要求。
参考文献校对这类费时费力的机械化工作,完全可以利用大数据进行辅助,以提高效率。中国知网研发的腾云期刊协同采编系统将大量数据纳入参考文献比对库,系统可以自动将稿件的参考文献信息与中国知网比对库文献进行比对,审核参考文献内容是否准确属实、格式是否完整正确,并且给出推荐著录格式。此外,还可以审查文末参考文献的一致性,发现文中引文序号不连续或者重复的疏漏,极大地提高了编校工作的效率。
2 、结论
当前,大数据技术的发展方兴未艾,传统科技期刊的出版流程中存在着不适应科学交流的需要和不适应大数据技术的应用趋势等问题。结合实践与分析,认为可以在出版流程的选题策划、组稿约稿、审稿专家选择和编辑校对4个环节利用大数据的挖掘和分析技术,帮助科技期刊提高出版质量和工作效率。需要特别指出的是,利用大数据分析工具构建学者画像是一项长期的、动态的工作,需要在具体实践中不断积累数据,改进分析模型,笔者所在编辑部对此仅进行了简单的尝试,更加科学、合理的方法有待在今后的实践中进一步完善。