【作 者】张勇、王春燕、王希营:《兰州大学学报》编辑部
【摘 要】人工智能作为一种颠覆性的技术将对学术期刊的编辑出版带来重大影响。学术期刊使用简单的数据收集和搜索已无法应对当前社会对信息高速传播的需求,引入人工智能技术将大大缩短稿件处理时间,提高期刊影响力。人工智能将会与学术期刊的编辑出版领域深度融合,建立以大数据为基础、互联网为手段、人工智能为核心的智能化新格局,期刊的编辑加工最终会向全流程智能化的方向发展。信息时代的学术期刊编辑必须是掌握多种技术的复合型跨界编辑人才,当新技术出现时,必须采取积极开放的态度,应对时代进步与技术发展的挑战,迎接智能化时代的到来。
【关键词】人工智能;学术期刊;智能出版;融合发展;人机协同
人工智能是被研究用于模拟、延伸和扩展人的智能的理论、方法、技术及应用的技术科学,是研究如何使计算机去完成以往只有人类才能完成的需要高智能的工作[1]。人工智能可以对人的意识和思维过程进行精确的模拟,能像人一样思考,甚至可能在未来超越人的智能。目前人工智能领域的研究和应用主要包括机器学习、计算机视觉、机器人、指纹识别、人脸识别、语音识别、图像识别、自然语言处理、自动规划和智能搜索等[2]。人工智能自诞生以来,理论和技术日益成熟,应用领域也不断扩大,未来带有人工智能的科技产品将会越来越广泛地进入人们的生活,覆盖政治、经济、社会、生态、军事等各个领域。
借助于互联网、大数据、深度学习技术的发展,信息和知识传播的速度越来越快、范围越来越广。人工智能高潮的到来使得编辑出版行业的从业者在理念和实践中感受到了广泛的冲击和影响。人工智能软件自动撰写新闻稿已经不是新鲜事物,早在2013年美国人工智能技术平台Wordsmith自动撰写的新闻稿件数量就达到3亿篇,超过了所有主要新闻机构的稿件总数,2014年,撰写新闻稿超过了10亿篇[3]。
2017年7月国务院发布了《新一代人工智能发展规划(国发〔2017〕35号)》,标志着发展人工智能被列入国家级战略层面,成为中国未来提升国际竞争力的主要手段[4]。新一代人工智能战略的实施,是科技创新的重大行动,将直接推动中国信息、化产业从数字化、网络化阶段进入智能化阶段。对于学术期刊编辑出版领域也是如此,国内学术期刊目前已经基本完成从传统印刷出版向数字化出版的转型[5],各种基于数字化技术建立的数据库和网络出版平台也已经颇具规模,可以通过有效的数据挖掘、分析整合实现信息共享。人工智能技术的高速发展将会对学术期刊的编辑、出版、发行产生颠覆性的变革,推动学术期刊的数字化出版进入高速发展阶段,下一步的发展方向就应当以大数据和“互联网+”为基础,积极引入人工智能技术,以自动化、智能化系统部分取代传统人工作业,向学术期刊编辑出版智能化的阶段迈进。
一、人工智能技术对学术期刊质量的影响
读者在数字化和互联网时代的阅读习惯已经与传统的阅读习惯产生了极大的差异,随着社会的高速发展和人们生活节奏的加快,能够用于系统性的阅读和获取信息的时间越来越少,时间碎片化的现象日益严重,这就对所获得信息的精准性提出了更高的要求。学术期刊数字化以来,作者的写作方式、投稿过程和稿件的审理、编辑处理、出版发行,相比传统的纸质印刷模式,无论是出版效率还是编校质量都有了翻天覆地的变化,同时也为学术论文数据库的建立奠定了坚实的基础。互联网和大数据的发展使得读者可以从海量的学术信息中轻易找到适合自己的内容,节省了大量的时间。但是目前在学术期刊的编辑出版过程中使用的数据库和网络出版平台仅仅属于“大数据+互联网搜索”的范畴。现有的网络学术出版平台都是以大量的数据为基础,使用搜索引擎算法在数据库中进行检索、比对和简单的分析,最终得出用户预期的结果。无论是读者搜索需要的论文,还是编辑部对作者投稿进行的“文字复制比”检测;无论是简单检索,还是增加了很多选项的高级检索,都是基于以上基础进行的。在学术信息数字化的初期,数据量不是很大的情况下,可以很好地满足专业用户的需求,但是随着数据量的飞速增长,交叉学科的日益增多,学科专业划分越来越细,这种仅仅基于海量数据的检索出现了检索结果过多,无用信息和错误结果增加,搜索和分词需要越来越多的专业技巧,检测系统无法识别论文中的插图、表格和公式等缺陷,使得检索结果不能满足用户的需求。例如,在中国知网的学术不端文献检测系统中对中文数学类投稿进行测试时,很多稿件的检测结果都显示“文字复制比过高”。经过仔细分析发现,大部分数学类论文中的文字占比非常少,其中的学术思想主要以大量的数学公式来表现,但是这些公式在学术不端文献检测系统中无法被识别,系统更加无法识别公式之间的逻辑关系是否正确,是否重复,而剩余的少量文字都属于专业的术语,具有相同的表达方式,导致了此类稿件无法通过文字复制比检测。由于数学公式表达相对严谨,推理的过程也相对严谨,可以总结出严格的规律,引入人工智能程序就可以进行公式的推导和证明,准确地识别数学类论文中是否存在错误和剽窃的内容。在其他自然科学领域目前也存在类似问题,由于检测系统并不具有“智慧”,虽然可以通过搜索、比对的方法在论文中检测出重复的文字和语句,但对于一些变换了语序和表达方式的抄袭语句却无法识别,特别是对一盗用其他论文中插图的行为几乎毫无办法。但如果使用人工智能技术对论文中的语句和插图进行深度识别,甚至对整篇论文的学术价值进行初步的判断,就可以大大降低学术不端行为的生存空间,提升学术期刊的学术质量和影响力。
学术期刊仅仅使用简单的数据收集和搜索算法已无法应对当前社会对学术信息高速传播的需求。已有的学术信息数据库中的海量信息和搜索引擎虽然为人工智能的“自我学习、深度学习”创造了基础和丰富的资源,但当前学术期刊的编辑出版尚未真正触及和使用人工智能技术,限制了学术期刊的传播效率和影响力的提升。
二、人工智能技术对学术期刊编辑出版流程的影响
学术期刊的编辑出版流程已经由传统的纸质投稿、邮寄送审进入网络投稿、远程审稿、数字化出版的阶段,经历了由印刷出版向数字化出版的革命性变革。传统的综合性学术期刊的编辑出版工作流程如果引入人工智能技术,不仅可以根据投稿的题目、摘要、关键词、内容等信息、进行自动鉴定和审核,剔除内容定位不适合的稿件,还能够根据逻辑化排序和个性化组织,自动选择并发送稿件给适合的专家进行审稿,协助编辑加工校对等。几乎在学术期刊编辑出版的所有环节,人工智能都能够发挥巨大的作用。
在投稿阶段,对作者来说,首先要在众多的学术期刊中选择适合自己科研方向和论文水平的刊物,可能需要耗费大量的时间,如投稿的期刊与自己论文的研究领域并不契合,或者因为信息不对称,对编辑部的最新投稿要求、栏目设置等缺乏了解,就会使得稿件多次被拒,浪费时间和精力,错失学术信息公开的最佳时机。对学术期刊编辑部来说,虽然可以通过互联网平台收到大量投稿,但其中存在很多与本刊发文方向、特色栏目严重不符甚至是一稿多投的稿件,虽然目前已经有了数据库自动比对一,但仅仅是对来稿的标题、关键词、摘要、文字重复率等进行简单的对比检测,对于很多研究领域类似的稿件常会出现误报的情况,仍然需要处理投稿的编辑人员逐条审核和分析,以判断是否加入稿件库,编辑人员大量的时间和精力耗费在碎片化信息的筛选和整合上。
在学术期刊智能化时代,引入了人工智能的搜索引擎可以根据作者的要求和上传稿件的内容对已有数据库中的学术信息,如相关论文的研究热点、研究趋势、作者所在机构、刊物影响力、引用情况等进行智能分析和逻辑判断,向作者推荐符合要求的几种刊物,最终由作者决定投稿的期刊,甚至可以根据期刊的投稿和格式要求,自动对所投稿件的排版格式、引用文献等基本信息进行预处理,大大简化投稿流程,节省作者的投稿时间。
学术期刊编辑在对投稿进行筛选时如果使用带有人工智能的稿件处理平台,就可以在已有学术信息数据库中进行初步的智能分析,不仅仅是简单地判断文字复制比,还可以对论文的研究内容是否新颖、图表是否规范、实验数据是否符合逻辑、公式推导和证明是否正确、论文内容是否与已有成果类似、弓}用文献是否合理等关键信息进行智能分析和判断,为编辑对稿件的初审提供详尽而有力的参考,切断学术不端行为的源头。
在专家审稿阶段,现有的送审方式是从编辑部自建或来源于网络出版平台的专家数据库中根据稿件的关键词选择审稿专家,然后通过电子邮件方式发送审稿邀请。对于专业性的学术期刊,这种方式基本能够满足审稿需求,但对于综合性学术期刊(如综合性高校学报)来说,由于稿件的学科、来源、研究方向多样,要为每一篇通过初审的稿件选择适合的审稿人是一件很不容易的事情。特别是很多交叉学科的出现,根据论文关键词选择的审稿人往往并不是该领域的研究者,导致稿件送审被拒,重新更换审稿人又延长了稿件的处理时间。在选择审稿专家时就引入人工智能技术,就可以在审稿人数据库中根据研究领域、审稿记录、审稿效率、预设条件等信息自动选择最适合的审稿人,进行逻辑分析和智能排序,形成审稿人列表,并根据审稿人的个人信息自动完成审稿邀请邮件的发送,还可以实时监控稿件状态和审稿人的反馈信息,一旦出现审稿超时,能够在最短时间内自动向列表中的下一位审稿人发出审稿邀请,一旦收到审稿人的回复意见,可以通过短信、邮件、手机APP等及时通知编辑进行处理,大大提高审稿效率,缩短审稿周期。
在稿件的编辑加工阶段,人工智能程序不仅能够完成简单的错别字、语法的更正,还能根据全文的逻辑顺序识别标题、图题、表题、专业名词的表述、参考文献等是否前后文一致,引用是否正确。除了能够处理文本信息以外,人工智能还能够通过图像识别算法,在理解图像和说明文字语义的逻辑关系的基础上,实现图文互译,自动根据图中的内容或数据,为插图补充准确的描述性文字;或自动为一段文字描述配上插图,为一段文本格式的数据形成曲线图等[6]。将编辑工作中简单、枯燥、重复性的部分交给人工智能程序来完成,可以大大减轻编辑的工作量,提高工作效率,缩短稿件的出版时间。
在完成稿件的编辑处理后,后续的排版、校对等简单重复性的工作则完全可以由人工智能程序来完成。有学者提出了一种自动生成视觉文字展示布局的系统,该系统将空间布局、语义色彩、字体元素等信息集成到统一的多媒体模块内,实现了视觉文本版面的自动设计[7]。随着跨媒休数据处理的突破和发展,人工智能将打破媒体间的差异,以大数据为基础、自我学习和深度学习为手段,实现跨媒体的信息精准编辑,目前的校对员、排版员、制图员的岗位将完全被人工智能所取代。
当学术论文完成了编辑出版,进入学术成果的发行传播阶段时,人工智能的巨大影响更是不可估量。人工智能程序可以在极短的时间内将学术论文向几乎所有的大型学术论文数据库发送、上传,并根据读者的研究领域、阅读习惯等大数据进行实时分析,理解读者的信息、需求,向相关领域的读者进行精准的实时推送。人工智能还能根据读者的行为信息,利用科研平台、社交平台的数据挖掘技术获取关键信息,通过语义分析、内容分析等进行处理,分析读者的阅读兴趣,从多角度完善读者的兴趣模型[8],进一步优化推送的精准度,改进学术成果在数据库中的搜索效率,实现传播效果的最大化。
学术期刊编辑利用人工智能程序完成期刊的编辑加工与人工智能技术(如文本语义处理技术、图像识别技术、深度学习技术[9])的发展有着重大关联,其研究水平的高低决定了人工智能在学术期刊编辑出版领域的应用水平。随着智能化语言处理和图像识别技术的不断提高,人工智能程序将会与学术期刊的编辑出版领域深度融合,学术期刊的编辑加工流程最终会向全流程人工智能化方向发展。
三、人工智能技术对学术期刊编辑人员的影响
人工智能与学术期刊出版的融合发展一定程度上将编辑人员从原有的工作模式中解放出来,减轻了编辑人员的工作量,可以将精力和时间投入更具有创造性、思想性和需要感性经验及价值判断的工作中去。人工智能和人脑的分工合作、取长补短,体现了人工智能与从业人员在产业融合中的协同发展。要达到这种理想的协同状态,不仅需要不断完善人工智能技术,也对学术期刊的编辑从业人员的学识、阅历、科学素养、人文素质以及对待科学问题的态度和责任心提出了更高的要求。
在向学术期刊出版智能化迈进的过程中,新一代的学术型编辑必须具备清晰、缜密的逻辑思维能力,敏锐的判断力和思辨能力,较高的学术水平,一定的科研能力,较高的语言文字能力和审美鉴赏能力;还必须具备广泛的知识休系,如编辑学、语言学、信息科学、计算机和网络知识等。在人工智能与编辑出版融合发展的技术背景下,编辑人员必须了解人工智能的基本原理和思维过程,具有熟练使用工具软件、网络检索和数据库的能力;熟悉人工智能软件的基本原理和使用技能,能够运用人工智能程序对学术稿件进行编辑加工;熟练掌控人工智能程序参与下的学术期刊编辑出版的全流程,才能够适应未来人工智能与编辑人员的协同工作。
人工智能在编辑出版流程中的融入过程必然会对编辑行业中简单性、重复性的工作岗位或环节产生冲击,剩余的岗位则属于那些需要创造性和想象力的领域,将对从业者的综合素质和学习能力提出更高的要求。未来智能化的信息、时代,学术期刊的编辑必须是具有信息处理能力,掌握云技术、多媒休技术、网络编码技术、网站信息服务技术的复合型跨界编辑人才。
编辑活动的基本规律与核心是选择与加工,即将进入智能化时代的学术期刊编辑应该抓住人工智能技术高速发展带来的机遇,努力掌握互联网和智能化时代的认知方式、知识学习、思维创新的经验和方法,用大数据和人工智能时代的思维方式去捕捉、筛选、评估、加工和推送信息。在即将到来的智能化时代,学术期刊的编辑只有转变视野,掌握全新的研究方法,才能推动学术期刊紧跟时代和技术发展的步伐,步入新的繁荣时代。
注释:
[1]曹承志.人工智能技术.北京:清华大学出版社,2010: 1-2.
[2]昭鸣.2017人工智能未来企业.互联网周刊,2017(17):46-49.
[3]张新新,刘华东.出版+人工智能:未来出版的新模式与新形态:以《新一代人工智能发展规划》为视角.科技与出版,2017 ( 12 ):38-43.
[4]孙庆生.让出版事业与人工智能共舞.中国出版,2017(17):16-20.
[5]汪新红,王国红,彭绍明.论科技学术期刊出版的数字化媒体化转型.编辑学报,2012,24(5):481-483.
[6]王晓光.人工智能与出版的未来.科技与出版,2017(11):4-6.
[7]Yang Xu-yong.Mci Tao, Xu Ying-Qing.Automatic generation of xisual-textual presentation layout.Acm Transactions on Multimedia Computing Communications & Applications,2016,12(2):1-22.
[8]汤雪梅.人工智能与数字出版的创新应用.编辑之友,2015(3):15-18.
[9]衣世东.基于深度学习的图像识别算法研究.网络安全技术与应用,2018(1 ): 9-41.