业内信息

智能编校工具辅助传统编务工作的探索与实践

2020-12-21 来源:《科技传播》
  【作 者】张晨:中国科技出版传媒股份有限公司石家庄分公司

  【摘 要】近年来,在人工智能逐渐成熟及相关领域加速发展的背景下,尤其是在国务院《新一代人工智能发展规划》的印刷并实施后,为各行各业的技术变革指明了前进的方向。文章主要探讨人工智能,尤其是智能编校工具在出版流程中辅助传统编务工作的优势、局限性,以及未来一段时间智能编校工具的发展方向。

  【关键词】人工智能;智能编校工具;编辑加工

  科学技术的飞速发展,为各行各业带来了前所未有的机遇和变化。习近平总书记高度重视传统媒体和新兴媒体的融合发展,作出了一系列重要指示。

  在人工智能逐渐成熟且产业化步伐加速的背景下,可引入人工智能技术的应用场景不断增多,各行各业也不得不正视这种技术变革诉求。尤其是那些与计算机技术紧密结合的行业,更需快速回应人工智能技术的挑战。新闻出版业正是应用计算机的典型行业,必须积极响应人工智能技术带来的变革诉求[1]。

  出版业的发展,离不开技术的革新。中国新闻出版研究院发布的《2016—2017中国数字出版产业年度报告》提出了“人工智能技术将重塑出版流程”的论述。即以大数据、人工智能等技术为支撑,建立健全众智众创、协同创新的生产管理流程,提高数字内容生产、流程管控、发行传播的智能化水平,研发、应用和推广支持智能选题策划、智能审校、智能排版、智能印刷、智能发行等环节的技术工具集[2]。

  本文主要探讨人工智能,尤其是智能编校工具在出版流程中辅助传统编务工作的相关问题。

  1 智能编校工具在传统编务工作中的嵌入优势

  1.1 提升编务运营效率

  在传统编务工作中,编辑加工环节是整个出版链条中最为耗时耗力的环节。编辑首先要在宏观层面上对图书所体现出的价值判断和价值选择进行把关;其次,需要在微观层面上对图书的文字语句进行修改和校对;最后,还要根据目标受众的阅读期待对书稿进行整体润色。而互联网平台的发展和全民创作的热潮又促使文学作品的数量呈指数级增长,给编辑的身高加工带来了更大的挑战[3]。

  智能辅助审校工具可以使用海量的真实语料对算法模型进行训练,结合自然语言处理技术(NLP)、人工智能技术和内容结构化技术,同时参考国际标准,以及编辑行业相关标准规范或权威资料,在字词符号审校、文档大纲审校、图表公式序号审校、知识内容审校,以及内容相似性检查等方面辅助编辑加工。

  例如,利用北大方正电子有限公司研发的“方正智能辅助审校系统”中的标点符号检查功能,可以检查稿件中是否存在成对的标点符号有缺失或格式不一致的情况,以及发现不同标点符号是否叠用、连用等错误(图1)。



图1 方正智能辅助审校系统的标点符号检查功能

  图1中,利用方正智能辅助审校系统嵌入的《标点符号用法GBT15834-2011》中的规定,通过一定算法结合上下文即可快速查找出标点符号叠用的错误,有效提高的编辑加工的效率,为提升出版单位整体编务运营效率起到了良好的辅助作用。

  人工智能在解放生产力、提高编校效率方面具有积极的作用,利用智能编校工具不仅可以将编辑从大量低端、重复性的工作中解放出来投入到对内容及专业性问题的审校中,而且可以规避人工处理带来的差错。

  1.2 推动编务工作高质量发展

  将海量的数据资源有组织地存入数据库内,利用计算机技术进行信息检索与核对,比之于人工检查,具有遗漏率低、定向精准等特点。如对错词、错字、敏感词的检查,以及上下文查重等,依靠敏感词识别与排查技术、自动纠错技术等手段,能够实现自动发现和识别稿件中存在的相关问题,一定程度上规避了人工查阅可能出现的遗漏问题,对提升图书质量、提高流程效率、确保图书的导向正确和质量过硬等具有十分重要的意义。

  例如,北京黑马飞腾科技有限公司研发的“黑马校对软件”拥有超过1万亿字的语料信息,通过对海量分类语料进行量化统计、分析、提炼、迭代学习,同时采用高倍信息压缩、快速检索、汉字高精度快速切分等技术生成语言模型来检查各类文字错误。能够对大部分中文、英文、标点、计量、重句、异形词等文字错误,大部分政治性问题(如国家领导人姓名、职务、排序,大部分台湾问题,敏感词语、部分落马官员等)进行错误提示。同时具有8000万条核心库,800万条错误规则库,79个专业库(图2)。



图2 黑马校对软件运行界面

  图2中,黑马软件通过对全稿进行检索,依据其内嵌的大规模专业库,可快速识别稿件中存在的错词、错字及敏感词并给出正确建议共编辑参考。对因编辑学科专业原因造成的漏错起到了补充作用。

  除了上述提到的两款使用量相对较大的智能辅助审校工具之外,各出版单位及技术公司也在积极投身于该领域,研发出了各式有针对性的审校工具。如凤凰出版传媒集团自主研发的凤凰智能校对系统可进行文字类、标点类、语法类、知识类、政治类差错检查(图3)。中国科技出版传媒股份有限公司石家庄分公司自助研发的括号核对工具可对数学及计算机类稿件中出现的大量括号进行成对核对,避免编辑肉眼核对造成的漏错。龙源数字传媒集团旗下的人工智能平台“知识树”可在编辑定义部分内容后,利用机器自动完成图书写作和修改工作,等等。



图3 凤凰智能校对系统校对前及校对后

  1.3文案编辑工作重心转移及角色定位发生转变

  随着智能编校工具在传统编务工作中的不断渗透,越来越多传统意义上机械性、重复性的核查、统改等加工工作将通过智能编校工具的辅助作用迅速得到解决。一方面,大大释放了文案编辑的工作量;另一方面,也是编辑的工作重心逐渐向稿件加工的终审者转移。同时,在掌握好编辑基本功的基础上,也能熟练掌握相关智能编校工具的使用,了解何种稿件、何种类型的问题适合何种工具进行智能化处理,何种问题仍需人工处理等。通过不断调整、及时与开发人员进行沟通交流,不断完善智能编校工具的功能,从而成为人工智能时代的“新编辑”。

  2 智能编校工具在传统编务工作中的局限性

  目前的智能审校工具虽然可以通过采用大规模词库和重点词监控等技术对汉语文本中的常见错误进行审校,对文本审校起到较大的助益,在一定程度上降低了人工审校的工作量,但仍存在一些不足与局限性,集中表现在以下方面:1)算法的局限性;2)词库更新机制的局限性;3)产品架构的局限性[4]。

  2.1 机械算法带来的局限性

  汉语本身博大精深,在不同语境下有着不同的含义。当前阶段使用的智能编校工具在编辑加工环节中仍以“机械”处理为主,即通过计算机快速检索词库、对比、处理等进行检查,尚处于人工智能发展的初级阶段。通过查找嵌入词库指明错误的方法,在获得较高报错率的同时,很难保证词库的全面性及无歧义性。在具体的逻辑推理、上下文结合、图书结构、相近词辨析等需要深度学习的环节,则是智能工具无法驾驭的阶段,也是智能工具无法取代人脑的关键点所在。

  如对中国科技出版传媒股份有限公司使用方正智能辅助审校各功能的频次进行统计,可发现在日常工作中,编辑使用频次较多的仍然是基于词库检索对比类的检查项目,如标点符号检查、不规范名词检查、敏感词检查、异体字检查、易错词检查等。而对于逻辑推理等需要深度学习辨别的内容,如译文检查、重点词检查等,则使用较少(表1)。


表1 中国科技出版传媒股份有限公司 2020年5-7月使用方正智能辅助审校系统各功能频次
检查项目 标点符号检查 不规范名词检查 敏感词检查 异体字检查 易错词检查 译文检查 重点词检查
次数(次) 1577 2045 5256 3208 5259 189 195

  这也在一定程度上反映出该款审校工具在数据的深度学习和挖掘方面存在局限性。

  2.2 数据库更新速度与实时变化的信息更新速度不匹配

  由于当前智能编校工具多数由专业技术公司开发,无法及时掌握新闻出版业实时变化的海量信息,从而造成相关数据库中的信息滞后,产生新的错误。而对出版行业最新信息较为了解的编辑、校对等业内人士,由于不懂得相关技术,无法将最新数据补充入数据库中,造成了实际使用过程中“肠梗阻”的状态。

  未来如果想要实现编校智能化的更深层次发展,传统出版企业、专业技术公司等在深度融合或企业内部构件上需要有更多的探索与突破。“出版+技术”的组合拳需要被不断推出并完善。平台资源整合有待创新和升级,技术服务商、渠道运营商和内容提供商等再功能设计与实现、内容推广及内容资源供应等方面应进一步融合,才能不断实现新的突破。

  2.3 软件与软件之间相互封闭带来的局限性

  智能辅助审校工具大多数属于闭源软件,开发公司将其视为自有资源或商业机密。因此,不同软件之间的数据库互补联通,造成同一种功能不同的工具都有但都不够全面的现状,往往一个编辑在处理一部书稿时,要同时使用若干种智能审校工具的同一功能,在一定程度上造成了时间成本的浪费。专业词库的更新完全依赖于开发公司,编辑无法根据日常工作实时更新、调整与补充,不便于使用及管理。

  3 智能编校工具未来的发展方向

  在人工智能冲击着几乎所有行业的今天,出版业,尤其是传统编务工作面临着前所未有的发展机遇及挑战。从人工智能的角度而言,未来的“智能辅助编校系统”应该具备如下功能:在运用大数据分析和自然语言处理、神经网络、深度学习等技术的基础上,不仅通过对比,也模仿人的推理逻辑,自动发现文稿中字词、语法、语义、常用数据、知识性甚至引文、格式、遵循相关技术标准方面的错误,并提出修改建议。

  随着人工智能技术的不断发展,基础性编辑工作将越来越多地由计算机完成,编辑将成为稿件加工的终审者,将会向统筹全局、调整参数、终审检查等方面转变。因此,我们必须高度重视出版行业从业人员的智能化信息素养工作,不断提高编辑的信息化素养。

  与此同时,出版单位也要加强对编辑的引导,鼓励从业者采取开放、包容的心态拥抱人工智能。对于编辑来说,机器的核心是软件,而软件的核心是它的哲学。编辑在使用人工智能辅助编务工作时,应不断进行思考,不断将自己的想法引入到技术中,真正实现人与技术的融合。

  如今,我国出版业正在经历着转型升级的重大变革,相信随着越多、越来越成熟的生产流程和生产工具的运用,出版行业将会逐步从人员密集行业向智力密集行业转变,从而实现全行业高质量发展的目标和预期。当前阶段,人工智能,尤其是智能编校工具,在出版行业中的传统编务工作中正处于起步阶段,相信随着日臻成熟的人工智能技术,以及更多从业者的努力,编务工作实现真正意义上的智能化指日可待。

  参考文献

  [1]徐顽强,王剑平.人工智能嵌入出版业的优势、逻辑与路径[J].中国出版,2019(11):10-14.

  [2]刘华东,马维娜,张新新.“出版+人工智能”:智能出版流程再造[J].出版广角,2018(1):14-16.

  [3]白贵,王太隆.人工智能环境下编辑角色的再定位[J].中国出版,2019(11):5-9.

  [4]任柏青.基于深度学习的智能中文文本检校方法[J].现代电信科技,2017(4):55-58.

国家广播电视总局 | 湖北省人民政府 | 中国邮政集团公司 | 武汉市人民政府 | 中国期刊协会 | 中国图书进出口(集团)总公司 | 中国邮政集团公司报刊发行局 | 湖北省广播电视局 | 湖北日报传媒集团 | 长江广电传媒集团 | 长江日报报业集团 | 知音传媒集团 | | 湖北中图长江文化传媒有限公司 | 决策信息网 | 湖北新闻出版广电传媒周

copyright(c) 2013 湖北省新闻出版局 版权所有 技术支持

鄂ICP备19004605号-4  鄂公网安备 42010602004016号