【作 者】祁丽娟:中国科学院软件研究所《计算机系统应用》编辑部
【关键词】科技期刊;结构化排版;XML在线排版
随着计算机和互联网技术的飞速发展,科技期刊数字化、网络化已成为主流趋势。便捷化、碎片化的阅读需求对科技期刊数字化出版提出了更高的要求。基于可扩展标记语言(extensible markup language,XML)结构化排版,将期刊内容和样式分离,具有一次制作、多元多次发布,便于存储、交换等优势,其价值及发展趋势得到了广泛认同。
《计算机系统应用》自2017年第7期开始采用由北京仁和汇智信息技术有限公司(以下简称仁和公司)自主研究开发的XML在线排版系统,以期实现高质高效的XML结构化排版。XML在线排版系统支持对文字内容修改的所见即所得、对图表公式及样式修改的文字批注和截图批注,可以实现期刊编辑部在校对文章内容过程中的在线查看与在线修改,并可实现网络版、印刷版等PDF文件生成。
1 XML在线排版流程
与方正、InDesign、Word等传统排版方式相比,XML结构化排版可以实现PDF直接添加链接、直接生成网刊数据、移动网刊数据、HTML多媒体文件、满足不同数据库需要的等多种格式的文件,非常符合传统媒体与新媒体融合发展的战略需要。
《计算机系统应用》期刊的XML编校排版通过XML在线排版系统,由专业排版人员和专业编校人员互动配合完成,全程无纸化。图1是在实践过程中总结的XML在线排版的编校排版流程。首先,文章录用后,编辑部将作者提供的Word形式的电子稿件交由排版员完成XML文件的制作。然后,借助XML在线排版系统,共同完成至少3个轮次的校对工作。校对时,编辑人员可以在系统中直接完成文字内容的核对勘误工作,图表公式等内容以及版面格式的改动,则可通过批注(截图批注或文字批注)的形式告知排版人员,由排版人员负责完成。最终,在系统中直接导出PDF版本文件。整个编校排版的流程均可在系统中完成,系统可记录修改痕迹,并可进行文章在各校对轮次的版本比较,真正实现无纸化的期刊论文生成与管理。

图1 XML在线排版流程
2 XML在线排版优势
在采用XML排版之前,《计算机系统应用》期刊使用Word软件排版。Word软件普及程度高且容易上手,但并非专业的排版软件,难以实现完美的页面布局,尤其是采用双栏排版时,尺寸较大的插图、表格或公式又需要单栏放置,Word排版难以做到双栏底部完全平齐。另外,《计算机系统应用》期刊的作者群以高校研究生居多,他们大多是第一次写论文,并不熟悉写作规范,尤其是插图、表格以及参考文献的著录格式等。编辑部虽耗费大量的精力与作者沟通,但收效甚微。XML排版完美地解决了这些问题,在提升排版质量的同时,也提高了编校工作效率。同时,XML结构化的排版方式可以实现内容的重复利用,各种增值服务的实现更加便捷。
2.1 有效提高期刊的编排质量
2.1.1 页面更合理美观
XML排版可以实现双栏排版底部的完美对齐,行间距和字间距也更为均匀美观。
2.1.2 插图、表格、公式的编排更清晰规范
XML排版过程会对插图、表格和公式按照期刊出版的标准,统一进行规范化处理。插图文字部分全部重新植入,从而实现插图文字在字体和字号上的统一;插图中多余的边框、底纹统一处理掉;不清晰的插图将全部重新绘制。表格将用XML语言排版,统一用三线表。公式将转化为LaTeX,排版效果更美观。
2.1.3 参考文献更规范完整
在进行参考文献排版时,XML在线排版系统会首先自动校对参考文献,并完善参考文献的著录信息。对于检索不到的文献也会有提示,方便请作者再次提供;然后将所有的参考文献按照预设的模板规范化,这很好地解决了作者参考文献信息不完整、著录格式不规范的问题。此外,系统还集成有DOI自动加载的功能,会自动查找文献的DOI并完成关联。
2.2 大幅提高编校工作效率
2.2.1 内容模块化,校对效率高且不易出错
XML排版是一种结构化的排版方式,而在线排版系统会将文档的结构展示给编辑人员,如图2所示。因此,编辑校稿的时候可以按照标签逐一校对,既方便高效,又不易出错。

图2 XML在线排版系统的树状显示
2.2.2 支持链接,区分颜色,校对更方便
在XML在线排版系统中,正文中文献、插图和表格等引用均设有超链接,并配以颜色区分,更容易检查其在正文中的标引是否合理。
2.2.3 按篇编校排版,排期更为灵活
XML在线排版可以按篇完成编校排版工作,将整期文章排序后,即可借助“自动目录索引”功能自动生成各篇文章的起始页码和结束页码,同时自动更新全部PDF文件。因此,编辑部可以在文章录用后即进入编校排版流程,当期出版前再排期,很好地解决了编辑部遇到的论文调整刊期工作量大且易出错的问题,并且,这种按篇编校排版的方式,非常适合单篇文章网络优先出版。
2.2.4 文章按篇处理,方便发送作者看清样
使用Word排版时,所有文章放置于同一文档中,进行清样校对时需要分别生成各篇文章的PDF文件,工作量非常大。使用XML在线排版之后,每篇文章单独排版,并且排版系统中集成有“一键发作者看清样”的功能,即编辑部可以预先设置给作者发清样邮件的模板,系统将根据模板,自动提取文章信息内容并自动加载对应文章的PDF,发送给作者进行清样校对,使得发送作者清样的流程简单易操作,极大提高了效率。
2.2.5 模板化处理,高效准确
XML排版的内容和格式是分别处理的,而格式依赖于模板。因此,变动格式时只需要改动模板即可实现全刊统一,高效又准确。
2.2.6 一次排版,多渠道发布
XML文件可以方便地转换为任意的格式,如HTML、PDF、RTF等格式,无需二次加工即可实现多渠道出版。
2.3 系统自主研发,方便实现个性化编辑规则
XML在线排版系统是由仁和公司自主研发的,因此,可以根据期刊的需求,开发更适合期刊出版的功能。
《计算机系统应用》期刊最初使用XML在线排版系统时,其中集成的“发作者看清样”功能只能按照模板群发给所有作者,除文章题目、作者姓名等可以从文章中直接提取的信息外,清样邮件的内容是完全一样的。经编辑部与技术公司沟通后,清样邮件已经实现了发送前可编辑的功能,针对某些文章的作者,可格外提醒其关注文中的某些信息,给不同作者发送的邮件略有差异。
《计算机系统应用》期刊在使用XML排版初期,英文参考文献间距调整是以字母为单位进行的,即当某一行的英文单词不足以充满整行内容时,单词的字母间距会扩大。这样的排版方式不符合常规的书写习惯,阅读起来比较吃力,并且版面也不美观。经过沟通,目前已实现英文参考文献以单词为单位调整间距。
2.4 结构化排版,更易开发增值服务
(1)XML文件保存了文档的结构信息,非常容易实现内容的重复利用和再次挖掘。XML排版的文件,可以通过简单的操作,导出文章题目、作者、单位、参考文献、插图等各类基础信息,并可实现任意形式的交叉引用。例如,《计算机系统应用》期刊的DOI注册文件目前就是通过系统自动导出,相比于人工操作,在保证准确率的同时,还节约了人工成本。
(2)系统集成有文献DOI自动查找功能,可以对参考文献进行自动DOI查找和关联,并配合PDF模板支持在生产的PDF文件中自动加载参考文献DOI显示。
(3)生成适用于印刷和网络出版两种版本的PDF文件。印刷版是高清模式的,可以很好地保证印刷质量;网络版则带有文献、图、表等内部链接,Web URL、Email、DOI等外部链接,更方便电子版读者阅读。
(4)系统可以统计文章的编校周期、图表数量、文献数量、各栏目的文章数量等,这些信息对编辑部都非常具有参考意义。
3 体会与建议
XML排版的内容和格式是分别处理的,编辑人员可以只关注文字内容的编辑校对,而将版面格式的调整工作交给排版人员。因此,在校对过程中,有些操作是编辑无法完成的,只能通过批注的形式告知排版人员,由排版人员来完成对应的操作。这就要求编辑人员与排版人员进行有效沟通,保证排版人员高效高质地完成修订工作。
(1)插图、表格、公式需要重点校对。XML排版过程将对论文中的插图、表格和公式统一做规范化处理,在提升质量的同时,也难免引入新的错误。
插图中的文字需要全部重新植入,因此必须对照作者原稿一一核对,特别是插图中的英文表述部分,需要对专业词汇进行校对,而排版人员通常并没有相关的专业背景,出错率相对较高。
表格中的文字部分是由Word文档自动转换而来,出错的概率相对较小,但需要特别注意表格中作者加特殊标识的文字(如下划线),避免在转换的时候丢失相关标识;表格的格式通过XML语言来实现时,排版人员会按照标准将其规范化,编校过程中如需修改格式,可通过批注的形式告知排版人员来完成。对于采用双栏排版的期刊来说,作者在表格的双栏排版的处理方式上往往不太合理,例如内容较长导致双栏无法放置时,有些作者会将表格截断,采用上下两段排放的方式,这些问题排版人员无法处理,需要编辑在编校过程中特别关注。
公式转换为LaTeX时,需要对照作者原稿一一核对。在使用XML排版的过程中,公式排版普遍存在的问题主要有:公式中的矩阵特别容易出问题,表现为所有的数值均挤在一起,被当作一个数值处理;公式中函数与变量定义通常挤在一起,中间无空格分隔;部分变量的下标转换完成后变为标准样式等。数理公式较多的期刊在这些方面需关注。
(2)编辑人员可以学习一些简单常用的XML命令。使用XML在线排版并不要求编辑对XML语言有深入的了解,但是编辑人员使用简单常用的XML命令便可以大大提高工作效率。比如常用的文字换行、斜体、上下标、公式对齐、空格、表格列宽调整、添加分栏线等,这些命令本身非常简单,而在编校过程中用得非常频繁,编辑掌握之后可以事半功倍。
(3)期刊整期出版前的最后一轮校对,建议以期为单位进行,即在系统中生成整期的合成版PDF,再进行终校工作。XML在线排版系统支持以篇为单位进行编辑校对,前两轮的校对可以按篇进行。但目前纸质期刊的出版仍然是按期进行的,合成的印刷版PDF与在系统中看到的单篇PDF有时候会有细微的差异,比如某一行断行的位置、行与行之间的间隔等,因此,交付印刷厂之前需要对整期的印刷版合成PDF进行最后一轮校对。这些问题在校稿时均有发生,但又不具备共性,目前尚未查清楚原因。
(4)XML在线排版系统中集成有“发作者看清样”的功能,这个功能使得清样发送的过程方便、高效,但在使用过程中有些细节问题需要格外注意:①邮箱地址的填写要求严格,前后不允许有空格或者标点,且只能填写一个邮箱。②清样中加载的PDF文档需要提醒作者采用Adobe阅读器打开,因为如果用其他阅读器(比如福昕阅读器)或者浏览器打开,图片会模糊。③系统中新增了邮件发送失败的提示功能(此功能同样是与仁和公司沟通后新增加的),清样邮件发送之后,可在系统中查看是否发送成功。
4 总结与展望
XML结构化排版为实现国内科技期刊的内容结构化加工(排版)、分层次表达、全媒体发表、按需出版提供了一个非常快捷的方法。《计算机系统应用》期刊通过采用XML在线排版系统,把排版工作交给专业的排版员,把编校工作留给学术编辑,最大限度地发挥了不同专长人员的优势,实现了编校排版质量和效率的双提高。
未来编辑部将实现网络优先出版和HTML全文阅读,进一步发掘XML结构化排版的优势。XML在线排版可以实现稿件按篇编校排版,这种方式非常适合单篇在线出版。网络优先出版已经实现,但整体仍是按期出版。未来将实现按篇出版,即文章一经录用即进行排版处理,并在线发表。HTML格式是一种能够与互联网移动端相结合的先进阅读模式,而XML文件可以直接生成HTML多媒体论文,未来我刊将在官网提供HTML格式的全文阅读。