业内信息

融合发展中专业出版资源建设的探索

2020-12-20 来源:《新闻研究导刊》
  【作 者】张磊:中国铁道出版社有限公司

  【摘 要】出版融合发展正面临从以图书(产品)为主体的资源建设向以内容(知识)服务为主体的转变。一方面继承原有以图书为主体的内容组织和传播方式,满足图书产品的生产及销售需要;另一方面逐渐形成以知识为主体的内容组织和传播的集合形态,形成知识库等分类资源库,以满足复合出版和不断发展的内容服务需求。本文对专业出版资源建设的相关问题进行探索。

  【关键词】出版资源建设;碎片化;内容深加工;资源体系

  一、引言

  对专业出版社而言,专业出版资源建设是核心任务。出版融合发展第一阶段资源建设是围绕以图书(产品)为主体的资源建设,当前阶段的资源建设则应该是以内容(知识)服务为主体。即一方面继承原有以图书为主体的内容组织和传播方式,满足图书产品的生产及销售需要;另一方面逐渐形成以知识为主体的内容组织和传播的集合形态,形成知识库等分类资源库,以满足复合出版和不断发展的内容服务需求。

  对于出版社来说,资源包括两个方面:存量资源和新增资源。存量资源指出版社已出版的内容(图书、音视频等);新增资源指当下还不属于出版社的资源,通过组稿、资源购买等方式进入出版社。

  二、新增资源建设

  新增资源建设的目的是使新内容不断进入出版社,保证出版社的生命力。新增资源的组稿方式在出版融合发展新阶段可能包含:

  (一)图书组稿

  通过组织专业的作者群体,编写内容,形成整书,进入出版社。图书内容相对丰富,内容具有一定体系性,创作需要一定时间,组稿周期相对较长。作者队伍需要慢慢积累,不断发掘。出版社在传统的出版过程中,都集聚了有一定规模、专业水平较高的作者队伍。

  (二)微内容组稿

  在数字、网络环境下,内容的组织、表现、传播方式发生了变化。微内容(知识点、短视频、图片、表格、案例、流程、数字模型等)也可以作为出版社组稿的对象。微内容的创作相对简单,内容描述的问题相对单一、具有针对性,但单个内容的体系性较弱。作者队伍不再显得那么专业化,任何人在某一点具有专业性或者权威性,即可以成为碎片内容的创作者,是一个泛化的作者群体,作者队伍的水平高低不一。

  (三)资源库组稿

  企业/机构在多年的发展中,有的企业建立了自己的资源库,包含企业的文化、规范、标准、案例、培训内容等,又或者其他相关出版社形成的出版资源库。对于这种资源,可采用数据库购买、合作等方式获取使用。这种资源一般通过信息技术手段管理,在内容的分类性、体系性等方面相对较好。这种资源的获取通常与相关的企业、出版单位合作,合作的对象很少。

  表1是几种组稿方式对比。


表1 几种组稿方式对比
组稿方式 内容集合 内容描述 组稿途径 组稿周期 作者队伍
图书组稿 图书 内容相对丰富,具有一定体系性 邮件、组稿平台 几个月到几年 有一定规模、具有较高专业水平的作者队伍
微内容组稿 碎片内容 内容描述相对单一、具有针对性,体系性较弱 组稿平台 几分钟到几天 队伍广泛、水平不一
资源库组稿 资源库 内容繁多,分类、体系性较强 线下数据库购买、网络数据库调用 几年到几十年 企业较少

  针对新增资源在内容组稿期间尽可能完成资源数字化建设工作,避免将新增资源变成存量资源后,再开展数字化工作。

  三、存量资源建设

  存量资源数字化建设包含两方面内容:图书数字化和资源增量数字化[1]。(如图1)



图1 存量资源建设流程

  (一)图书基础数字化工作

  对图书扫描识别或电子文件格式解析,提取图书元数据,制作PDF文档、结构化XML文档,形成图书库。PDF文件能保留原书版式,可满足图书印刷、按需印刷等需要;XML文档适合于数字环境下传播,易于与通用电子图书格式转换及在通用平台上实现解析、显示。

  (二)资源增量数字化工作

  资源增量数字化包括两个方面:内容碎片化与资源深加工[2]。根据需求对内容进行组合、编辑形成新的数字化产品,达到现有资源内容增值和产品增值的目的。

  1.内容碎片化

  (1)拆分规范。在拆分时,根据内容是否有损失可分为可逆拆分和不可逆拆分。可逆拆分不损失原书内容,拆分的内容碎片可回组成原书;不可逆的拆分只提取书中重要内容碎片或知识点,对于衔接性、重复性的内容则剔除掉。

  根据拆分的颗粒度不同,可以划分为3个拆分等级:

  一级拆分:最粗粒度、最基本的拆分规则。按照书中固有的内容组织形式来拆分,如按章节、按条目等[3]。拆分的结构在一定程度上可保持内容描述的完整性,但一个拆分结构不一定能详细说明一个大的逻辑问题。通常这种拆分的内容用于后续内容加工参考、调用或者原材料。这种方式拆分具有内容的可逆性,即拆分的内容通过拆分时建立的联系,可回组成原书内容。

  二级拆分:在一级拆分规则之下进行拆分,为次一级拆分粒度。具体拆分是按照图书内容表述方式来拆分,如图片、表格、公式等。基本原则就是将一级拆分的基本内容作为拆分的源进行细化拆分。

  三级拆分:属于定制拆分,在一级、二级拆分规则之下进行拆分,是更细一级拆分粒度,如知识点拆分,有时庞大的表格也可进一步拆分。

  在碎片化过程中,所采用的拆分方式通常都是几种方式的组合,可根据图书内容的不同以及个性需要进行选择。

  (2)碎片及元数据。在资源库中描述这些碎片资源需注重两个方面:碎片内容本身、碎片内容的元数据。

  一是碎片内容本身,最基本的为名称、内容,以及根据使用和传播需求选定的数据格式,如XML、PDF、Word等。

  二是碎片内容元数据,是描述碎片内容的数据,其完备性直接影响后续内容深加工、使用的便捷性。在碎片化过程中可从以下几个方面提取元数据:

  主题信息:描述内容的主题、关键字、著录等信息。

  分类信息:多维度的分类信息。在拆分时通常只有从属于书的一个分类信息,在资源深加工中可构建其他维度分类信息。

  版权信息:记录碎片内容的版权信息。

  来源信息:来源于哪本图书、所在图书页码以及与拆分自同一本图书的其他碎片的前后关系信息等。

  格式信息:图片、表格、视频等,不同数据格式都有特定格式描述信息。

  通过碎片化处理形成不同专业分类库。

  根据内容表达方式不同,拆分的分类库有:文字碎片库、图片库、表格库、公式库、音视频库等。

  根据图书内容性质不同,拆分的分类库有:条目(知识点)库、案例库、操作流程库、论文库、试题库等。

  2.资源深加工

  (1)内容深加工。以资源库为基础,对碎片内容进一步深加工形成知识点,构建知识库[4],为后续知识体系建设、知识服务供给储备内容;通过对文字、图片、音视频资源的重新组合可形成多媒体资源库;对现有内容进行新的载体构造,可形成3D模型、动画、仿真等培训、考试资源库。

  (2)资源体系建设。一个完善的资源库,除了要有丰富的专业内容资源,还需构建各库之间、库中内容之间的关联性。资源建设中除保持知识内容的个体性外,还需形成知识之间的网络、层次的链路,保证知识的系统性、相关性。资源体系建设可从以下几个方面着手:

  第一,资源的专业分类。不同学科、不同行业都具有不同的专业分类体系,这些分类体系体现了内容的体系性、层次性、前导后继性。在资源库建设中,应将资源内容归到相应分类下。在不同的应用场景,每一个资源通常都有多个维度的分类。比如中国铁道出版社在资源建设中涉及的分类有铁路学科分类、铁路专业分类、中图分类、出版社ERP(Enterprise Resource Planning,企业资源计划)分类、铁路工种分类、铁路百科分类等。

  第二,专业词库。建立学科、行业的专业词库,基于词义、语义的分析,从单个内容的角度构建内容之间的网络链路。可从专业名词表、专业百科、资源内容的名称、主题词、关键词等提取,辅以相关拆分、提取算法进一步深加工形成。

  第三,拆与组的关联。拆的关联是指进行存量图书碎片化处理时,形成不同内容碎片之间的相关性,如前后关系、来源于同一本图书等;组的关联性是指在知识点加工、课程和仿真内容制作时与原始碎片内容/知识点的关联性。

  第四,人工关联。根据内容的关键词、专业分类、专业词库等,通过计算机的聚类算法、挖掘算法等建立资源的体系性。但是这种关联性、体系性存在一定的偏差,需要人工根据内容的行业或应用特性调整内容的关联,再辅以算法不断调整、纠正这种偏差。例如道岔、转辙机在词意上无相关性,但在铁道工务上却是两个联系紧密的设备。

  四、结语

  在专业出版资源的建设过程中,不仅要考虑资源内容本身的建设,还要综合考虑后续其他的应用。如:一是复合出版产品生产的需要;二是数据连通与对接,需充分考虑资源管理平台的扩展性;三是标准的建设,便于出版社内容生产流程的规范,也便于出版行业的数据交换与共享。

  参考文献:

  [1]江波,袁泽轶,项翔.专业社数字出版平台建设实践与阶段分析[J].海南广播电视大学学报,2014(3):154-158.

  [2]高蝴蝶,张志林.基于知识元的内容组织对数字出版的启示[J].北京印刷学院学报,2009(5):33-36.

  [3]张国强,林江发,缪萍.图书内容资源结构化方法[J].出版参考,2010(27):15-16.

  [4]由佳鑫.数字出版资源库建设中的知识管理[J].出版参考,2014(24):28-29.

国家广播电视总局 | 湖北省人民政府 | 中国邮政集团公司 | 武汉市人民政府 | 中国期刊协会 | 中国图书进出口(集团)总公司 | 中国邮政集团公司报刊发行局 | 湖北省广播电视局 | 湖北日报传媒集团 | 长江广电传媒集团 | 长江日报报业集团 | 知音传媒集团 | | 湖北中图长江文化传媒有限公司 | 决策信息网 | 湖北新闻出版广电传媒周

copyright(c) 2013 湖北省新闻出版局 版权所有 技术支持

鄂ICP备19004605号-4  鄂公网安备 42010602004016号