业内信息

大型专题文献类图书数据库建设的困境与对策研究

2019-09-27 来源:《科技与出版》
  【作 者】李芳:清华大学社科学院;洪文雄:学苑出版社

  【摘 要】目前,国内数字出版产业正处于数字化转型的关键时期,本文通过探讨大型专题文献类图书数据库建设过程中遇到的困境,提出一些有益的对策,包括呼吁政策倾斜、推动资源整合、注重人才培养、引入先进技术、探索盈利模式等,从而为我国大型专题文献类图书数据库建设和发展提供思路。

  【关键词】大型专题文献类图书出版;专题内容资源;数字化转型;数据库

  以互联网、大数据、人工智能为代表的信息技术的迅猛发展,推动着传统出版业向网络化、数字化、智能化的方向快速发展,给传统出版单位带来了全方位、深层次的挑战。中国新闻出版研究院发布的《2017-2018中国数字出版产业年度报告》显示,2017年我国数字出版产业总收入为7071.93亿元,较去年增长了23.61%,继续呈现出快速增长的态势。一方面,数字出版凭借其产品的数字化和网络化,以及交易形式的电子化等优势,成为传统出版业转型发展的必然趋势。另一方面,在长期的实践中,传统出版单位累积起了大量的专题文献资源,例如拥有庞大优质的作者资源和专题内容资源图书,如何将这些资源应用于互联网,以个性化的知识服务为人们提供便捷的数据信息和资料,提高知识生产与传播的效率和效益,构建全新的数据库系统,则成为出版单位转型和发展不得不思考的重要问题。

  作为中华文明重要载体的大型专题文献类图书,具有极为丰厚的文化内涵和相当高的文化史料价值。大型专题文献类图书数据库是借助信息技术和互联网技术而建立的一种整合大型专题文献类图书资源,为人们提供海量资源管理、数据检索、信息交互等资源服务的数字化集合形式。在新时代背景下,国内数字出版产业正处于数字化转型的关键时期,运用数字化手段解决大型专题文献类图书资源的综合利用和深度开发,建立海量存储、搜索便捷、传输快速、互动性强的大型专题文献类图书数据库,构建相对完善的专题文献数据库体系,已成为当下的大趋势。然而,大型专题文献类图书在数据库建设和发展过程中,还存在着一系列亟须解决的问题。

  1 大型专题文献类图书数据库建设的困境

  1.1 政策支持力度不够

  当前,数字出版在全球范围内得到了蓬勃发展,以美、英、日、韩等国家的数字出版产业发展尤为突出。作为朝阳产业的数字出版,其发展离不开国家在政策和法律方面的支持。2006年,原国家新闻出版广电总局提出了数字出版领域的四大工程,即“数字复合出版工程”“数字版权保护技术研发工程”“国家知识资源数据库出版工程”和“中华字库工程”,次年就被列入《国家“十一五”时期文化发展规划纲要》。可以看出,我国从政策方面给予数字出版大力支持,而且近年来,也曾先后出台《关于加快我国数字出版产业发展的若干意见》和《数字出版十二五时期发展规划》等政策,将数字出版定为绿色产业和战略性新兴产业。因此,我国的数字出版产业已经取得了不小的成绩,但总的来看,与数字出版产业发达的国家相比,我国对数字出版的政策支持力度仍显不够。2018年2月,原国家新闻出版广电总局公布了两批“专业数字内容资源知识服务模式”试点单位,但只有55家试点单位和20家技术支持单位获得项目支持。这还远不能满足需要转型发展的出版单位的期望。尤其是对于大型专题文献类图书数据库项目而言,其体系庞大繁杂,内容专业性强,在政策引导、资金支持、人才培养、技术应用等方方面面都需要政策的倾斜和扶持,需要从国家层面对其进行全方位的布局,否则大型专题文献类图书项目实施起来将步履维艰。

  1.2 项目资金匮乏

  目前来看,市场上能建立起大型专题文献类图书数据库的单位,多为个别实力雄厚的出版单位,一些规模较小的专业型出版单位积累的大型专题文献类图书往往因为没有足够的资金支持,而无法投入图书数据库的建设和转型。而且想要真正形成大型专题文献类图书数据库的规模效应,就必须从需求调研、平台搭建、数据库基础建设等做起,每一个环节都要有大量的资金投入,这对一些小型专业型出版社所积累的大型专题文献类图书而言,规模大、成本大、收益小,若没有充足的资金,项目将很难实施。如,我社的“中国藏学汉文历史文献集成”,这是一套珍贵的藏学遗产和取之不竭的藏学资源,其中包括《清代治藏法规全编》《民国治藏法规汇编》《中国西藏及甘青川滇藏区方志汇编》《民国藏事史料汇编》《唐宋元明清藏事史料汇编》等辑(共192册),文献资料齐全、版本珍贵、材料真实,其对推动藏学和史学研究,促进国家统一,深化“一带一路”研究有着积极的作用。但如果没有国家政策的倾斜和相对应的资金支持,如此庞大的“中国藏学汉文历史文献集成”数据库体系就很难实施建设,也难以为藏学研究者、历史研究工作者、各图书馆和研究机构以及社会各界,充分利用和了解这一系列的文献提供优质的知识服务。

  1.3 人才储备空缺

  大型专题文献类图书相对于其他图书而言,从数据库的体系建设到数据库知识服务标准的研制,从数据库知识资源加工到数据库知识生产工具研发,从数据库知识服务平台建设到知识服务模式探索,每一个步骤都需要专业的、复合型编辑出版人才、数字技术人才以及技术管理人才的参与。然而,目前这些类型的储备人才空缺得十分严重,普通纸媒编辑往往局限于各自擅长范围内的专题文献内容,只关注行文规范、知识点描述准确和内容结构科学等侧重内容的编辑工作,而对数字化编辑的技术要求涉猎不深。通常来说,数字技术人员只从事计算、搜索和交互等专业技术工作,缺乏对专题文献采录、收集、整理、纂修、审定等专业编辑素养;技术管理人员只能行使日常管理职能,指挥或协调完成任务,对内容数字化和数据库内容的建设缺乏相应的知识和经验。因此,缺乏复合型、创新型和跨学科型的综合性人才是构建大型专题文献类图书数据库目前面临的较为棘手的一个问题。

  1.4 技术水平不足

  对于大型专题文献类图书而言,很多史料内容都是孤本、抄本或稿本,一些书籍刊刻后从来没有再版,因此维护历史文献的原始性和真实性显得尤为重要。而在文献数字化的转换过程中,最早是通过人工以及光学方式将文献资料的文字以及图片录入到计算机中,这类数字化文献能够进行阅读和复制,通过数字检索也可以进行有效查找。但在原始录入时难免会出现录入错误的情况,以及OCR(光学字符识别)的识别偏差,这都会影响专题文献数据的原始性和真实性。如果运用较为普遍的双层PDF技术,通过映射的方式将专题文献资料进行数字化处理,也可以进行有效检索和查阅,但仍存在一些问题,如它只能对横排文字进行准确录入,而对竖排刻本抄本的文字,特别是繁体字都无法自动识别录入,再进行转化的过程中也难免存在很大的误差。此外,如果通过扫描拍照的方式进行数字化转换,再转换后通过目录形式与原文进行连接,虽然保存了专题文献资料的真实性,但只能通过目录检索到局部的文字,无法对全部内容进行检索,从而使读者无法掌握全面的文献史料信息。为了便于查阅和检索,可以增加人为标注,虽然这样解决了文献查阅的问题,却对文献的原始性产生了一定的破坏,读者在理解过程中就可能会产生误解,最终适得其反。这一系列问题的根源都是技术水平不高,需要新的技术突破才能解决。

  基于对以上困境的思考和研究,针对大型专题文献类图书数据库的特点,对其在转型过程中出现的诸多问题,笔者提出一些建议和对策,供同行参考。

  2 大型专题文献类图书数据库建设的对策

  2.1 政策倾斜

  大型专题文献类图书是研究我国历史、文学、经济、哲学、军事、社会、宗教、艺术等各个领域的重要材料,对彰显我国多元一体的格局,传承中华文化,弘扬民族精神具有重要作用。建立大型专题文献类图书数据库,需要从国家层面统一筹划,不断调整和完善有关数字出版产业的相关政策。一方面要加强宏观规划,如建立统一的图书数据库标准,构建较为完善的数据转化模型,按照一致的程序对大型的、海量的专题文献资料进行数字化处理;另一方面要加强微观调整,如实行多元的经济扶持政策,设立专项扶持基金,采取有选择和有限度的资金支持等措施。同时,建议制定与图书数据库相关的法律法规,为数据库的发展制定规划、管理等措施,并从管理机制、政策支持、技术支持、资金支持、市场准入、国际贸易、人才培养、网络安全、知识产权保护、个人信息保护等多方面,对专题性文献资源数据库的发展做出规范,实现有效管理,进而实现规范有序的发展。

  2.2 推动资源整合

  目前,我国大型专题文献类图书数据库的建立处于数字化转型的重要阶段,此类数据库的前期投入十分巨大,只有大投入才可能大产出,只有数据库建设达到一定规模,才有可能实现盈利。所以,要积极引导企业投资专题文献类图书数据库的构建,多方吸纳资金,从研发费用、数字技术引入以及投融资渠道等方面进行适度协调,从而推进新型合作关系,推动资源整合。以被誉为“湖南百科全书”的《湖湘文库》为例,这套丛书分甲乙两编,共702册,约四亿字,规模宏大、规划完整,从帛书简牍到屈贾辞章,从大儒集钞到通史传记,从书画雕刻到方言楹联,都彰显着湖湘文化的魅力和精髓。为了进一步挖掘这套皇皇巨著的价值,天闻数媒承接了数字化加工和质检工作,实现了图书原版式呈现,完成了数字“湖湘文库网站平台”及专用终端的开发上线工作。该平台免费向公众开放,只需微信“扫一扫”二维码,每一页都能转发到朋友圈,湖湘经典文化即刻跃然屏幕,这也实现了湖湘经典文化“线上+线下”的全渠道推广。因此,这种出版单位提供内容资源,科技公司提供技术资源的合作模式,实现了风险共担、收益共享,推动了资源整合,大大降低了运营风险。

  2.3 注重人才培养

  图书编辑是文化传播活动的重要参与者,其工作内容是文化传播的关键环节。在数字出版时代,图书编辑只有正确认识和把握时代发展方向,才能够确保出版产品的适路。大型专题文献类图书的出版和数据库建设不仅涉及学术甄别、文献搜索、主题词搜索等专业知识,还涉及数字互联网技术和创新管理知识。面对这样的情况,出版社要改变传统的员工培训模式,注重跨学科人才的培养,除了扎实的文字编辑加工能力,还要增强编辑人员的网络化、数字化、智能化意识,使其了解网络信息技术,提升数字化编辑能力,关注智能服务动向;鼓励编辑涉猎数字出版的各个环节,拓宽学习场域;激发编辑人员思维拓展和理念转换的能力,提高编辑人员解决问题的能力。新时代背景下,大型专题文献类图书的出版和数据库的建设,只有将复合型、创新型和跨学科型人才作为根本保障,才能更好地实现此类图书的数字化转型。

  2.4 引入先进技术

  构建开放的、动态的、系统的大型专题文献类图书数据库,需要引入先进的数字技术和各项专业设备,如采用语义网等精准搜索技术,运用先进的缩微摄影设备、数字化扫描加工设备,以及数模转换(数字存档机)和模数转换(缩微胶片扫描仪)设备。根据大型专题文献类图书数字资源的内容分类进行数字化转化,按照数据标准规范生产数据,并结合各专题内容进行深度编辑加工,通过在线数据分析处理和典型数据挖掘等流程技术,不断改善组织结构、优化资源使用,从而实现专题文献的智能化管理。随着移动互联、物联网、大数据和人工智能等技术的不断成熟,大型专题文献类图书数据库的发展也会随之调整,尤其是技术化、多元化、个性化、融合化和智能化方面,都将成为主要的发展方向。未来,我们要主动适应、开拓创新,及时运用先进的技术为图书数据库的建设服务。

  2.5 探索盈利模式

  新时代背景下,信息技术给人们的生活和工作带来了巨大变化,数字资源的获取渠道日渐多元化。面对海量的知识信息,要积极构建各领域知识服务体系,将用户需求作为出发点和落脚点,探索深度融合新媒体的合作方式,从而探索大型专题文献类图书数据库的盈利模式。未来的出版单位是以各自专题知识服务为中心,要借助互联网技术,根据用户的需求对知识内容进行查找、组织、分析与重组,发现并总结热点、难点和疑点,实现数字资源的有效关联,并进行可视化、交互化的展示,为用户提供个性化的解决方案,围绕用户形成专业知识服务体系。同时,从不同应用场景出发,通过数据库平台,不断实现信息交流互动化和知识服务的个性化,加大与用户之间的往来,通过智能化管理手段,做到快速反应、主动牵引以及创新互动发展,从而达到提高经济效益的目的。

  3 结语

  大型专题文献类图书是汇聚人类文明知识体系精华的大成之作,构建大型专题文献类图书数据库,对于转变出版业发展方式,提升我国文化软实力,推动文化产业乃至国民经济的可持续发展,都具有重要意义。虽然大型专题文献类图书数据库建设还处于探索阶段,还需要不断发展和进步,但笔者相信,随着信息技术水平的不断提高,数字化的专题文献数据库将为人们带来更好的服务。

  参考文献

  [1]杨志辉.学术期刊数字化出版到智慧出版的变革[J].编辑之友,2019(1):36-41.

  [2]严雪.大数据背景下科研档案文献数字化趋势[J].兰台世界,2018(8):81-84.

  [3]周长天.传统教育出版社数字化转型的困境与对策[J].编辑学刊,2017(5):12-15.

  [4]谢秋学,雍志娟,贺芳,等.构建专业领域知识服务体系的通用框架[J].出版发行研究,2018(8):35-37.

  [5]徐东.传统出版社知识服务转型发展的实践与展望:以上海交通大学出版社“东京审判文献数据库”为例[J].出版广角,2017(7):20-22.

  [6]张维.浅议数字化出版历史文献类书籍的质量把关[J].传播与版权,2018(12):61-63.

国家广播电视总局 | 湖北省人民政府 | 中国邮政集团公司 | 武汉市人民政府 | 中国期刊协会 | 中国图书进出口(集团)总公司 | 中国邮政集团公司报刊发行局 | 湖北省广播电视局 | 湖北日报传媒集团 | 长江广电传媒集团 | 长江日报报业集团 | 知音传媒集团 | | 湖北中图长江文化传媒有限公司 | 决策信息网 | 湖北新闻出版广电传媒周

copyright(c) 2013 湖北省新闻出版局 版权所有 技术支持

鄂ICP备19004605号-4  鄂公网安备 42010602004016号