业内信息

出版融合背景下的知识服务实践——以青藏科考数据库为例

2020-12-21 来源:《科技传播》
  【作 者】杨逢渤:中国科技出版传媒股份有限公司(科学出版社);康蕾:中国科学院地理科学与资源研究所

  【摘 要】数据库出版物作为数字出版产品的主要形态之一,其建设将对科技出版机构的选题开发、优质内容资源集聚以及融合转型发挥至关重要的作用。文章以青藏高原科学考察数据库产品为研究对象,主要探讨内容资源建设、人工标引技术和定制服务等在数据库建设过程中的实际应用场景,以及策划编辑在出版融合背景下的知识服务实践中对推进出版业务同向发展的思考。

  【关键词】知识服务;数据库建设;出版融合;内容资源;标引

  随着科学技术的快速发展,出版融合从传统出版赋能走向全媒体融合阶段,数字技术与出版行业的融合步伐逐渐加快[1]。传统科技类出版社立足于专业学术出版,运用现有的内容资源和社会资源,在做实传统出版的同时,加快融合出版步伐[2]。落实到出版社具体的从业人员——传统编辑,其出版融合意识还有待提高。高质量发展是传统出版和数字业务共同追逐的对象,知识服务不是单纯地凭借纸质图书数字化的方式来实现对市场的占有,而是通过诸如优质内容资源集聚、再加工、分类标引和知识挖掘等手段,实现了资源重组和增值服务。2020年,更多消费场景被开启,尤其是线上产品的深度开发。作为书业从业者的核心人群——编辑,如何更加贴近产业行业纵深,将内容与读者做更为密切的连接,或许成为定义编辑未来职业走向的重要议题[4]。本文试图从知识服务实践的角度出发,以青藏高原科学考察数据库为例,主要探讨内容资源建设、人工标引技术和信息定制服务等在数据库建设过程中的实际应用场景,梳理科技出版企业开展知识服务的核心竞争力——优质内容资源、专业化的编辑队伍和作译者团队在出版融合背景下的结合点,以便为我国专业学术出版机构数字化转型提供借鉴。

  1 产品结构与功能

  青藏高原是地球的第三极,是“亚洲水塔”,其生境变化影响着我国乃至“一带一路”沿线国家和地区超过20亿人口的生存和发展,同时青藏高原也扮演着我国重要的生态安全屏障和战略资源储备基地的角色。基于其特殊的地理资源环境,第二次青藏高原综合科学考察项目的启动,将有助于审视高原环境变化机理,优化区域生态安全格局和体系,对推动青藏高原及周边地区的可持续发展、推进国家生态文明建设等方面都具有十分重要的意义[3]。“第二次青藏高原综合科学考察”项目的启动,引起国内外学界的高度重视,从国家到地方政府,以及相关科研院所均对相关科研成果、数据和项目的应用有强烈需求。

  本项目旨在利用知识组织、数据挖掘和语义出版技术深度聚焦和揭示“科考”相关科研发展态势和产出情况等,实现科研成果发布的基本需求,提升科技成果对青藏高原地区发展的引领和支撑作用。在此基础之上,以本项目构建的平台为抓手,基于精准画像和大数据出版服务,大力开展专业化、定制化科技决策支持服务,将相关领域科技出版业务拓展至科学知识服务和科研解决方案服务。

  1.1 “青藏高原科学考察”信息支撑平台

  依托“青藏高原科学考察”重大研究项目、科研机构及专家信息,以及可获取的数据信息,依托科学技术部、国家自然基金委等项目发布机构和中国科学院等国家高端科技智库,开展“青藏高原科学考察”相关科研项目信息发布、成果跟踪等服务。在知识组织模式上,以大数据技术为基础,建立“青藏高原科学考察”相关科研项目、数据和信息采集、存储、挖掘、分析、共享平台。采取定向采集和合作收集科研、科考各类数据形成大数据池,支持采集和查询结果的智能匹配与关联,实现统计学软件智能交互分析,为“青藏高原科学考察”提供重要的信息支撑。

  1.2 “青藏高原科学考察”资源共享平台

  基于“青藏高原科学考察”科研成果形态的发布,在全媒体出版技术支持下开展内容资源的碎片化拆分、体系化重组和智能化应用,提升科研成果的传播性和易用性。在知识组织模式上,建立基于“青藏高原科学考察”相关术语表、叙词表等概念和属性上的映射体系,确定每一类内容资源的元数据规范形式和连接操作,对“青藏高原科学考察”相关专业领域内多种类型资源进行描述、组织、集成和建设,支持检索、展示、关联、推送等各种科研场景应用。

  1.3 “青藏高原科学考察”交互式服务平台

  依托“青藏高原科学考察”信息支撑平台和资源共享平台,对接科研成果转化需求,为供需双方搭建合作交流的平台,提供资源开发、建设方案、技术创新等方面的咨询研究。在平台上利用语义技术发掘科技成果、项目、政策、需求间的显性和隐性关联关系,实现各类文本、图像和多媒体资源对象及其知识内容的多维标签和语义描述,深入揭示多个维度中的语义关联,通过关联数据构建“青藏高原科学考察”科技信息和知识网络,实现需求和信息资源在语义层面的智能匹配,提升供需对接效率。

  2 内容资源的采集与整理

  内容资源基础是专业出版社走向知识服务的第一步。传统出版社数字化转型都依托自身的优势资源,通过对纸质出版物进行结构化处理、内容标引、数据集成和交互可视化表达等处理形成知识库。通过合理地组织和使用内容资源,有针对性地满足用户需求。专题数据库的数据获取方式包括三个方面,即自建数据库的数据采集、深度挖掘已购数据库资源以及通过采集外部的数字资源[5]。

  青藏高原科学考察数据库产品主要依托社内专业出版积累的大量内容资源,以支撑和满足平台的数字化、碎片化、系统化和规范化重组。其中,与“青藏高原科学考察”主题最直接相关的图书资源为两次科考的相关成果,主要包括“青藏高原科学考察丛书”(西藏部分),合计36部41册2300余万字,以及正在陆续出版的“第二次青藏高原综合科学考察研究丛书”(100册)。青藏高原作为地球系统多圈同时存在并相互强烈作用的典型地区,冰冻圈和水循环过程与影响成为这一地区最受关注的科学问题,建设主要依托地球系统科学,相关图书品种约1000余种。这些选题资源和图书出版成果可为数据库的建立提供稳定的内容资源基础。

  在公共资源方面,可获取的数据资源包括地理空间数据和相关的统计数据资料。目前,“国家青藏高原科学数据中心”“中国高寒区地表过程与环境观测研究网络”等可为数据库提供丰富的数据资源。中国科学院青藏高原研究所、地理科学与资源研究所(包括网络空间地理学实验室)、西双版纳热带植物园、空天信息研究院、西北生态环境资源研究院等单位建成或在建科研数据平台,与其合作对接能够形成本产品的潜在数据源。同时,中国科学院A类战略性先导科技专项“泛第三极环境变化与绿色丝绸之路建设”、第二次青藏高原综合科学考察研究国家专项,“三极环境与气候变化”国际大科学计划等,都将助推知识服务平台的建设。

  在充分考虑资源规模、潜在受众和产品导向的基础上,打造以用户需求为中心、实现“精准画像”的知识服务模式。此外,由于青藏高原地域特殊性和地球系统科学的属性,还需要加强图表库和视频库的建设工作,单独建立视频库,与传统资源实现互联互动。

  3 标引体系的建设

  知识标引工作是实现优质内容资源结构化(数字化)的最重要工具。信息检索是开展知识服务的第一步,而标引是实现信息检索的必要前提。通过构建适用于数据库或知识服务平台的标引体系,通过主题词表的构建和叙词表的完善来实现全面标引,以便能够更精准化地检索。知识体系的构建包括多维度主题分类、领域主题词表及领域本体,而目前多数出版社倾向于采用领域主题词表的方式来完成知识体系的建构和知识服务的运行。选取领域主题词表的构建方式,由于主题词的数量较为庞大,将会迫使开展知识服务的出版机构投入更多的人力和财力[6]。

  青藏高原科学考察的相关出版成果以区域案例分析研究为主,因而数据库汇聚了大量结构化的调查资料和一手统计数据,它们可以为科研院所及专家学者提供丰富的一手资料和区域典型案例,也为学术研究以及现实成果转化提供充足的可信依据。青藏高原科学考察数据库项目以学科知识图谱和专题标引体系为基础,对内容资源进行细分,其标引需要有较强的学科背景,同时作为典型的区域主题类数据库,其主题词表的构建和流程规范的建立也具有明显的示范意义。

  1)主题词表的构建。根据国家科技名词审定委员会所发布的学科科技名词,确定各学科领域的叙词,整理成为专业叙词表(主题词表)。依据叙词表确定各叙词包含的语词(词汇),并参考《中国图书馆分类法》建立参照系统,形成知识库内容标引、知识关联功能实现的基础。

  2)专业编辑标引。由于先期语料库和经验数据的缺乏,难以通过机器学习经验标引数据,机器自动标引的准确率会相对较低。因而,在数据库建立初期,由地学及相关学科背景的专业出版编辑和数字出版编辑根据主题词表规则,对标引知识库中的内容资源进行编辑标引,包括内容文本的来源、题目和作者、摘要和关键词等要素,对已经在库的内容文本作好分类[7]。

  3)质量审核。由于人工标引存在主观认知的差异性,因而数字出版单位应该指派具有一定专业背景的编辑来负责对已标引内容的质量进行审核,在此基础之上,定期对所标引的内容开展批量验证和优化,从而确保标引流程的规范性及标引结果的准确性。

  4)标引规范和流程建设。在充分学习各类标准规范的基础上,以国家科技名词审定委员会所发布的学科科技名词和中国图书馆分类法为基准做映射与关联,利用青藏科考数据库的标引流程和方法,对区域主题类数据库标引体系的建立和信息检索的完善都具有极强的借鉴意义,也能够在一定程度上对区域主题类数据库产品的一贯性和质量的稳定性做出保障。同时,探索编辑标引规范和编辑标引质量管理办法,梳理优化编辑标引工作流程,可为主题类数据库编辑标引工作的规范化奠定基础。

  4 知识定制服务

  优质内容资源集聚和标引体系的建立可以满足知识服务的基本需求,而迅猛发展的信息科技水平和快节奏的工作生活压力使得个人阅读需求趋向个性化和碎片化的方式。在这种情形下,精准化读者画像并提供所需的数字化服务,是融合出版时代背景下数字出版机构重要的发展方向。加速由产品导向转为用户导向的思想转变,模拟用户的阅读场景,把关注点更多的放在其阅读体验和阅读习惯改变等方面,以最适合的出版方式来呈现优质的内容资源,打造用户定制需求服务方案,并且根据用户体验和反馈不断地改进已有的服务模式欠缺的方面和完善现有的知识服务体系,进而达到数据库的定制服务功能与读者(用户)的需求匹配的目的,而这种服务模式在目前比较适合学术性和专业性较强的专业出版社。

  5 结语

  媒体融合发展背景下,出版社应发挥自身内容资源和社会资源等优势,探索和完善从内容提供商到文化服务商的融合出版之路。而作为出版的中坚力量,图书编辑在融合发展和知识服务转型实践的过程中,应该坚持以市场需求为导向,充分利用自身优势资源,增强自身信息拓展与整合能力,找准知识服务转型与传统出版工作的结合点,推进出版业务同向发展。通过信息支撑平台建设,加大对内容资源的采集和整理,及时收集领域内的项目进展、科研机构和专家信息等,让编辑或者出版社更加贴近产业行业纵深,为图书出版聚集了更多的选题和作者资源;通过资源共享平台建设,利用专业优势和对内容资源的把控,建立主题标引范式和知识加工的规范流程,在图书出版的审读或者加工阶段,就可以有意识地开展内容资源的深度挖掘,这样既能保障出版产品的质量,又能缩短数字产品的生产周期;通过交互式服务平台建设,利用知识推荐和定制服务,重构编辑(图书产品)与读者的关系,实现出版社由产品生产商向服务提供商转变。

  参考文献

  [1]宁伟.出版融合发展背景下编辑工作面临的新变革[J].出版广角,2020(357):40-42.

  [2]施其明.为什么说2020年是数字出版一个新起点?[N].中国出版传媒商报,2020-02-28.

  [3]张冬梅,张莉.2019对话姚檀栋:走近第二次青藏高原综合科学考察.科学通报,2019(27):2765-2769.

  [4]刘九如.科技专业出版智库的业务重点及未来走向[J].出版广角,2020(4):11-13.

  [5]李娟,张雪蕾,陈楠楠,等.丝路科技知识服务系统“一带一路”专题数据库的构建与实践[J].探索与交流,2019(2):37-42.

  [6]孙瑶.知识服务视角下皮书数据库运营管理策略探析[J].保定:河北大学,2018.

  [7]高蝴蝶.数字技术在社科专业学术数据库建设中的应用研究——以社会科学文献出版社为例[J].科研信息化技术与应用,2017(1):78-83.

国家广播电视总局 | 湖北省人民政府 | 中国邮政集团公司 | 武汉市人民政府 | 中国期刊协会 | 中国图书进出口(集团)总公司 | 中国邮政集团公司报刊发行局 | 湖北省广播电视局 | 湖北日报传媒集团 | 长江广电传媒集团 | 长江日报报业集团 | 知音传媒集团 | | 湖北中图长江文化传媒有限公司 | 决策信息网 | 湖北新闻出版广电传媒周

copyright(c) 2013 湖北省新闻出版局 版权所有 技术支持

鄂ICP备19004605号-4  鄂公网安备 42010602004016号