业内信息

整合式平台与专业性平台:学术数字出版平台的两种模式

2021-01-10 来源:《科技与出版》
  【作 者】于成:青岛大学新闻与传播学院

  【摘 要】回顾学术数字出版平台20多年来的发展史,可将其分为3个发展阶段:第一阶段是STM出版商引领的整合式平台的起步期;第二阶段是整合式平台的服务创新和发展成熟期;第三阶段是新型专业性平台的发展完善期。学术数字出版平台发展过程中,机器行动力的重要性愈发凸显,尤其是新型专业性平台在XML及其相关技术的基础上,又叠加了通用数字技术、图片检索技术、人工智能技术等,很可能成为新的数字出版增长点。如何利用新的技术组合推动数字出版产业结构调整,是我国学术数字出版业面临的问题与挑战。

  【关键词】学术出版;数字出版;STM出版;服务创新;机器行动力

  数字出版平台是以标记语言(尤其是XML及其相关技术)为基础,承载数字化内容(如期刊、图书、研究报告等),并提供知识服务的网络平台。根据美国数字出版平台联盟(Digital Library Federation)、贝克(D. Baker)等给出的界定,数字出版与传统出版的本质区别是:数字出版能够在内容的储存、处理和传递上提供新的组织方式。[1]

  经过20多年的发展,学术数字出版平台已成为科研工作者不可或缺的工具。除了国际出版商的平台外,知网、万方、维普等平台亦在我国学术研究过程中扮演着重要角色。但是,由于技术跟进相对缓慢以及经营管理体制等原因,我国学术出版商在学术数字出版领域往往滞后于国际出版商。因此,我国学术出版商需要认清自身在学术数字出版领域所处的位置,以更好地规划未来的发展方向。

  本文总结并分析了两种学术数字出版平台模式——整合式平台与专业性平台,厘清我国学术数字出版平台的发展现状。一方面,知网等整合式平台已跨过技术转型阶段,向服务创新阶段过渡;另一方面,专业性平台缺失,未能跟进国际发展趋势。

  1 整合式数字出版平台的两个阶段:从技术转型到服务创新

  整合式学术数字出版平台(以下简称“整合式平台”),是指通过整合多种学术数字资源库、数据库,为用户提供学术知识服务的数字化信息组织平台。整合式平台以科研机构和科研人员为主要服务对象,在数字出版领域占据重要位置。海外STM出版巨头建设的知识服务平台、大学出版社建设的知识服务平台(如剑桥大学出版社的Cambridge Core)、数字科技公司建设的知识服务平台(如台湾华艺线上图书馆),都属于整合式平台。

  1.1 第一阶段:STM出版巨头的技术转型

  最早成功进行商业运营的数字出版平台是STM出版商研发的平台。STM出版商在20世纪90年代中期,率先采用XML及其相关技术,以资源建设为中心,建立了拥有海量内容的数据库,为科研人员提供了数字化科研工具。例如,施普林格在1996年推出了电子期刊全文数据库SpringerLink[2],爱思唯尔和威利在1997年分别发布了ScienceDirect[3]和Interscience[4]数字出版平台。在这一阶段,技术在数字出版转型中扮演了关键角色。XML技术,以及相关的用于定义、设计、链接、转换和标注等的标准,为数字出版发展奠定了基础。

  将XML作为内部存档和外部交流的语言格式,大大改善了内容的功能和互操作性,促进了新型软件工具的开发,提升了内容的创作、管理和传播水平。数字出版之所以更有效率、成本更低,就是因为XML及其相关技术使信息组织方式产生变革:将传统出版“一次创建一次使用”的一次性出版方式,转变为“一次创建多次使用”的永久性传播方式。

  有赖于技术转型,人们对出版物的理解也发生了变革。出版物通常由3个部分构成:载体(container)、内容(content)和背景情境(context)。与纸质出版物相比,数字出版物在载体、内容和背景情境上都呈现出新的特点。第一,在载体方面,数字出版物的载体是呈现电子内容的设备,与载体相关的最重要元素是文件格式,如常见的pdf、epub、mobi等格式,每个载体都有其可兼容的文件格式;而纸质出版物的载体是纸张,纸张直接承载内容,不存在格式的问题。第二,在内容方面,纸质出版物的内容固定在每页纸上,如果需要修改或更新内容,必须在重印或再版时进行修正或添加附录;而数字出版物可以直接实时在线完成内容的修改或更新。数字出版物的这个特点带来了纸质出版物时代所没有的问题,即内容的准确性无法保证,很难用于学术引用。第三,在背景情境方面,与纸质出版物相关的背景情境通常由书店、图书馆、出版商和记者等提供,如图书推荐、书评、作者采访等,这些背景情境外在于纸质出版物;而数字出版物可以通过超链接的形式将原本外在于纸质出版物的背景情境内嵌在数字出版物中,还可以嵌入词典、音视频等,背景情境的丰富度大大提高。[5]

  总之,在传统出版中,传统的编校流程是出版的手段,纸质书是这一手段的唯一目的;在数字出版中,XML及其相关技术是出版的手段,数据流出版是目的,纸质书可以是数据流的一种形态,但不是唯一形态。事实上,真正的数字出版绝非弃纸质出版于不顾,成熟的数字出版是数据流出版;纸质出版并不会随数字出版的出现而消失,只是被整合进了数字出版的流程当中。

  在STM出版巨头集体进行数字出版转型的同时,一些大学出版社等学术出版机构也尝试进入整合式数字出版领域,但这些学术出版机构的数字出版实践并没有取得成功。早在1996年,莱斯大学出版社(Rice University Press,以下简称“莱斯社”)就实施了学术图书数字化项目,由于经费不足,该社难以维系而倒闭。2006年,莱斯社重获新生,启动了全数字化运营(all-digital operation),即主要靠按需出版(print-on-demand)来盈利。但是,由于运营成本高昂、缺乏财政支持,莱斯社在2010年再次倒闭。

  在没有经验的情况下,无论是纸质出版物的数字化,还是从传统出版流程升级为数字出版流程,都需要相当大的人力、物力和财力投入。对于体量较小、以非营利性学术出版为主要目标的学术出版机构来说,一般难以承受巨大的数字出版投入。虽然莱斯大学教务长尤金·列维(Eugene Levy)认为:莱斯社的数字出版实验并非没有考虑到这些问题,若运营规模更大且学校的财政危机没有发生的话,莱斯社的实验可能会继续下去[6]。但从整个学术出版生态来看,只有那些全球性的出版机构,才不至于被巨大的前期投入所拖垮。简言之,由于受到资金、技术、理念等的制约,学术出版机构在整合式数字出版技术刚刚出现时,并不具备用数字出版技术盈利的条件。

  1.2 第二阶段:以用户体验为中心的服务创新

  在第一梯队的STM出版商完成数字化转型之后,第二梯队的信息公司或出版公司才有条件搭上技术的便车,发挥后发技术优势,建设自己的整合式平台。在第二梯队的阵营中,较早的实践是新加坡的世界科技出版公司于2006年上线的WorldSciNet平台。然而,第二梯队的早期实践尚缺乏自己的特色,只能说是技术门槛降低后的跟进行为。真正提升第二梯队的数字出版水平的标志是以牛津大学出版社(以下简称“牛津社”)和剑桥大学出版社(以下简称“剑桥社”)为代表的新平台的上线。

  2016年11月,牛津社开始着手将牛津期刊在线(Oxford Journals Online)、牛津期刊档案库(Oxford Journals Archive)等在线期刊内容迁移到新平台Oxford Academic。整个迁移过程在2017年2月完成,旧平台会自动跳转到新平台。除了期刊,用户还可以在新平台上获取电子书等原来在其他平台上的数字产品。[7]恰在此时间节点,剑桥社也推出了整合式数字出版平台。剑桥社在2016—2017财年年报中特别指出:该财年最重要的时刻,就是新数字出版平台Cambridge Core的顺利上线(2016年9月)。[8]

  不同于早期以技术转型为主导的整合式平台建设,此时的数字出版平台已发展到新的阶段,即以服务创新为主导的阶段。如果说内容与技术的结合是保障早期数字出版转型顺利进行的基本条件的话,那么在服务创新阶段,仅仅有内容和技术还不够,充分尊重用户体验才是成功的关键。相比于人们对整合式平台的刚性需求,个人用户和机构用户对大学数字出版平台的需求稍显不足,那么,如何通过特色的内容服务吸引并留住用户,就是第二梯队出版商需要着力关注的问题。

  Oxford Academic和Cambridge Core不仅仅是技术升级的产物,更是服务升级的产物。相比于旧平台,Oxford Academic在诸多方面进行了服务优化,如用户可以在手机、平板电脑、台式电脑等多种载体上访问;设置了更多浏览选项(浏览所有内容、按照内容标签浏览、按照期刊卷期浏览);优化了过滤结果;搜索结果可显示文章、期刊和多媒体等混合内容;优化了可访问性等。[9]Oxford Academic还详细说明了为作者、图书馆员和合作伙伴等提供的个性化服务,致力于提升用户的使用体验。牛津社2017—2018年报指出,由于牛津社在优化用户体验上的努力,期刊访问量增长了10%。[10]在Cambridge Core的研发过程中,剑桥社咨询了近一万人,并根据图书馆员的试用反馈进一步完善系统[11]。

  总之,在技术条件相对成熟的情况下,规模较小的内容提供商开始有条件谋求建设自己的整合式平台,这些后起之秀不再需要将工作重心放在技术研发上,而是专注于提升用户体验。

  虽然用户对STM出版巨头的平台有着刚性需求,但STM出版巨头们并没有裹足不前。同第二梯队一样,STM出版巨头在保证内容质量的同时,不断通过技术创新和服务创新,进一步转型为能够为用户提供专业化、个性化服务的知识服务平台。例如,爱思唯尔通过并购、业务拓展,运用机器学习(ML)和自然语言处理(NLP)等新技术,进行价值链延伸。“经过价值链延伸,爱思唯尔已经从一个传统的科技期刊出版商转型,成为一个服务于科学研究价值链上每个环节的平台和服务供应商。”[12]

  1.3 小结

  整合式平台的发展主要经历了两个阶段。第一阶段自20世纪90年代中期开始,由STM出版巨头发动。该阶段的最主要特点是突破了技术限制,形成了一批具有刚性需求的、面向全球科研用户的整合式平台。第二阶段自21世纪初开始,除了STM出版巨头进一步强化自身在知识服务领域的地位,第二梯队的出版商和科技公司开始发挥后发技术优势,研发出具有特色的整合式平台,与STM出版商共同分享学术数字出版市场。该阶段的特点是,整合式平台建设的重心从技术和资源建设转移到用户体验,并将业务不断延伸到其他有价值的环节。

  2 专业性学术数字出版平台的起步与发展

  在整合式平台进入服务创新阶段的同时,出现了针对某一学术领域的专业性学术数字出版平台(以下简称“专业性平台”)。这些专业性平台无论在内容集成还是技术运用上,都不同于以往的专业数据库。专业数据库或内容产品虽然也是针对某个领域的数字出版产品,但往往不具备单独的信息储存、处理和传递功能,而是要依附于整合式平台的技术能力,如《中国学术期刊网络出版总库》《中国博士学位论文全文数据库》等,需要依附中国知网平台才能实现。而近年来出现的新型专业性平台①,如通用数据仓储、世哲(Sage)的研究方法数据库、美国化学文摘社的SciFinder、牛津大学出版社的在线词典平台等,则可以独立地完成符合专业要求的信息检索与处理任务,构成了一种新型的学术数字出版模式。下面,笔者从内容、技术、市场和服务等角度,分析专业性平台的特点。

  2.1 内容与需求

  专业性平台主要有3种内容类型。一是针对某学科的平台,如SciFinder集成了化学期刊、专利和化学结构式等内容,并提供逆合成分析解决方案,是专门针对化学领域的数字出版平台。二是针对各学科都涉及的某个学术主题的平台,如世哲研究方法数据库就是以社会科学研究方法为主要内容的平台,集合了与研究方法有关的期刊、图书和视频资源;再如,牛津社的在线词典平台,将所有的在线词典内容(包括OGL和OED等)整合在一起。三是针对自然科学研究的通用数据仓储,支持任何格式的数据发布,如数据集、数据论文、演示文稿、多媒体问卷、文件集等。

  与以往的专业数据库相比,专业性平台的内容体现了两个新特点。

  一是内容形式上,不再限于文本内容,而是将文本、图片、视频等多媒体内容资源整合起来,满足用户的多样化需求。以世哲研究方法数据库为例,用户不但可以从中找到单本图书、百科全书,还可以找到研究方法系列手册;除了电子书资源,还有由学者记录的科研案例(research cases)、来自大型研究项目的调查数据以及研究方法的教学视频等。

  二是开发新的内容产品,形成有特色的专业内容。例如,世哲研究方法数据库中的研究方法教学视频是2017年上线的新产品,每个教学视频的时间从几分钟到几十分钟不等。教学视频由专家或教材作家主讲,教学视频界面在左边,台词文本(英文)在右边,作者说到的台词会自动标黄,方便非英语母语的学习者对照学习,学习者全屏观看视频时可添加字幕观看。

  再如,世哲研究方法数据库特色资源“科研案例”按管理、社会政策、教育等社会科学方向分为十几个标签,便于不同学术方向的用户选择。“科研案例”不同于一般的科研经验分享,它遵循社会科学学术研究的逻辑,重点介绍如何开题、如何选取研究方法、收集数据、数据分析等一整套科研流程,文末附有讨论题、习题和进一步阅读的文献,既可用于自学,也可用于课堂教学。“科研案例”界面中含有案例对应的期刊文章链接,方便用户参照。另外,对于需要初步且较全面地了解某一方法的用户,可以选择little green book(定量研究方法系列)和little blue book(定性研究方法系列)中的网络图书内容,每本书会精简地集中介绍一种方法。这些内容体现出按章出版的特点,内容按知识点切分,用户不需要通过一级一级的浏览发现内容,通过关键词就可以检索到所需的文本或视频资源。

  总之,专业性平台一方面具有整合式平台的技术特点——打破格式之间的不可通约性,更便于信息的发现和获得;另一方面,专业性平台比整合式平台的内容服务更精细化、专业化。专业性平台并不是整合式平台的一部分,而是具有某些整合式平台不具备的内容和功能。专业性平台针对某一专业领域量身定制数字化知识服务策略,推动了数字出版朝细分市场的方向发展。

  2.2 新技术与新理念

  将专业性平台与数据库区别开来的关键在于技术,尤其是能将文本格式、音视频格式等整合为数据流的通用(general)数字技术。通用数字技术能够让平台使用通用的出版标准进行概念化表达和结构化表达,强调在没有或非常少的人类干预下,计算机系统自动发现、获得、操作和重用数据的能力。通用数字技术不仅带来了内容的多模态(文本、图片、音视频)呈现,更意味着信息组织方式的进一步升级与机器行动力(machine-actionability)的提升。

  以近年来科学数据出版领域出现的通用数据仓储为例②,大量研究表明,在缺乏通用数据基础设施条件下,学界和业界的数据科学工作者若要定位、访问并格式化数据以供重用,需要花费70%——80%的时间在手工作业上,这样的技术条件无法支撑共享数据的FAIR原则(数据的可发现、可获得、可互操作和可重用)的实践。也就是说,通用数据仓储作为通用的数据基础设施,是在人类互联网(Internet for People)之上建立的机器互联网(Internet for Machines),可以为各种格式的数据的重新利用提供保障,利于减少重复劳动,提高数据共享水平。[13]目前,Figshare等通用数据库(repository)已开始运营,既为FAIR原则的实践提供了物质基础,也可以作为FAIR原则指导下的试验田。

  对用户而言,通用数字技术不仅支持文本检索,而且支持图片检索等新型信息发现功能。例如,SciFinder提供化学结构式的图片检索,用户可通过平台绘制化学结构式,从平台中检索相关文章和专利,大大丰富了化学工作者的检索手段和科研效率。再如,世哲研究方法数据库可根据用户提供的方法地图(methods map)工具,帮助用户发现与研究方法相关的内容,用户只需键入某种研究方法,就会呈现出知识地图,检索的方法会位于中间,左侧显示出它所属的上级术语,右侧显示下级术语,下方显示相关术语,这些术语又可以通过点击进一步展开,构成一级一级的知识网,以便于用户更全面地掌握信息,甚至发现意想不到的兴趣点。总之,利用新技术的信息发现能力,平台用户可与机器协作完成知识发现与科研任务,实现麦克卢汉所谓的“技术对人类思维的延伸”。

  随着大数据、机器学习等技术的发展,强调机器行动力的数字出版技术并不是被动的辅助者,而与人类的大脑一样,是完成实践活动时不可或缺的主动创造者:只需要用户提供部分原始数据,就能够帮助用户筛选、发现甚至创造信息、知识。专业性平台敏锐地在新兴技术的基础上,深化了人机协作能力,成为数字出版领域不容忽视的未来增长点。

  3 两种模式对我国学术数字出版的启示

  3.1 整合式平台的服务创新

  从全球范围来看,整合式平台已由原先较简单的“技术+内容”模式,转变为愈加复杂的“技术+内容+服务理念”模式。学术数字出版平台发展初期,STM出版巨头可以依靠先进技术和积累的海量内容招徕大量的刚性需求用户,但在以XML为基础的数字出版技术已相对成熟和纸质内容已基本完成数字化的今天,还想依靠内容和技术这两条腿在复杂的市场环境中走路,已颇为艰难。忽视专业化服务的理念和内容设计原则,是无法满足科研人员的多样化需求的。

  知识服务首先要遵循目标化原则,即知识服务是用户目标驱动的服务,不了解用户所面临的问题和要达到的目标,就无法提供有针对性的服务。科研人员的目标不仅仅是网罗所有相关文献,他们往往还希望第一时间对这些文献的质量进行甄别,快速找到目标投稿期刊,获得研讨会参与方式等学术信息。一个强大的检索栏已无法满足这些需求。学术数字出版平台理应建立在对潜在用户需求的调查、分析的基础之上,根据科研工作的性质和特点,结合相关网络技术,有针对性地设计各个栏目。[14]例如,一些平台根据学科进行分类的树状架构,看似古板且不符合新媒体的“美学”要求,却恰恰契合科研人员对知识的认知,更便于科研人员获取资讯。科研人员与大众阅读者分属不同的场域,不同场域中的用户的认识、搜寻、记录知识的方式显然会存在差异,针对不同的场域设计符合该场域用户习惯的产品,才能进行更有效的知识服务。再如,Cambridge Core不仅考虑到个人用户的使用体验,还利用循迹采购(EBA,Evidence Based Acquisition)模型帮助图书馆等机构用户采购。图书馆先预付一定费用,获得12个月的大量电子书内容访问权,在此期间,图书馆需要密切监测内容的使用情况;在预付期满后,图书馆结合内容使用情况和自身情况,最终决定要买哪些电子书内容。[11]这个模式完全符合精准化营销的要求,能够实现买方和卖方的双赢,值得进一步推广。

  整合式平台的设计是否合理,检验的标准最终是用户的体验:一是用户是否感觉服务易用(感知易用性),二是用户是否感觉服务有用(感知有用性)。实证研究发现,用户的感知有用性对使用意愿有显著影响,感知易用性则通过影响感知有用性而间接影响行为意愿,如果用户在使用服务系统时觉得困难,那么他很可能就不会觉得该服务是有用的,从而削弱其使用动机。[15]如此看来,整合式平台的设计不仅要重视检索栏这些必然“有用”的服务,还必须注意服务的易学习性和简洁性。例如,一些平台中传统的书目汇出服务、订阅服务等就是因为简单易用而常被使用,而许多新媒体服务项目却因过于“先进”而无人问津。总之,整合式平台在设计上应删繁就简,力求简明实用,不需要像一般商业网站那样通过不断提供新花样博人眼球;整合式平台应用的新技术,应当只是让优质内容更有效地到达用户的手段,而非目的。

  3.2 专业性平台的建设

  相较于整合式平台,专业性平台更强调需求的细分,如化学研究者需要化学结构式检索方案。这些细分的需求恰恰是整合式平台无法完全兼顾到的,因此可能成为未来学术出版的增长点。可惜的是,我国的专业性平台尚处于初级阶段,如专业的数据仓储平台Science Data Bank更多地面向国内期刊和科研项目,市场化程度不够。

  专业性平台建设需要充分参与市场竞争,因为需求的细化必然要求服务的细化,仅仅依靠行政手段很难满足科研人员的特殊需求。在我国,一些数字出版平台几乎网罗了我国各个大学和科研机构的内容,服务创新意识不能完全匹配科研成果的传播效果,但却能从庞大的下载量中获取收益。也就是说,在学术数字出版平台建设领域,我国的一大问题是未能完全建立起公平竞争的市场环境,未能完全建立起包括内容提供者、服务平台和用户等在内的利益平衡机制。

  在运营过程中,专业性平台需要充分了解用户需求,对师生、图书馆员和相关学术团体进行市场调查,然后选择性价比合理的技术,以实现更有效率、更精准化的知识服务模式。

  4 结语

  无论是整合式平台模式还是专业性平台模式,技术都是实现产业化的基础因素,机器行动力的重要性愈发凸显。尤其是新型专业性平台,在XML及其相关技术的基础上,又叠加了通用数字技术、图片检索技术、人工智能技术等,很可能成为新的数字出版增长点。我国的整合式平台建设已臻于成熟,但在专业性平台建设方面尚处于起步阶段,如何利用新的技术组合推动数字出版产业结构调整,是我国数字出版业面临的问题与挑战。

  ①针对某一学术领域的平台在20世纪90年代末即已萌芽,本文所谓专业性平台特指利用通用数字技术等新技术的平台。

  ②随着技术条件的成熟,出版界自2012年开始讨论建设通用数据基础设施。

  参考文献

  [1]BAKER D,EVANS W.A handbook of digital library economics[M].Cambridge:Chandos Publishing,2013:2-3.

  [2]于成,张大伟.施普林格数字出版之路:SpringerLink,技术与内容结合的一种范式[J].编辑学刊,2014(4):12-17.

  [3]刘益,马长云.励德•爱思唯尔集团的经营管理与发展战略研究[J].科技与出版,2011(3):23-27.

  [4]王志刚.约翰•威利父子出版公司数字出版发展探究[J].编辑之友,2010(8):126-128.

  [5]RYAN B.Optimizing academic library services in the digital milieu[M].Oxford:Chandos Publishing,2013:70-91.

  [6]HOWARD J,RICE U.To close its digital press next Month[EB/OL].(2010-08-19)[2018-11-19]..

  [7]HARRASSOWITZ.Oxford university press journals on new platform oxford academic[EB/OL].[2019-01-21]..

  [8]CAMBRIDGE UNIVERSITY PRESS.Annual report(for the year ended 30 april 2017)[R].Cambridge:Cambridge University Press,2017.

  [9]CALIFORNIA DIGITAL LIBRARY.Oxford journals move to new platform,oxford academic[EB/OL].(2017-03-02)[2019-01-21]..

  [10]OXFORD UNIVERSITY PRESS.Academic overview[EB/OL].[2019-01-21]..

  [11]CAMBRIDGE UNIVERSITY PRESS.Annual report(for the year ended 30 april 2018)[R].Cambridge:Cambridge University Press,2018. [12]练小川.爱思唯尔的价值链延伸[J].出版科学,2020,28(2):26.

  [13]MONS B,SCHULTES E,SANTOS B.The fair future of repositories as a critical component of the internet.In Digital science report:the state of open data 2018[R].London:Digital Science and Figshare,2018:5-6.

  [14]黄敏,都平平.我国学术型个人数字图书馆发展研究评述[J].图书馆学研究,2012(4):6-8.

  [15]聂静.学术出版数字化知识服务实证研究[J].出版发行研究,2018(2):19-24.

国家广播电视总局 | 湖北省人民政府 | 中国邮政集团公司 | 武汉市人民政府 | 中国期刊协会 | 中国图书进出口(集团)总公司 | 中国邮政集团公司报刊发行局 | 湖北省广播电视局 | 湖北日报传媒集团 | 长江广电传媒集团 | 长江日报报业集团 | 知音传媒集团 | | 湖北中图长江文化传媒有限公司 | 决策信息网 | 湖北新闻出版广电传媒周

copyright(c) 2013 湖北省新闻出版局 版权所有 技术支持

鄂ICP备19004605号-4  鄂公网安备 42010602004016号