业内信息

媒体融合背景下出版业大数据建设的路径与思考

2021-02-02 来源:《西部广播电视》
  【作 者】王晓东:黄河出版传媒集团有限公司

  【摘 要】媒体融合背景下,出版业应按照“互联网+”思维,规划和布局大数据建设,完善现有数字资源体系,规范数据标准,从数据体量、内容、完整性、准确性、实用性等方面全方位奠定出版大数据基础;为用户提供基于大数据的个性化、内容权威的知识服务。本文主要探讨出版业大数据的建设思路和利用大数据开展知识服务的路径。

  【关键词】媒体融合;出版业;大数据建设;知识服务

  随着融媒体时代的到来,在(移动)互联网、物联网、云计算等一系列新兴技术的支持下,出版融合的发展步伐加快。大数据建设是“十三五”提出的新闻出版业推进供给侧结构性改革的重要措施。按照行业“资源编码化、生产数字化、运营数据化、服务知识化”的设计和建设原则,对于出版单位来说,应理性分析自身资源特色、目标用户和应用领域,统筹布局出版业大数据,借助国家和地方对大数据建设的各种扶持政策,以项目带动为引领,把握战略发展机遇,有序推进大数据建设,加速出版业务的转型升级与融合发展。

  1 大数据的概念与特点

  大数据是指以多元形式、从众多信息来源汇聚而来的庞大数据组,具有一定的实时性。大数据的主要特点是大量、高速、多样、高价值密度、真实性。也正是因为数据量的巨大,使得在实际应用过程中能够通过大数据分析来发现一定的规律,进行相应的预测和研判。大数据与其所进行的分析预测,对于新闻出版行业来说,会深刻影响到信息资源的未来发展格局,加速现有生产经营模式的变革。

  2 出版行业应用大数据的方法

  随着互联网的日益发展,传统出版业受到很大冲击,这既是挑战同时是机遇。传统出版单位应积极拥抱互联网技术,在大数据应用上开展相关探索,认识到大数据在出版产品的策划、内容的生产制作、产品的发布以及运营推广等环节的数据价值,以大数据的思维重构出版业务流程和产业链,在出版产业链的各个环节中进行数据挖掘,充分利用有价值的数据。通常,出版业大数据可分为核心层、产品层、业务层、市场层和用户层五个层面,不同层面的出版数据的采集与生成方式、应用场景也有所不同。出版单位在开展大数据建设之前一方面应理清自己的数据家底,摸清楚有多少有价值的图书数据资源,注重数据资源的聚集和整合;另一方面应完善企业的信息化、数字化基础设施,为大数据建设提供技术、数据支撑和基础保障[1]。

  关于大数据的应用,出版单位在生产过程中应从选题策划到编、印、发的每一个生产环节,去挖掘、分析和研判哪些是有价值的数据和信息。这些基于一定统计分析后得出的相对客观的数据,可作为人们决策依据的参考。比如,在发行环节,出版单位通过分析某类图书的市场占有率、库存的情况、受读者欢迎的程度、作者的人气和知名度等数据,推算出该类题材的图书是否值得发行以及发行量多少;在营销推广过程中,应用大数据可为图书的精准营销提供决策参考,出版单位可基于大数据搭建自己的产品营销平台。

  相对于传统的市场营销中对读者阅读爱好进行抽样调查的方式,大数据可以从读者的浏览、收藏和购买记录进行整理汇总,根据这些统计数据去分析和计算用户的消费习惯、阅读爱好、购买行为、地理位置等,从而得到有实际参考意义的统计数据,为出版的生产经营提供可靠的数据参考。总之,在出版各个环节利用好大数据可以有效降低库存,优化资源配置,提高生产效率,提升售后服务的品质[1]。大数据的深度应用可实现数据价值的个性化展示,实现经营数据的支持服务,提供多维度、多角度的数据分析报告、多方面的数据支持和辅助决策服务。

  相对于传统出版大数据的应用场景,为实现按需出版和个性化内容定制出版,数字出版从业者通过对用户使用网站、APP等的浏览和购买记录,利用大数据可以分析出用户的阅读偏好,从而为读者提供个性化的服务[2];在知识服务领域,利用大数据准确分析用户对知识的需求,可以为用户提供具有针对性的知识应用服务。

  3 出版业大数据体系建设的思路

  随着媒体融合步伐的深入推进,国内大多数传统出版单位加快了转型升级的步伐,搭建出版业全流程数字化生产平台,对存量图书进行数字化转换,对增量内容进行结构化加工,充分运用数字化平台,让数字内容的生产进一步规范化和标准化,从内容生产的源头起,时时刻刻有针对性地收集数据,并进行整理汇总和统计分析,这样才能为大数据的知识服务和图书的精准营销提供科学可靠的数据支撑[1]。

  当前知识付费成为数字出版的盈利热点之一,出版业大数据建设除了在传统出版环节应用大数据之外,应着重围绕知识服务的可行性来进行总体规划。出版社应顺应大数据时代知识服务的需要,在现有的出版信息化、数字化建设的基础上,运用互联网、云计算等技术,建立统一数据平台。采用行业数字内容资源聚合、资源共建、共享合作等模式,以出版大数据资源为基础,以大数据价值挖掘为中心,准确分析和抓取用户知识服务需求,提高对出版相关数据的收集、存储、管理、分析和运用能力,从内容开始生产的时刻收集数据,为精准营销和知识服务打好基础。对取得的数据挖掘的结果,要进行多种媒体形式的可视化呈现,为出版的内容生产、渠道传播和媒体融合发展提供强大的支持。

  3.1 全面完善大数据基础

  在出版业务流程数字化升级和图书资源数字转化的基础上,要进一步扩大存量资源和新增资源数字转化的范围和内容,提高数字转化产品质量,完善数字资源体系,规范数据的技术标准,从数据体量、内容、完整性、准确性、实用性等方面全方位奠定出版业大数据基础。

  3.2 建设统一数据平台,对数据进行综合分析、挖掘

  在现有数据的基础上,在其底层建立统一数据平台;通过数据库中间件建立单向同步机制,统一信息化系统标准、数据标准和数据归口,对出版物生产和流通环节的内容数据等进行清洗后,通过单向同步的方式同步到统一数据平台中;引入网络机器人爬行机制,模仿网络搜索引擎工作模式,存储当前用户感兴趣的信息,进行分类索引,存储到统一数据平台中;利用中间件技术实现统一数据平台与企业现有数据的融合,达到既充分共享资源,又严格保护数据的目的;建立可维护的逻辑运算关系,自动对统一数据平台中的海量数据进行分析、汇总,把数据平台中的数据潜在逻辑关系深度梳理出来并进行存储。

  3.3 面向不同类型的用户提供有针对性的推送服务

  要引入消息机制和推送机制,保证大数据挖掘的信息可以快速、及时、准确地发送给指定用户。要收集用户偏好对大数据内容进行反馈,建立用户偏好数据库,记录系统中每个用户的使用偏好,定期把偏好数据库中新收集的偏好与信息推送系统和数据挖掘系统进行反馈,及时修正数据分析和数据推送逻辑,形成负反馈机制,使系统服务更加贴近用户需求。

  3.4 开展大数据知识应用服务

  大数据背景下,出版单位积极开展大数据知识应用服务,以进一步优化资源结构,提高数据挖掘潜力和资源的利用效率,同时提升服务能力水平,从而实现从内容提供商向知识应用服务商的转型。这也是数字化转型的重要举措之一,符合当前媒体融合的发展趋势[3]。大数据平台建设应着重加强信息知识的搜寻、组织和分析研判能力,以帮助用户分析问题、解决问题,实现作为大数据知识服务的目标。随着目标用户需求的进一步深入,要求出版大数据知识服务平台能够为用户提供知识挖据、重组和创新等方面的服务,为用户提供更加系统、权威、科学和精准化的数据内容和知识。

  3.4.1 注重内容的实用价值

  出版大数据建设应避免“大而全”,要立足自身的资源特色,注重内容的实用价值。首先,要牢固树立“精品意识”,坚持质量第一,把优质内容的建设作为出版的核心,提高图书内容的原创能力,策划制作出更多优秀出版物,确保核心的优质内容资源供给基础稳定、根基牢固。其次,要对知识进行深度加工,借助大数据分析挖掘平台,将海量的出版资源和内容进行细分,提炼归纳出各种知识的组成要素,再根据需要进行重组,通过加工和清洗向“专而精”迈进,形成有用知识;同时分析潜在的目标用户,有针对性地建立专业知识,提供高度专业化的知识资源,为用户减少搜索时间、提高使用效率。

  3.4.2 搭建知识服务平台

  本着知识专业、内容权威、数据标准、具有学术价值的建设目标,出版业大数据建设一方面应着重汇集和整合内容丰富、系统、专业、权威、具有一定学术价值的各类图书资源,充分利用数字技术对内容资源进行结构化加工和科学合理的标引、标注,建立规范、完备、开放和使用方便的数据体系,完成专业知识体系和知识库的构建,用先进技术和理念搭建知识服务平台。另一方面,应培养专业的编辑人才和数字出版队伍,给予行业从业人员以直观的指导,帮助使用者拓宽知识面,通过搭建具有智能检索功能的知识服务平台,进行专业领域的用户分析,锁定不同用户群,分析用户的行为、兴趣、反馈等,挖掘用户深层次的信息需求并给出精准答案,为行业从业人员提供功能性较强、能解决实际问题的信息产品。

  3.4.3 联合共建与内容资源融合

  一些出版单位整体出版资源体量相对较小,还不能形成海量数据规模。大数据的知识服务体系建设应本着开放包容的原则在相关领域展开合作,拓宽资源的获取范围,采取数据共享、用户共享、资源共享等方式,将不同单位的数据进行分类整合,形成各自关联的体系;同时,通过出版技术的发展创新来带动出版产业结构转型升级,将互联网的共享、共赢理念应用到大数据建设中。要立足编印发全产业链条,建设从选题策划到编辑、印制、发行等全流程的信息资源平台,通过数字化、信息化系统的实施,实现规范化、科学化管理,优化、整合优质出版资源,有效集成企业各类生产、销售、物流和财务信息[3],通过实现“纸数融合”,促进作者在创作生产、编辑在内容呈现以及用户在使用观念上的融合,鼓励编辑学习新媒体技术,在编印发各环节积极应用数字化平台,以融合思维推动大数据建设。

  为有效聚集行业有用资源,应积极与业界掌握同类资源的出版单位展开广泛合作,提取行业共性需求,做好与相关行业系统的对接,基于大数据建设的行业规范和知识服务标准开展工作[3]。要使用数字平台和工具提高数据的加工能力和知识的汇集、挖掘、分析和统计能力,实现数据的增值。各合作单位应相互学习借鉴,总结经验教训,不断提高出版大数据的建设水平,创新出版业大数据的知识服务模式,最大程度体现知识资源的应用价值。

  4 出版业建设大数据应注意的问题

  虽然大数据的应用有诸多好处,但是,传统出版单位也不能盲目跟风进行大数据建设,只有人、财、物各方面条件都具备的前提下,才可以进行大数据的探索和应用。

  首先,要具备大数据知识方面的技术人才。出版单位建设大数据,在没有任何经验的前提下,不能盲目组织一个研发团队去开发,一般可以选择与在行业领先的技术公司合作来共同开发本单位的大数据平台。这就要求出版单位培养既懂编辑出版又懂大数据技术语言的复合型人才,与出版者充分沟通,详细了解其需求,同时又能听懂技术开发者的语言,把需求准确传达给开发者,将需求与设计、实现很好地衔接起来,开发出真正适合用户需求的大数据平台。另外,不能一味贪大求多,而摒弃“小数据”,多样化、有价值、高品质的数据都是好数据。要基于一定的标准,多加分析,认真梳理,量体裁衣,合理聚合、梳理、归纳各类有用数据,建立适合自己应用的大数据体系。

  其次,要考虑到建设周期和资金实力,从长远看,拥有自己的大数据开发团队在管理和后期的维护、更新上更有益处,但是一般出版单位大多很少能养活得了这样一个专业的技术团队,人力成本首先就是一个很大的问题。如果出版单位选择和第三方技术公司合作,就会面临需求沟通不畅和后期维护有可能脱节的风险。第三方公司的“选型”也是一个需要慎重考虑的问题,一定要选择在行业内有诸多成熟应用案例和良好口碑、经验丰富的技术公司合作,当然这样的公司一般开发成本都比较高。出版单位要量力而为,根据自己的资金实力,选择适合自己的大数据建设模式。

  最后,要考虑用户的需求。任何应用系统的建设都是来自于使用者的需求,如提高生产效率、降低成本、增加利润。出版业大数据建设也是如此。建设大数据平台,是为了将来能为出版单位带来丰厚利润回报的同时又能达到降低成本、提高效率的目的,这就要求相关人员必须认真分析读者和用户的需求,与消费者形成良好互动,不断学习,获得知识创造的价值,从而合理规划大数据体系建设和知识库的建设,开发出真正为用户服务的大数据编辑、出版、发行平台和知识服务平台,并在应用和实践中不断探索,完善平台功能、丰富数据内容,让数据、技术和用户需求紧密结合,让大数据更好地服务于出版单位和用户。

  参考文献:

  [1]李晓明.浅谈大数据在出版业的应用[J].今传媒,2016(9):171-172.

  [2]光明网.出版业“大数据”时代已来临[EB/OL].(2016-12-12)[2020-08-10].https://www.sohu.com/a/121288704_162758.

  [3]江波,王鄂生,孙巍.面向大数据知识服务的数字资源聚合与行业数字内容运营平台建设路径分析[J].科技与出版,2016(12):80-83.

国家广播电视总局 | 湖北省人民政府 | 中国邮政集团公司 | 武汉市人民政府 | 中国期刊协会 | 中国图书进出口(集团)总公司 | 中国邮政集团公司报刊发行局 | 湖北省广播电视局 | 湖北日报传媒集团 | 长江广电传媒集团 | 长江日报报业集团 | 知音传媒集团 | | 湖北中图长江文化传媒有限公司 | 决策信息网 | 湖北新闻出版广电传媒周

copyright(c) 2013 湖北省新闻出版局 版权所有 技术支持

鄂ICP备19004605号-4  鄂公网安备 42010602004016号