业内信息

浅谈大数据技术在图书出版中的应用

2020-09-30 来源:《科技传播》
  【作 者】朱建丽:华中科技大学出版社

  【摘 要】大数据技术已经渗透到了各行各业。文章从大数据的概念、大数据技术在图书出版方面的应用到大数据技术在图书出版中的问题进行了阐述,以期在大数据技术的推动下,促进图书出版的进一步发展。

  【关键词】大数据技术;图书出版;数字化

  1 大数据的概念

  2012年,美国政府发布的《大数据研发倡议》使得大数据(Big Data)成为研究热点。最初,大数据的概念是指需要处理的信息量过大,己经超过了一般计算机在处理数据时所能使用的内存量[1]。大数据技术是指对大数据的收集、分析、使用的相关技术,大数据技术日渐成为炙手可热的技术。从大数据的生命周期来看,大数据技术包含大数据采集、大数据预处理、大数据存储、大数据分析,共同组成了大数据生命周期里最核心的技术。其中,大数据采集包括数据库采集、网络数据采集、文件采集;大数据预处理包括数据清理、数据集成、数据转换、数据规约;大数据存储包括基于MPP架构的新型数据库集群、基于Hadoop的技术扩展和封装、大数据一体机;大数据挖掘包括可视化分析、数据挖掘算法、预测性分析、语义引擎、数据质量管理。

  2 大数据技术在图书出版方而的应用

  2.1 在选题策划方而的应用

  选题策划是编辑工作的基础,是编辑工作的首要环节,也是编辑工作的依据。大数据技术可以帮助出版社对大量数据进行分类、分析,这些信息包括国家有关政策和专业领域有关政策、媒体信息、教育信息、作译者信息、同类产品的市场信息[2]。大数据技术为编辑提供可靠的数据分析,使得编辑在组稿等环节更具针对性,从而达到精准策划的目的,如利用数据挖掘等技术,全面、快速、准确地采集信息;利用语义网络图等技术在同类选题中进行优劣分析;利用聚类分析来寻找合适的作者。

  2.2 在图书生产方而的应用

  1)编辑加工

  编辑加工的内容包括消灭差错,润饰提高,规范统一,核对引文,查对资料,校订译文,推敲标题,撰写和规范辅文等。(1)体例的检查,如稿件的大纲结构检查,图序、表序、公式序号等序号检查,标点、符号检查,千分位检查,全半角检查,单位间隙检查等,此类检查可以帮助编辑在预审阶段处理稿件,以节省编辑的时间;(2)内容方面的检查,如上下文查重,易错词检查,敏感词检查,异体字检查,繁体字检查、不规范名词检查,历史纪年检查,领导人检查等,此检查可以帮助编辑在审稿阶段把关稿件质量。上下文查重举例如图1所示。



图1 上下文查重举例

  由图1可知,通过对全书的检查,发现了几处重复的段落。特别是,当重复段落页码相距比较远的时,容易被编辑和作者忽视。

  敏感词检查举例如图2所示。



图2 敏感词检查举例

  由图2可知,通过对敏感词检查这个功能,实现了在党政制度、领土主权、港澳台问题、民族、宗教、历史敏感事件、外交政策、国际关系等方面的检查,有效地帮助编辑避免政治上的“触雷”。

  2)生产数量的确定

  过高的图书库存一直都是困扰编辑的大问题。传统的模式下图书生产数量由编辑进行估计,这取决于编辑的经验;如果估计过于保守,会造成反复小批量的重印。而导致成本的提高;如果估计过于激进,超出销售的部分就转化为库存,库存就会增加,同样也会导致成本的提高。通过对大数据技术的应用,分析同类图书销售数据、图书作者受欢迎程度、图书选题在市场关注程度等,可以更准确地预测图书生产数量[3]。

  3)定价的确定

  图书定价的高低是消费者选择购买图书时考虑的重要因素之一。图书价格的制定,受成本、利润、生产数量、市场需求、同类图书价格状况、消费者心理和品牌等因素的影响。应用大数据技术,分析同类图书价格状况、消费者心理等影响因素,来更好地定价,以达到销售目标、品牌目标、利润目标。

  2.3 在营销推广方而的应用

  传统营销模式下,很难吸引读者的注意力,也缺乏针对性,营销效率不高。大数据技术的应用,给图书营销带来新的营销技术、手段和营销创新的实现路径[4],使得图书营销的精准化、网络化、全过程化成为可能,并实现了图书出版业务的低成本和高效益[5],从而达到精准营销的目的。例如,通过对男性用户进行大数据页面的营销推广,使得《大卫•贝克汉姆》一书取得了很好的销售业绩,这为传统营销模式开拓了新思路[6]。

  2.4 在图书发行平台建设的应用

  目前,我国尚缺乏全国性图书发行平台,这就导致了长期存在图书销售数据不明的情况。如果想获得相关图书的销售数据,必须依赖发行人员在某个地区的部分销售数据,这将花费大量的人力、物力和时间。民营出版社“经典文化,基于大数据技术,建立了“私有云”平台,以改变图书销售信息不明的现状。该平台的建立,不仅有助于出版社全面了解图书销售信息,而且还能帮助其更加准确地预测图书市场需求[7]。

  2.5 在数字出版方而的应用

  为推动数字出版的快速、健康发展,大数据时代,如何将大数据技术应用到数字出版中》?刘鲲翔等人[8]提出利用大数据技术在数字出版中实现精准策划、精准营销、优化研发和生产过程、评估用户体验和产品效果,并且大数据技术应用于数字教育模式的研究中,从而为老师和学生提供个性化的数字教育服务。

  3 大数据技术在图书出版中遇到的问题

  目前,大数据技术在图书出版中尚有一些局限性[3],具体如下。

  1)在全国尚未形成一体化的大数据出版中心,即各个出版社之间存在数据壁垒现象,基于此现状,可以采用小数据的处理方式。

  2)部分专业图书,由于其数字化程度不高及其超前性,限制了大数据在此领域图书出版的应用。

  3)国家推出的《GB/T 30330-2013中国出版物在线信息交换图书产品信息格式规范》等标准虽然推动了大数据的采集、存储、分析和应用等工作,但在数据服务平台、数据分析、数据应用等产品和服务的标准尚未建立,这些限制了大数据技术在图书出版的应用。

  4)若要实现大数据技术在图书出版中的应用,必须有懂得大数据技术方面的人才,而这方面的人才在图书出版行业目前还是比较匾乏的。

  4 结论

  大数据技术的应用在图书出版行业的地位越来越重要,图书编辑要改变细想,拓展视野,突破传统图书出版的局限性,充分利用大数据技术,促进图书出版的进一步发展。

  参考文献

  [1]维克托•迈尔-舍恩伯格,肯尼思•库克耶.大数据时代[M].盛扬燕,周涛,译.杭州;浙江人民出版社,2013.

  [2]曾文,徐红姣,牟尧,等.基于图书出版行业大数据的选题决策分析研究[J].情报学报.2018, 8 (37):813-821.

  [3]孙晓歌.浅谈大数据在图书出版中的应用[J].中国编辑,2017 (5):54-58.

  [4]李琳.大数据视域下国内图书出版研究综述[J].中国出版, 2016 (16 ):61-63.

  [5]张特.大数据背景下图书营销模式研完[J].新闻研究导刊,2016, 7 (12):284.

  [6]单迪.大数据在图书出版中的应用探究[J].传播力研究,2017, 1 (11):170-171.

  [7]刘银娣.数据驱动出版:基于大数据的传统出版模式变革研究[J].中国出版,2014 (15):42-45.

  [8]刘鲲翔,杜丽娟,丁雪.大数据技术在数字出版中的应用前景展望[J].出版发行研究,20130. 2013 (4):9-11

国家广播电视总局 | 湖北省人民政府 | 中国邮政集团公司 | 武汉市人民政府 | 中国期刊协会 | 中国图书进出口(集团)总公司 | 中国邮政集团公司报刊发行局 | 湖北省广播电视局 | 湖北日报传媒集团 | 长江广电传媒集团 | 长江日报报业集团 | 知音传媒集团 | | 湖北中图长江文化传媒有限公司 | 决策信息网 | 湖北新闻出版广电传媒周

copyright(c) 2013 湖北省新闻出版局 版权所有 技术支持

鄂ICP备19004605号-4  鄂公网安备 42010602004016号