【作 者】刘雅轩:《新型工业化》杂志社
【摘 要】大数据技术的发展与应用对诸多传统产业产生颠覆性的影响,也成为出版业发展的必然选择。数字化出版、跨媒体出版以及绿色出版是当前出版产业转型的三大趋势,但这三类发展趋势均离不开大数据技术的支持。一方面,大数据技术为出版业发展提供必要的技术支持;另一方面,当前政策环境与数据环境也为大数据技术在出版产业中的运用提供良好条件。因此,出版企业应积极利用这一技术,促进本产业的信息化发展。
【关键词】大数据;出版产业;信息化;技术应用;产业发展
当前,政府对大数据技术的重视与支持力度不断加大,互联网与社交媒体的发展也为大数据技术的发展提供了便捷条件,外部环境和技术条件的变化促使出版产业信息化发展进入全新的发展阶段。与此同时,出版产业也面临着全媒体时代到来的挑战。面对发展中的优势与不足,如何运用大数据促进出版产业信息化转型与发展已成为亟待解决的问题。
1 大数据技术对出版产业的意义
大数据技术为出版产业的发展创造机遇,为数字化出版、跨媒体出版、绿色出版提供必要支撑。大数据技术对出版业的价值和意义主要表现在以下两个方面。
1.1 大数据技术是出版产业未来发展的必然选择
数字化出版、跨媒体出版、绿色出版是出版产业未来发展的三大主要方向,它们的实现都必然建立在大数据技术应用的基础上。
1.1.1 数字化出版离不开大数据技术
一方面,数字化出版不仅是将纸质书转变为电子书,更涉及出版流程数字化、出版物数字化、信息服务数字化等多个方面。其中,仅出版流程数字化一个方面就包括出版物编排制作所使用的数字编撰平台、出版物销售所使用的网络销售平台、收集用户信息与购买记录的网络数据平台等,这些数字化平台是数字化出版流程流转必不可少的基础条件。同样,大量的数字化出版物和数字化信息服务也必须依靠基于大数据技术的数字化平台进行管理和运营。
另一方面,数字化出版过程中将产生大量的出版数据,如编排制作环节的文档修改记录、生产时间记录,销售环节的销售记录、物流记录,读者反馈环节的评价文本[1]、出版企业的自有媒体数据(如网站、微博、微信公众号)等。数据类型也更加复杂多样,如:关系型结构化数据、网页等半结构化数据、图文等非结构化数据。数据的海量化和类型的复杂化,传统技术难以进行有效和及时处理。要确保数据处理的高时效性与高质量,出版产业必须依靠大数据技术才能实现。
1.1.2 跨媒体出版离不开大数据技术
进入全媒体时代,网络阅读终端设备(如手机、平板电脑、电子阅读器等)的普及极大地丰富了读者的阅读途径,改变着读者的阅读习惯。很多读者倾向于使用手机阅读文字信息,使用平板电脑阅读图片信息和视频信息[2]。因此,出版企业需要将出版内容进行快速拆分与整合,结合读者的阅读习惯,通过不同的阅读终端推送给读者。这个过程需要处理大量数据,以及实现文字、图片、音频、视频等不同数据类型之间的数据融合。同时,也自然而然产生读者的个性化服务问题。出版产业必须借助大数据技术针对不同的阅读终端进行出版物的差异化开发,并给读者提供个性化的信息服务。个性化的跨媒体出版是出版产业重要的发展趋势,也是出版产业大数据应用重要领域。
1.1.3 绿色出版离不开大数据技术
绿色出版是指出版物生产过程与生产工艺的绿色化,例如使用可再生纸张、环保型油墨与喷印技术,主要表现为按需出版,即按照客户使用需求将出版内容印刷成出版物[3]。按需出版的“需”包括两个方面:一是对出版物数量的需求,做到一册可印、即印即销,有效缓解传统出版业库存量大的困境;二是对出版物内容的需求,做到个性化出版与定制化出版,有效解决不确定销量书籍(如小众图书、自费出版图书等)的出版问题[4]。要实现绿色出版,就必须运用大数据技术对市场进行精确的分析,对出版流程进行精确的控制,给读者提供精准的定制化服务。因此,绿色出版更离不开大数据技术。
1.2 大数据技术为出版业发展提供必要技术支持
从出版产业发展的角度来看,无论是对市场的科学预测、出版流程的细化,还是时间和成本的节约都离不开大数据技术的支持。
1.2.1 运用大数据技术科学预测市场行情
大数据技术能够根据目前出版市场的销售信息与反馈数据进行分析,对用户的需求做出预测。当前,运用大数据技术预测市场行情的出版策划主要包括3种。其一,运用大数据对目前图书市场作品进行前景分析,预测什么书会受到市场欢迎,选择出版与市场需求相符的书籍;其二,运用大数据技术对目前图书市场作品的作者、情节、故事背景等内容元素进行分析,预测出受读者欢迎的内容元素进行创作[5]。例如学术出版社的小说《39条线索》的出版模式;其三,以用户需求为基础,以大数据技术为支撑,创造出新的出版模式。例如,磨铁出版社以用户出资、投票的方式选出高支持度的内容进行出版。
1.2.2 运用大数据技术细化出版流程
在大数据技术的支持下,出版流程每个流程环节将发生根本性的变化:
1)选题策划。收集与整理出版企业内部与外部数据,通过大数据分析择优选择用户普遍关注、符合舆论发展趋势的话题[6]。其中,企业内部数据主要包括历史销售记录、出版物反馈信息以及相关专家的建议等,外部数据主要包括社会流行趋势、舆论热点话题等。
2)内容生产。综合当前出版市场的出版物属性数据(作者、故事情节、故事背景、角色类型等)与用户属性数据(职业、学历、阅读时长、阅读地点等),运用大数据技术进行分析,择优选择欢迎度较高的创作元素,促进出版内容的模式化发展。
3)编排制作。基于大数据技术,通过作者、读者、编辑、专家共同使用的协同编撰平台,实现四方实时沟通与交流,提升出版内容的完整性[7]。同时,利用大数据平台对生产过程实时监控,实现自动改正、高效高质的产品印刷,提升出版物外形的完整性。
4)市场销售。运用大数据技术对相关用户的人口属性(年龄、性别、文化程度等)、消费习惯、阅读习惯、地理位置等进行数据分析,自动生成个性化、智能化的市场销售方案[8]。并利用电子二维码、定位与导航等技术实现高效、精准、科学的出版物物流管理。
5)用户反馈。收集用户阅读数据、反馈信息以及微博、抖音、豆瓣、知乎、贴吧等社交平台上的用户评价,在此基础上运用大数据分析对出版物的内容、营销策略、出版服务等做出调整。
1.2.3 运用大数据技术降低时间与经济成本
大数据技术在数据与信息的处理上具有便捷、廉价、高效等一系列优点,能够极大地提升出版效率[9]。一方面,运用大数据技术缩短出版周期。例如,在编排制作环节中,利用大数据分析当前市场海量书籍的内容与设计风格关联性,能够在此基础上建立自动匹配系统,节约大量内容设计时间。另一方面,利用大数据技术筛选出不必要的出版环节,简化和重组出版流程,如建立云出版平台,最大限度地降低时间与经济成本。
总之,数字化出版、跨媒体出版、绿色出版等多种新型出版方式都离不开大数据技术。同时,大数据技术在预测市场行情、细化出版流程、缩减时间与经济成本等方面都具有显著的应用价值,对当前出版产业发展意义重大。
2 大数据背景下出版产业发展的环境分析
当前已经形成了出版产业大数据技术应用的有利环境:政府对大数据技术的政策支持力度持续提升;社交媒体、电子商务的发展为出版业提供海量数据;数据交易市场呈现逐渐繁荣局面。这些有利环境的形成对出版产业发展意义重大。
2.1 大数据政策支持力度持续提升
自2012年起,一大批与大数据技术相关的项目在科技部、工信部等政府部门的支持下顺利实施。2014年《政府工作报告》将大数据技术的发展上升到政府经济工作的重点。2017年工信部编制印发《大数据产业发展规划(2016—2020年)》,该规划预计至2020年基本形成“技术先进、应用繁荣、保障有力的大数据产业体系,”为加快建设“数据强国”提供强大产业支撑。除国家外,各地方政府也相继出台推动大数据技术发展的方案与计划[10]。例如,福建省于2016年出台的《关于印发福建省促进大数据发展实施方案(2016—2020年)》、河北省2018年印发的《河北省大数据产业创新发展三年行动计划(2018—2020年)》等。可见,不管是国家层面还是地方层面都在不断提升对大数据技术的支持力度。
2.2 社交媒体、电子商务的发展为出版产业提供海量数据
目前,社交媒体主要包括六类:网络论坛(天涯社区、百度贴吧等)、社交网络平台(人人网、开心网等)、社群网站(豆瓣、时光网等)、博客(微博、公众号等)、即时通讯软件(微信、QQ等)、垂直社交媒体(小恩爱、ZANK)。这些社交媒体时刻都在生产海量数据信息。对于出版业来说,社交媒体可以提供用户数据,预测潜在用户,获得原创性出版资源,同时也是社会化营销的重要途径。
截至2018年12月,我国网购用户数量达到6.10亿,其中手机网购用户占比72.5%,仅当当网2019上半年的图书销量就已超过2亿册[11]。电子商务的飞速发展能够为出版业提供用户交易记录(购买时间、购买数量、商品类型、交易金额等),出版企业可以通过交易记录了解图书市场静态信息,针对不同类型用户的偏好与阅读习惯制定多元化的营销方案。
2.3 数据交易市场逐渐繁荣
数据共享与数据交易是出版企业获得外部数据的主要方式,它们的繁荣发展将有利于出版产业的发展。现在,国外数据交易市场已发展成熟,且具有一定规模,例如:微软公司的Azure Data Marketplace。2014年6月,我国首家数据交易平台“中关村树海大数据交易服务平台”正式上线,为用户提供标准化数据交易服务。其后,抓手数据交易平台、国信优易数据交易平台、路孚特数据交易平台等纷纷上线,数据交易市场的繁荣为出版产业的信息化发展提供有利的数据环境[12]。数据交易市场的繁荣为出版产业充分利用大数据资源创造了条件。
总之,政策、社会环境、数据交易市场等方面为基于大数据的现代出版产业发展创造了良好的外部发展条件。
3 大数据背景下出版产业发展的策略探讨
在有利的外部环境条件下,出版产业企业应抓住机遇,积极利用大数据技术,加速实现传统出版产业向基于大数据的现代出版产业转型升级。为此,本文提出以下3方面策略建议。
3.1 培养大数据意识
首先要有数据重要性和数据共享意识。“数据即资产”是大数据时代的核心理念,出版企业应当注重积累企业内部数据,并关注外部数据,对已获得数据进行及时储存、分析与利用。同时,注重出版产业内部之间的数据共享,以有效避免相关数据在开发与利用上的同质化,消除出版产业的数据壁垒,提升企业协同发展能力[13]。
大数据意识还意味着出版思维的变化。传统的出版思维是产品主导的,一切思维起点都是做好产品。而大数据时代意味着一切从数据出发,实现数据驱动。无论是产品策划和开发、出版流程、用户信息服务都需要建立在数据分析的基础上,而不是既定的某一个具体产品。
3.2 转换用户观念
大数据时代以中心化、平等化与开放化的特点要求出版企业为用户提供多元化的产品与服务,实现消费者从“读者”到“用户”的转变。在传统产业形态中,读者是信息的被动接受者,处于信息流的最底层;而在大数据产业形态中,用户则是信息的创造者、提供者,处于信息流的源头[14]。从被动接受信息到主动创造信息、提供信息,这一转变要求出版企业以用户为中心,树立“用户至上”的可持续发展理念。
3.3 发展个性化出版服务
大数据技术为准确分析用户提供了可能,也为精准服务提供了可能。基于不同用户需求的差异化提供个性化选题和出版服务已经称为大数据时代出版产业发展的新方向,出版产业必须积极迎合这种新趋势。个性化出版服务即包括内容的个性化策划和个性化生产,也包括针对个人的信息服务。内容的个性化策划和个性化生产要求充分利用大数据技术挖掘不同用户的需要,根据用户需要进行按需内容策划和生产。同时,要把按需生产的内容精确传递给用户。在这个过程中,需要提供用户反馈的数据通道,建立从需求到生产再到服务闭环,满足大数据时代用户的个性化信息服务需求。在全媒体时代,这一变化不仅仅针对数字出版物,纸面出版物也要实现这一过程,这意味着出版企业内部的一系列出版业务流程的改变。
3.4 加强部门间的交叉协作或部门重构
大数据技术极大地扩大了出版企业数据部门的工作范围,从对出版物的电子化处理、运营数据的储存扩大至对出版流程的各个环节提供数据支持,线性的工作流程来时变成非线性的工作流程。这些新变化,就要求出版企业必须加强部门间的交叉协作或部门重构。在部门间的交叉协作方面:在内容策划环节,利用社会热点与用户偏好为编辑部门提供出版建议;在生产环节,利用市场预测数据为生产部门印刷数量的设置提供参考意见;在销售环节,利用对不同用户类别与偏好的分类为销售部门提供销售思路[15]。因此,出版企业应当积极促进编辑部门、销售部门与数据部门之间的交叉协作,强化各部门之间的横向交流与联系。当交叉协作难以解决问题,又不能充分利用大数据平台价值时,部门重构也可以是一个选择。部门重构就是彻底改变部门的传统功能定位,在大数据技术利用基础上,每个人以数据驱动开展工作,弱化传统部门的功能或合并部门,把内部结构功能与满足市场需要调整到同一方向。例如:美国的《纽约时报》等新闻出版集团以建立数字新闻部的方式将数据技术部门与内容编辑部门合二为一,以此实现大数据新闻出版。
3.5 构建基于大数据技术的新产业生态
在大数据技术发展背景下,出版产业与大数据需要紧密融合才能实现用户需求的满足,但出版产业企业不可能建立庞大的大数据技术队伍。这就需要出版产业必须以满足新时代用户个性化出版服务需求为导向,以出版产业和大数据产业紧密融合为依托,建立全新的出版产业生态。产业生态是全新的产业组织方式,实现相互依存,共生发展,是大数据时代各个产业普遍的发展方向,出版产业也不例外。通过借助生态的力量,弥补自身能力的不足,是出版产业发展的内在需要,也是应对大数据时代市场竞争的必然要求。
3.6 培养满足大数据时代需要的高水平出版人才
3.6.1 强化出版人员的大数据收集能力
在大数据时代,出版从业人员不仅需要熟练使用各类社交媒体,还须具备较高的数据收集能力。出版人员须从两个方面完成数据收集工作,即企业内部数据收集与企业外部数据收集。其中,企业内部数据收集渠道包括用户在企业网站的注册信息、各种出版内容的浏览量、企业媒体(微博、公众号等)的评论等。企业外部数据收集渠道包括本企业出版物在豆瓣、知乎、新浪读书等网站的评论与反馈等[16]。因此,出版人员须密切关注相关数据信息,主动整合优秀出版资源。例如豆瓣原创作家海棠创作的《我的朋友陈白露小姐》、丁小吉创作的《七天治愈拖延症》等优秀网络作品均被出版。
3.6.2 强化出版人员的大数据分析能力
大数据时代的出版企业依然具有传统出版形态的功能与作用,肩负着内容生产与信息服务的重任[17]。因此,对内容的把控、对文字的编辑、对图书的策划以及与作者及用户的沟通能力依然是大数据时代出版人员的重要技能。除此之外,大数据产业环境对出版人员提出了更高的要求,包括数据收集与分析的能力、数据可视化处理的能力、与数据专员交流的能力以及利用数据分析成果的能力等。因此,高校应当针对这一市场变化,在新闻出版专业开设数据分析与可视化处理课程。出版企业也应当为工作人员提供相关培训课程,以此培养出既懂数据又懂出版的高水平复合型人才[18]。
3.6.3 强化出版人员的基于大数据的创新能力
大数据时代出版产业发展不仅仅是现有业务的数字化,还意味着大量的模式创新、产品创新和服务创新,需要培养出版人员基于大数据技术的创新能力。而且,与传统出版业相对长期的稳定发展不同,出版产业与大数据技术的融合,需要适应大数据技术日新月异的新变化。例如:大数据与人工智能技术的融合、大数据与区块链的融合、大数据与5G技术的融合。这些新的融合将带来出版产业的新变化,如:智能写稿、智能出版、区块链出版物、虚拟现实内容服务等。这意味着不仅仅需要培养出版人员基于现状的创新能力,还要培养跟上时代发展的创新能力。
3.6.4 建立大数据时代高水平出版人才的培养机制
无论是现有的出版人员培养,还是对外来人才的引入,都需要一个长效的人才培养机制。通过人才培养机制来提供长期的制度保障,才能保障高水平出版人才自身的不断发展,从而才能保障出版企业能够应对大数据时代的挑战。
综上所述,大数据技术在出版领域的应用是我国由“出版大国”发展为“出版强国”的必经之路。在出版领域,大数据技术能够科学预测市场行情、细化出版流程、降低时间与经济成本,且数字化出版、跨媒体出版以及绿色出版均离不开大数据技术的应用与支持,大数据技术已经成为出版业发展的必然选择。基于此,出版产业企业应采取转变产业观念、转换用户观念、开展个性化出版服务、促进各部门的交叉协作或部门重构、培养高水平出版人才等策略,从而实现大数据技术在出版产业的有效应用,并推动出版产业的信息化发展。
参考文献:
[1]唐伽,时代出版传媒股份有限公司,大数据时代背景下出版产业应对教育信息化的思考——以安徽出版集团有限责任公司为例[J].出版科学,2015(4):45-49.
[2]尚策.大数据时代的数据拥有者——专业出版视角的数据类型与价值分析[J].科技与出版,2016(1):13-16.
[3]张振宇,周莉.“大数据出版”的理念、方法及发展路径[J].出版发行研究,2015(1):14-17.
[4]顾国达.研究数字经济下我国产业转型升级的创新之作——评新书《数字经济下中国产业转型升级研究》[J].国际经济合作,2019(3):156-158.
[5]李红祥,吴佳珅.数据技术、数据资产与数据价值——大数据时代传统出版业的三重变奏[J].科技与出版,2016(8):31-33.
[6]张新新.人工智能引领新闻出版转型升级——2018年数字出版盘点[J].科技与出版,2019(2):44-54.
[7]陶钼.北京国家数字出版基地和北京青年报社(集团)在京签订战略合作协议框架双方将共同建设数字出版行业大数据中心及数字产业创新创业服务平台[J].中国出版,2016(9):70.
[8]张月萍.出版生产、学术研究与出版业评价的“反转模式”——试论大数据时代出版业的新演变[J].出版发行研究,2015(3):38-41.
[9]王运平.大数据时代版权助推文化产业发展——第七届中国版权年会综述[J].中国出版,2014(23):22-23.
[10]杜贤.创新推动出版供给侧结构性改革——兼析人民卫生出版社有限公司的实践探索[J].科技与出版,2016(9):19-24.
[11]中商情报网:2018年中国网络购物用户规模数据分析:手机网络购物用户逼近6亿(图)[EB/OL].(2019-03-02).[2019-11-15].http://www.askci.com/news/chanye/20190302/1122161142605.shtml.
[12]吴鸣谦,孙守增,韩跃杰.大数据时代科技期刊编辑工作的变革与挑战[J].科技与出版,2014(10):17-20.
[13]朝乐门,马广惠,路海娟.我国大数据产业的特征分析与政策建议[J].情报理论与实践,2016,39(10):5-10.
[14]卢毅刚,LUYi-gang.大数据出版:“互联网+”逻辑下的渠道拓展与传播效能提升[J].编辑之友,2016(6):18-22.
[15]Xiaolan Guan,Menggang Li.Modelling of intelligent publishing cloud platform based on internet[C].2016 International Conference on Logistics,Informatics and Service Sciences(LISS).IEEE,2016.
[16]Suman Madan,Puneet Goswami.k-DDD Measure and MapReduce Based Anonymity Model for Secured Privacy-Preserving Big Data Publishing[J].International Journal of Uncertainty Fuzziness and Knowledge-Based Systems,2019,27(12).
[17]Mason PH.The Ethics of Biomedical Big Data:Brent Daniel Mittelstadt and Luciano Floridi,eds.2016,Springer International Publishing(Cham,Switzerland,978-3-319-33523-0,480pp.)[J].2017,14(04):571.
[18]ZHANG Lin,LIU Yan,WANG Ru-chuan.Location publishing technology based on differential privacy-preserving for big data services[J].Journal on Communications,2016(06):1128.