【作 者】杨扬:清华大学社会科学学院;张学岑:清华大学新闻与传播学院
【摘 要】大数据对出版行业具有颠覆性影响,推动着出版业进入智能化的经营阶段,不仅提高了运作效率,提升了服务质量,同时也开创了新的出版范式,创造了新的商业机会。文章以西方出版业推出的创新模式为例,分析了大数据对传统出版行业带来的影响,机器算法的产生不仅让出版商对读者偏好有了更深入的认知,也推动着出版社在事务决策、管理规则和服务理念等各层面不断求新求变,以新思维培育新业态,用新业态推动新发展。
【关键词】大数据;出版产业;商业模式;精准营销
对国际出版业来说,大数据能为业态发展提供数据分析、数据咨询等服务,通过采集、分析和处理图书在编辑、出版、发行、阅读等环节产生的数据,不仅可以帮助出版社改善服务的细节和质量,为读者创造更优质的阅读体验,还能够驱动生产方式和管理模式的变革,创造新的经营业态。目前,国际出版商纷纷加快大数据与企业经营的融合,强化决策与管理服务的科学性和前瞻性,提高图书出版与运营环节的灵敏度和精准度,助力出版行业再上新台阶。
一、新引擎:大数据对出版产业的改造及影响
数字技术与媒体传播的融合影响了出版行业的发展,出版内容越来越多地进入在线平台,随着计算机算法的兴起,数据分析和云计算等技术可以对出版业的数据进行深入挖掘,由此,收集用户数据开始成为可能。国际五大电子书零售商平台——亚马逊(Kindle )、苹果(iBooks)、巴诺书店(Nook)、谷歌(Google Play Books)和Kobo都在采集并分析读者数据以了解受众的消费习惯与阅读倾向,尝试通过了解读者数据为出版商带来更好的内容建议,提升出版公司的选品质量和运营效率,为出版业的发展和转型提供良好的借鉴。
1.总结用户阅读习惯,帮助出版商了解读者群
阅读是读者与文字间的亲密交流,更倾向于是一种孤独的个体探索行为,但随着数字出版产业和社交媒体的兴起,电子书已被越来越多的读者接受并喜爱,推动着阅读方式开始发生变化。电子阅读具有互动性和可衡量性,一方面,通过销售数据和评论,商家可以掌握图书市场的趋势和规律,及时发现市场增长点,更加深入地洞察出版内容的定位是否准确;另一方面,电子阅读器及内容平台均设有数据跟踪点,商家可全面了解读者用户的阅读行为、打开应用程序的次数、阅读时间,以及对图书哪部分内容更感兴趣。
巴诺书店( Barnes & Nook)通过电子阅读器Nook收集的客户阅读行为数据可知读者的阅读速度及读者如何与图书互动,该研究表明,在阅读非小说类作品时,读者往往采用的是不连贯式的阅读方式;而面对小说,读者通常不会拖泥带水,而是会选择快速阅读法;在品读长篇非小说类图书时,读者往往兴趣不高,会提前结束阅读活动并删除电子书。科幻题材、浪漫题材和犯罪题材的小说迷在阅读速度和阅读数量方面都远胜纯文学小说的读者,并且他们能够坚持读完书中的大部分内容。相比之下,文学小说的读者经常会“半途而废”,而且往往会在阅读中跳过图书的某些章节。目前,巴诺书店已将他们的这些发现与出版商进行了分享,以引导出版商不断增进对读者群的了解,促进出版商积极提升选题策划能力和读者服务水平,将更多的好书带到读者面前。
2.归纳作品文本特征,为出版商提供预测指南
在大数据时代,“畅销书测量仪”(bestsellerorneter )绝不是虚构之物,朱蒂•亚契(Jodie Archer)和马修•贾克斯(Matthew L. Jockers)共同写作了《畅销书密码:人工智慧带我们重新理解小说创作》(The Bestseller Code: Anatomy of the Blockbuster Novel ),通过查询过去30年出版的近两万本的小说并综合数千台计算机的数据处理能力,总结归纳出畅销小说的特点。
在计算机模型的归纳与演绎下,“畅销书量表”主要体现在四个方面:题材组合、情绪转折、文字风格与人物塑造。在题材组合上,现实主义题材比奇幻题材更易获得读者青睐,作者在撰写小说时要注意安排题材间的比例,尽量不要在一本书内塞入过多不同的题材,题材比重集中控制在两三个重点最为合适,其中性、毒品和摇滚乐等主题并不受读者欢迎。情绪转折密集度要高,其中要诀是情绪起伏要够强烈、够频繁,才能吸引读者的关注并牵动其情绪反应,牢牢抓住读者的焦点;三幕剧架构最为符合人脑工学的架构,作者要尽量控制好每一幕间的节奏。用计算机模型量化绘制畅销小说《五十度灰》和《达文西密码》可以发现,小说中的情绪转折频率极高。文字风格的成功秘密在于加强文字和语法的锤炼,能够用简单明了的叙述方式制造冲突与意外,让人能够很快地进入小说的艺术世界。关于角色人物,果断、自信、勇敢等都是读者喜爱的性格特征,主人公一般都是勇于采取行动改变自己命运的积极者,如近年来流行的“黑暗家庭”女孩,她们并不是被动地接受命运的安排,而是能够以自已的能力主动影响世界。
信息技术让研究者可以对多种写作特征进行分析,从文本当中挖掘出前所未见的深入洞见,在数据的基础上总结归纳出畅销作品的文本特征,未来可以更加理性地透视出热门书和冷门书之间的差异。作家在创作小说时可以借鉴这一标准,以提高作品的艺术性和感染力;而出版社在挑选小说时也可以根据这些要点了解大众的接受程度和阅读偏好,找出下一本热门小说。
3.提供用户反馈数据,引导作家改善作品
电子阅读器收集的数据能够为作家的创作提供参考,出版商可以向作家反馈读者的阅读信息以改善作家的写作状态。随着社会的主导思路从“作者中心”向“读者中心”转向,学界越来越重视读者在阅读过程中的感触和反应,接受美学理论学家沃夫尔冈•伊瑟尔(Wolfang Iser)和汉斯•罗伯特•姚斯(Hans Robert Jauss)高度强调读者在作品欣赏中的地位,认为“文本与读者的相会”使文学作品真正产生意义,而作家与读者的关系是一种不稳定的合作关系,为强化两者关系的确定性和持续性,作家可以选择通过数据化的信息了解读者喜好,再调整写作风格或是修订文字以提高读者的阅读兴趣。
事实上,数据时代让作家的工作开始变得具有“可发现性”,电子阅读器能够帮助作家洞察读者的阅读深度和速度,跟踪读者了解其停止阅读的具体章节,而书商甚至会根据作品的阅读成效评定销售业绩并为作家计算稿酬,如果一本书的阅读效果欠佳,那作家损失的就不只是潜在的读者,还有经济收益。如亚马逊会根据Kindle Unlunited提供的数据或是更精确的模型为作家计算报酬,如果读者在读完书的第二章就草草结束了阅读活动,那么一本标价为2.99美元的电子书就只能卖到15美分,而作家仅能得到5美分的分成。大数据为作家与读者的关系提供了反馈机制,工程师将读者数据发送给作者,这引导着作家随时留意读者偏好以修正写作计划、调整故事情节,根据市场信息不断完善作品创作,让图书更能迎合广大读者的阅读喜好。
大数据技术能够帮助出版商调整产品内容,充分激发出作者与读者合作的积极性,未来,图书将更具互动性和个性化,甚至会允许读者决定人物和剧情走向。其中值得一提的是,Coliloquy公司研发出“动态小说”( Active Fiction )模式,其在专有数据平台上通过复杂的算法设计出不同的叙事路径,允许读者选择或自定义情节线条,目前该公司已签约了一些驻站作家为其专门创作小说,小说的主题包括浪漫、非虚构、青年幻想等题材,这些作家从不同视角撰写同一内容,为每本书创作多重情节,让读者自行投票决定人物角色、故事线索和情节发展。目前,Cohloquy模式已初步获得市场认可,90%购买Coliloquy图书的读者会读完,其中67%的读者甚至会重复阅读同一书籍。电子阅读器和移动设备的普及强化读者和作者的互动力度,在“民意”的基础上促进了信息的传播和流动,经过数据的分析和整合,作家可以根据读者的期待调整故事走向,使作品更趋完善、更具艺术感染力。
二、新业态:大数据催生“读者导向”的出版创新模式
在传统模式下,出版过程较多依靠编辑的学识、经验和直觉,而大数据技术则直接改变了图书出版的过程,其能够大规模地跟踪读者的行为,用人工智能分析读者的阅读模式并预测热门作品畅销书,根据读者阅读偏好来选择并出版文学作品,帮助出版机构做出更智能、更科学的决策。
1.为读者创造:利用大数据发现市场空白点
为避免直接面对强大的竞争对手,一些中小出版商会刻意瞄准特定的细分顾客群,通过建立一个专属的小市场,在激烈的市场竞争中获得生存,以更加专业化的经营获取最大限度的收益,这就是所说的利基(niche)策略。对企业来说,如果能够通过数据分析发现一些竞争对手尚未准备充分且竞争力较弱的细分市场,适时提供令消费者满意的产品或服务,就可以在强大的市场夹缝中寻获自己的出路。目前,“大数据+利基市场”的运营模式已在国际出版市场陆续出现,大数据提供的分析结果有利于企业洞察市场趋势,能够引导企业采取“短、平、快”的行动迅速进入市场,不仅有助于培养出一群忠诚的顾客,同时还可以通过较低的成本维持企业的经营活动。
美国Callisto传媒公司于2011年成立,其特色在于通过专属算法寻找市场需求旺盛但还没有相关图书问世的空白点,再根据算法提供的建议邀请合适的作者撰写相关主题的书籍。Callisto传媒公司每月大概会采集到六千万条的读者数据,经营者会通过搜索引擎查询相关产品,一旦发现某一出版主题处于空白领域,便会立刻启动撰写计划,用最快的速度完成图书作品并将其推向市场。Callisto传媒公司并不关注规模化产制的大众市场,也不期待作品间世能够造成轰动的市场效果,它的关注点仅仅在于利基市场,其市场特点是相对狭小但极为明确,且顾客拥有极高的忠诚度,会持续关往并购买出版社推出的系列读物。目前,在读者搜索数据基础上完成内容定制化出版已成趋势,市场空间被区隔成众多微小的局部,在这些专业化的领域里,Callisto传媒公司比竞争对手拥有更强大的优势,加之产品经营活动具有利润高、增长快、核心竞争力强等特点,因此常常仅仅卖到1500本就可以迅速盈利。
2.对读者赋权:依托大数据重构选编模式
传统的编辑筛选体制在效率上已远远无法适应时代需求,大数据生态充分发动读者的力量参与作品产制,并提供了一种全新的书籍生产机制和社群互动方式,“传统出版中选题信息的采集依赖于编辑的信息搜集和经验判断,充斥着诸多不确定性;大数据时代,选题策划从完全的经验决策模式逐步趋向数据与经验结合判断模式”,大数据让出版物的内容形态、消费方式和产业链条等都被重构,而在多元关系的流动和交互中,它们又重构了内容本身。
在线出版平台“Inkitt”于2015年在德国柏林成立,号称全球第一个数据驱动型(data-driven)、以读者为本(reader-powered)的出版代理商。该平台于2016年开始涉及图书出版业务,目前拥有45000名以上的在线作家,读者达到100万人以上。Inkitt既是一个在线创作、阅读和分享社区,同时也是一家出版社。作为一个作品分享平台,作家可以在Inkitt和网友分享自己的作品,而且还能够看到读者的评论和建议。作为一家出版社,Inkitt将编选图书的工作交由机器处理,通过精细化的数据管理监控读者的行为,以发现潜在的好作品——前者为后者提供图书资源,后者为前者争取出版机会。
Inkitt平台能够从更多维度监控读者的阅读行为,帮助平台做出客观决策。读者需要通过个人的谷歌账户、脸书账户或是邮件地址认证才能登录Inkitt平台,因此Inkitt可以运用社交媒体平台上用户的注册信息对读者进行精准分析,同时在平台所实施的人工智能算法的协助下,Inkitt能够总结出读者的阅读模式等信息,其数值基准是读者在每个作品上的停留概率和停留时间——如果读者彻夜读完某本书,那表明他对这个作品的评价较高,而如果是时断时续地阅读,那通常暗示出读者不太喜欢这一作品。根据这些监测结果,Inkitt的工作人员会立刻进行营销支援,将深受读者喜爱的书籍印制后送往亚马逊平台进行销售。
传统的出版社主要依靠编辑的个人审美和经验选择畅销书,而Inkitt则建立了一套发现畅销书的算法系统,将数据和在线服务做了嫁接与勾连,在这个算法的协助下。Inkitt共出版了37本书。其中20本获得了亚马逊的最高排名,成功概率达到了65%。值得一提的是,Inkitt的读者在某种程度上可以被视为网站的共同作者或编辑,读者在阅读作品时可以向作者提出修改建议——或是着眼于故事情节的整体发展趋势,或是微观地修订具体章节、段落和句子,而这些建议都会在出版时被作者选择性地采纳。
大数据展现出了前所未有的数据处理能力,出版社在挑选出版物时不再过多依赖编辑的主观经验,而是将选书的权力交由读者,根据读者的阅读数据选择具有市场前景的图书,这不仅回避了主观要素的介入,最大限度地减少了出版市场的风险,同时也促进了数据在出版业转型中的优化作用,有效提升了出版社的创新效率。
3.向读者推荐:基于大数据创建精准营销
大数据为图书的流通和销售提供了精准营销的可能。在大数据应用之前,出版社为获知读者的阅读喜好,多采取抽样调查的方式,而大数据通过对数据的计算及分析能够更科学、更有效地呈现读者的兴趣或是市场的动态,协助商家更好地进行营销推广活动,如大数据可以总结出特定地区读者的阅读喜好与习惯、哪些书籍放在一起容易捆绑销售等信息。通过对这些信息进行收集、加工和整理,可以得出有意义的统计规律,为营销策略的调整提供参考和依据。
大数据能够跟踪挖掘用户对特定主题图书的阅读频率、翻阅习惯以及访问次数等,通过人工智能分析和过滤机制对信息进行深度智能分析,定位用户个性化、动态化的需求,向不同的用户进行定向的新书推荐,让营销活动更富有针对性。
2002年以后,亚马逊就基本实现了首页自动化推荐,基于用户的购买历史和浏览记录,亚马逊可以为读者进行购买推荐;在2013年收购Goodread,之后,亚马逊又将约2500万用户的社交网络服务整合到Kindle部分功能中,由于Kindle读者可以在阅读中标记某些单词及注释,并与他人分享,亚马逊会定期查看Kindle中读者标记的单词以确定读者的阅读兴趣,然后再根据标记结果向读者发送新书推荐的邮件。Kobo通过机器学习为用户提出个性化建议,在创建推荐列表时,Kobo参考多个数据点,除基本的购买意向外,还有电子书内容、图书作者和流派、书籍的流行度、用户评级和发布日期等信息。根据这些信息,Kobo为用户创建兴趣权重,如用户可能对科幻小说和传记都感兴趣,但如果他阅读的最后几本书是科幻小说,那么推荐系统将会为科幻小说分配更高的推荐分值。用户会接收到更多关于科幻书籍的推荐建议。
此外,Kobo开发的现代推荐系统具有实时性,能够根据最相关的实时数据滚动性地向读者提供建议,因此客户在不同时间段看到的信息内容可能完全不同。大数据帮助出版商建立了以数据为驱动的营销范式,基于数据分析结果确定图书的营销策略,塑造出数字出版营销的创新模式,不仅让出版商能够实现更高的营销费用转化率,也推动着出版机制、营销思维和经营业务在发展中不断求新求变,探索出了一系列形式多样的新型发展模式。
三、新机制:大数据助力出版业实现结构化转变
数字出版环境带来的益处是显而易见的,“打破了专业生产的垄断性,数据开放让网络用户之间存在了可共享的资源与信息,在让更多人受益的同时也使得知识得以更广泛地传播”,当下,大数据又增加了经济的共享程度和联结程度,引导出版社在事务决策、管理规则和服务理念等各层面都产生一系列革新式的变化,智能化、网络化、实时化、精细化等开始成为现代出版业的运行法则,既保证了商业经济的规模效应,又能够满足多样化的顾客需求。
1.出版决策机制再造——公平、客观
目前,不少出版商已开始通过科学的数据为其业务决策提供信息,大数据采集了社会需求和反馈信息,能够为出版业提供科学、准确、系统化的参考依据,推动出版工作更具备公平性与客观性。在传统选书环节,编辑往往处于主导地位,决定了哪些书籍能够最终出版问世,但编辑大都具有一定的主观性,在选择书籍时会拘泥于固定的思维模式,仅仅关注“名家力作”,选择一些在创作圈中知名度高、影响力大的作家的新作品进行出版,希冀其能带来较大的商业利益;相比之下,挖掘和培养文坛新秀的工作不仅辛苦而且经济效益不明显,大部分出版商都不愿意去试水,因此一些新手的优秀作品常常会被忽视。
但大数据有望改变这一局面,数据驱动让出版公司采取统计资料进行市场监测,书籍的筛选过程变成一种技术行为,可以屏除主观选择的限制。为此,一些市场前景不明、创作刚刚起步的新作者和新作品有望在大数据的遴选中脱颖而出,这不仅有利于发掘和培养文学新人,也减少了出版社在推行新作品时面临的市场风险。出版社根据读者的反应选择出版物,这种挑选机制更为公平,打破了少数人统治出版业的局面,每一位作者都能够获得公正平等的出版契机,出版市场也可以将更多的目光放到一些深受读者喜爱的潜力作家身上,这为新作家和新作品赢得了更多的成长空间。
2.出版事务管理再造——实时、高效
大数据能够帮助出版商根据市场变化做出判断和预测,引导出版商采取灵活的运营策略,这推动着出版事务管理过程的调整和改进,不仅要能够灵活应对外界的变化,而且还要让战略决策的制定与执行层面的运作形成良性循环,为可持续地产制创新型产品奠定基础。
传统的出版模式相对固定,有一整套相对完整的工作流程,计划阶段和执行过程中都会受到多方面束缚,耗时较长,无法适应快节奏的市场变化需求;而在大数据时代,出版商面临的任务生产批量小、作业频繁,因此需要对现有创新的管理模式进行调整,建立一支敏捷运营的专业团队,根据市场反馈快速产制产品,形成最有竞争力的创新型读物。如Callisto传媒公司通过专属算法寻觅市场空白点,一旦发现就立刻启动写作计算,邀请合适的作者严格根据大数据的分析结果建立图书框架,再按照固定的大纲在较短的时间内迅速推出,一般来讲,Callisto传媒公司从发现选题到新书上市,必须在九周内完成。大数据技术有效激发了企业的活力,提升了出版商的工作效率,推动出版社能够快速精准地把握需求变化,准确地掌握消费痛点,实时对公众诉求进行响应,用最快的速度打造出最符合创新需求的出版物。
3.出版服务机制再造——精准、全面
大数据使出版商比以往更容易收集客户信息,“对庞大的用户数据的分析和利用更利于将偶然性选题精准化,减少内容传递、投放过程中的随机性,更有助于准确判断读者市场及消费心理”,大数据能够为出版商提供预警信息,引导企业做好与客户的沟通工作,协助企业推出读者所需的解决方案,提升出版商为客户服务的质量,帮助企业快速赢得客户青睐。
巴诺书店会根据数据为Nook的读者挑选销售书目,当数据显示读者对长篇非小说类作品不太感兴趣时,出版商会及时推出应对策略提升读者对非小说类和长篇纪实类文学的热情;而当数据显示读者在阅读某些章节时会感到厌倦时,运营商便会在这些章节处加入一些视频、网页,或其他多媒体资料刺激读者感官,吸引其继续阅读;此外,如果多数读者买了系列丛书的前两册而没有继续订购第三册,运营商也司认这一举动中断定系列书籍的峰谷,从而和出版商、作者一起做出相应调整以防止丛书质量以及销售额的下滑。
对出版商而言,大数据技术还能够帮助出版商全面获取营销推广渠道数据,科学地评估营销效果,通过大数据分析,出版商可以得知哪类营销渠道对图书销售有促进作用、哪类渠道的推广效果最好、哪类读者对新书更感兴趣,这引导着出版商将有限的费用投入到准确的营销渠道中。
结语
当下,数据驱动是商业经济向前发展的核心,不仅改变了组织的生产方式和沟通方法,提升了行业的发展速度,缩短了产品的更新周期,同时也在影响着行业的发展架构和管理规则。大数据对出版业具有颠覆性影响,出版企业应在数字化转型过程中锻炼生产和服务能力,积极通过企业内部的变革,以及产业内的联合去促进数据的生成和采集,通过提升信息化水平和对数字资产的挖掘来创造大数据运用的条件。随着出版业进入智慧化的经营阶段,从业者还要不断调整思维模式,塑造新的出版模式,建立高效的运作机制,建构充分挖掘数据价值的生态体系,推动出版行业形成富有生命力和市场活力的发展新格局。