【作 者】赵树旺、付佳:河北大学新闻传播学院
【摘 要】人工智能正在不断改变着美国出版业的前景和结构。美国出版业应用人工智能进行内容分析与出版决策,尝试以人工智能进行内容创作,利用人工智能优化学术出版的评审与编辑过程,基于人工智能助力图书推荐与营销。同时,美国出版业致力于探索人工智能在非人化出版过程与情感元素两个维度的局限与突破。中国出版业应积极发展与构建人工智能的生态结构。
【关键词】人工智能;美国;出版业;应用
近几年,人工智能是全球出版界的爆炸性话题。在一些发达国家,将人工智能应用于岀版业已经有了一些突破性进展,出版大国美国更是如此。美国出版业对人工智能的应用已不止于查找错误,而是已经进入自动模仿人类思维能力的机器学习阶段,并在此基础上致力于挖掘互联网环境中的海量数据,使人工智能成为连接读者和作者的桥梁,拉近出版业和读者距离的工具。无论是企鹅兰登书屋、哈珀柯林斯、西蒙-舒斯特、麦克米伦、阿歇特等美国五大出版商,还是美国众多中小出版商和技术运营商,都在积极拥抱新时代的变革,充分开发和利用人工智能,丝毫不放过任何一个利用新技术提升图书出版决策和营销潜能的机会。这些都为中国出版业发展和应用人工智能带来一些启示。
一、人工智能在美国出版业中的应用
出版活动总是由出版决策、优秀的内容、正确的编辑与伟大的营销等四部分组成,基于此,通过智能化应用数据,人工智能正在对美国出版业的内容发现、内容创作、编辑过程、图书营销等四个领域产生深刻影响,进而不断改变着美国出版业的前景和结构。
1.助力内容分析与出版决策
对于出版业来说,确定读者需求总是一项艰巨的任务。在过去的四百年里,图书出版过程一直建立在编辑和出版经纪人的知识、经验和直觉认识之上,因为不可能大规模地追踪读者偏好。美国传统出版商和出版经纪人从数百万份书稿中筛选岀一小部分有价值的书稿,选择他们认为会与读者产生共鸣的小说,并最终确定哪些书稿有可能成为世界上最畅销的图书。然而,经验与直觉并非绝对可靠的,因其无法避免审稿过程中的偏见与误解,《哈利•波特》的第一本书就被拒绝了12次,《暮光之城》被拒绝了14次,斯蒂芬•金的《魔女嘉丽》在出版之前遭到了30次拒绝。由于行业专家的决定,有一些伟大的小说从未上过书架,也有许多作者在多次遭拒后放弃了写作追求。另一方面,因为图书选题的选定仅靠编辑和出版商来把关,具有明显的主观倾向,许多被编辑和出版商看好的图书,并不被读者和市场认可和接受,无法实现其市场价值,甚至最终沦为尘封的库存。出版商之所以一直在使用他们的直觉进行图书选择,只因为没有什么工具能做得更好。多年来,美国图书俱乐部的普及以及焦点小组的调查提供了洞察力和方向,但这些数据并不足以确定广泛的读者偏好。随着电子阅读器和在线阅读论坛的发展,一切都发生了变化。通过连接设备,最终可以大规模地跟踪读者行为并进行数据分析,这就允许出版业中的各方做出更明智的出版决策。现在的人工智能技术已能让那些潜在的畅销书不被忽视,数据充当了均衡器,通过精准的数据和技术算法,为每个作者提供公平和平等的出版机会,同时也能及时做出市场推广。作者也有更好的机会知道他们的作品是否具有传统出版的潜力,避免了将书稿发送给出版社和经纪人的艰难过程。
一本名为《畅销书密码》的图书于2016年在美国岀版。该书作者朱迪•阿彻和马修•L.乔克斯利用计算机分析了过去30年间出版的20000本小说文本,最后得出了畅销小说的2800个通行元素。这些元素包括小说的主题、情节、人物以及有关小说风格和设置的各种变量。当把这所有的数据汇集在一起,朱迪•阿彻和马修•L.乔克斯宣称他们的算法可以预测一本书是否能登上《纽约时报》畅销书排行榜,并称其预测的准确率可以达到80%o它将提供一个畅销小说的准则。[1]基于数据驱动的出版商Inkitt于2016年宣布与Tor Books公司合作出版由出版算法选出的第一部小说,试图证明出版业是一个基于数据驱动的过程,并尝试通过授权读者推动选择哪种类型的文献并以前所未有的方式向市场推出来改变行业。
实际上,美国出版商们并不认为算法本身能决定哪一本书成为畅销书,基于数据驱动的人工智能只是将传统的图书选择过程转变为科学的开始。脸书、推特等社交媒体创造了读者社区,并通过数据分析和统计发现现实生活中隐藏着的、有相似阅读倾向的读者群。这些数据再经过出版商的智能化整理与分析就变成了个性化的阅读倾向报告,图书编辑据此勾勒出读者心中理想的图书样本,进行前期策划。美国麦克米伦出版公司旗下的圣马丁出版社就由此逻辑发现摄影师布兰登•斯坦顿拍摄了很多纽约市井生活的照片并发布在多个社交媒体上,且粉丝众多,之后迅速与该摄影师达成了出版协议,将那些照片集结成册为《人在纽约》和《小大人》两本图书,两本书的销量都在出版一年时间内突破了42万册。[2]麦克米伦出版公司旗下的另外一家出版社法拉、斯特劳斯和吉鲁(BYR)出版社通过数据分析注意到杰西卡•希巴把她两岁儿子与宠物狗一同睡觉的一系列合照发布于个人博客,并嗅到其中商机,迅速与杰西卡签订了三本图书的版权协议,出版了系列畅销儿童图书《西奥与博的午睡时间》。人工智能的出现和应用使困扰美国出版商的选题策划有了明显改观,使出版业的内容生产走向精准化。这不仅保证了大众图书的市场契合度,降低了出版风险,而且最大限度地保障了市场效益。
人工智能对出版业的影响是无穷无尽的,其主要技能是利用机器去定义书中的元素,然后更好地理解并解读读者的需求,发现藏在数据中的消费市场,以帮助确定市场营销的重点。美国出版商充分利用人工智能技术,通过数据分析和读者反应识别和判断图书类型、风格和主题偏好,并及时跟踪读者的参与和响应,保证出版商可以打造出畅销图书。
2.尝试以人工智能进行内容创作
美国出版业已经开始尝试以机器学习知识帮助作者写作。他们开发了一个人工智能机器人尝试编写下一个《权力的游戏》,还开发了一个代码可以用来复制J.K.罗琳等著名作者的写作风格。[3]在基于内容分析的帮助下,人工智能帮助编辑获得比较成熟的作品,然后编辑再充分利用他们自己的才能进行超越计算机能力的创作过程。
作者工具是英特罗格(Intellogo)公司开发的一套网页基础上的人工智能工具。英特罗格公司专门聘请了一个文学专家团队来帮助作者工具理解什么是词汇和情感,以及内容和情感如何融合在一起。人工智能能够模仿出人的思想意识,也能够了解作者在写作时候的心思和意图。经过机器学习和训练之后,作者工具能够帮助作者更加深入地把握作品结构和逻辑关系,也能帮助作者在主配角关系、情节推进和情感变化中保持作者的一贯写作风格,由此达到帮助作者进行内容创作的目的。
另一家技术公司StoryFit为图书岀版提供人工智能见解和解决方案,其独特之处在于他们的数据和人工智能可以为图书创意、收购、开发和营销等各个出版环节的决策制定提供信息。该公司利用人工智能测量文本中的100000多个关键故事特征,并将其与数千本图书进行比较,产生可操作的见解和智能。传统的作者或故事讲述者可用的数据量很少,而由于人工智能的最新创新,机器现在可以量化情绪、语调、人格和个性等指标,也能够衡量和比较,为故事讲述者提供前所未有的丰富数据。[4]
人工智能还在塑造着美国学术出版的未来。由于充满大量的新发现和数据,科学家们越来越难以及时跟踪他们的研究领域,而人工智能算法是有效管理信息过载问题的一种解决方案。借助人工智能,美国学术出版商可以根据已发表内容和数据集创建新的作品,生成新的文本叙述或图书,并将现有文献建立实质性联系,进而得出新的结论。机器生成的书籍是由计算机算法自动生成的,该计算机算法从给定的数据库检索相关内容,并自动对其进行聚类,然后生成章节结构,并总结和解释最相关的文档。通过提供来自大量论文的聚类分析和结构化摘要,人工智能生成的图书对于任何有需要撰写文献综述或寻找研究主题的人来说都是一个很大的帮助。即使这种文本叙述有点笨拙并且可以轻易识别出是机器生成,它仍然加速了文献的消化过程。同时,如果需要进一步研究,读者还能从这种文本叙述中识别并点击潜在的原始来源,以便深入挖掘并进一步探索该主题。
3.优化评审与编辑过程
人工智能可以用于优化复杂的编辑过程。美国的人工智能技术已经能够达到在短时间内将一本书或期刊编辑完成,并改正其中的错误。IBM旗下一款名为“沃森”的人工智能就曾编写了一期杂志。该期杂志内容多样,不同的内容体现了沃森不同的分析功能,让人越来越相信技术能够改变世界。
在学术出版过程中,人工智能已经可以执行从寻找同行评审到数据制作的一系列功能。一是确定新的同行评审专家。大量学术研究没有足够的同行评审员来应对,人工智能可以从编辑可能没有考虑过的网络来源识别新的潜在评审专家,或创建自动评论,以减轻期刊的负担。二是打击剽窃。许多当前的抄袭算法都是逐字匹配的,使用同义词或释义可以挫败这些服务。然而,新的人工智能软件很像人类的思想,可以识别整个句子或段落的组成部分,更好地打击剽窃。三是报告错误。如果作者未能报告关键信息(例如样本大小),编辑需要就是否接受或拒绝论文做出明智的决定,那么编辑和审阅者应该了解这一点。新技术可以扫描文本以确保正确报告所有必要的信息。四是不良统计。如果科学家对他们的数据进行不适当的统计检验,这可能会导致错误的结论。人工智能可以确定最合适的测试,以获得可靠的结果。五是数据制作。人工智能通常可以检测数据是否已被修改,或者是否已生成新数据以达到预期结果。[5]六是内容编辑。人工智能已经可以从事对文章基本内容的编辑工作。
在未来,人工智能甚至可能会注意到新的研究项目和新的知识,并提出实验来扩展研究,实现完全自动化的出版决策和出版过程。统计评论家(StatReviewer)的创始人兼总裁查德威克•德沃斯一直在密切关注基于人工智能的同行评审和出版自动化的未来,包括该技术的其他潜在角色。[6]作为对学术文稿的统计和报告完整性进行自动审查的一款应用,统计评论家能自动扫描文稿,并根据期刊要求自动生成一份真正的同行评审报告。基于人工智能的自动出版将加速科学交流并消除人为偏见,发展成为极其强大的工具,并将使我们今天所挣扎的许多事情看起来微不足道。
4.助力图书推荐与营销
根据美国独立出版商贝雷特•科勒的报告,美国年出版新书超过100万种,同时市面上仍在流通的已出版图书还有1300万种。[7]这使得图书销售成为美国出版业面临的最大问题,且问题是双向存在的,出版商为图书找到合适的读者很困难,读者在图书海洋中找到合适的书也变得愈发困难。有人对来自美国各地的700名受过大学教育的读者进行了调查,以了解他们如何发现图书。受访者查找自己需要的图书的方法包括亚马逊、畅销书单、播客、书商或者朋友推荐等。但是很大一部分受访者表示,很难找到适合自己爱好和风格的图书,选到心仪书目的概率非常低。显然,图书发现的问题对作者、出版商和读者来说都十分重要,而这个问题又是凭借人力无法解决的。人工智能的出现使得美国出版业拥有了将图书与读者联系起来的工具。通过访问读者数据,图书营销变得更加简化和有效,有助于美国出版商识别读者的阅读偏好与模式统计。[8]
作为一个面向出版业的人工智能平台,Booxby旨在将原创内容与市场联系起来,使用机器学习解决图书发现的问题。通过机器学习,Booxby用一种全新的方式来帮助读者发现图书,即根据图书的文本分析来识别、量化和预测读者体验,以了解它们的全部市场潜力。利用这一尖端技术,Booxby希望扩大每位作家的独特声音,并将他们的作品推荐和引导给热切的读者。在这里,人工智能通过了解一本书的全部内容,发现它的市场潜力,构建一种新的推销机制,并提出购买建议,将图书和读者连接起来。这种推荐机制所依赖的数据不一定是消费者的购买记录,也不是仅仅将图书划分为哪一个类别,而是人工智能通过机器学习的方式理解读者,模拟一种类似于读者的意识,通过对每个读者的学习,为每个读者进行独特推荐。
上文提及的StoryFit公司也希望通过基于人工智能的内容洞察、受众洞察、市场适应性分析、竞争对手分析和营销分析来满足图书发现的需求,并将所有出版商的书目按照主题进行汇总和分类,以便直接面向消费者营销。它可以帮助多个领域的出版商提高生产力和效率,提高图书的可发现性和标题分类,跟踪关键的发展变化,促进图书销量。StoryFit与70多家出版商进行合作,他们分享了一个案例研究,其中包括十家出版商展示各种类型的关键词帮助提升销售。平均而言,他们展示的关键词提高了约34%的销售额。[9]早期,由于拥有数千个书目,图书出版商无法手动快速创建书目集合,而现在的机器自动化解决方案可以在几小时内精确处理1000个书目,提高书目的可发现性并提升销售额。
此类公司不胜枚举。书灯公司让机器学习分析文本内容,帮助读者寻找符合自己偏好的图书。轨道公司偏好用语言程序处理大量图书相关信息,通过收集图书特征的方法,使读者利用这些信息发现图书。英特罗格公司也借助机器学习,通过大数据分析图书内容和读者行为,掌握图书的主题、风格、节奏、情感以便更精准地向读者推荐图书。一方面,英特罗格的机器人可以根据图书的相关信息,24小时不间断地为读者针对性地推荐图书,并建立互动关系;另一方面,它还可以利用这些用户数据改善用户服务。值得一提的是英特罗格的机器人可以与用户对话,对用户提出的要求进行推荐,并说明推荐原因,客户不满意的话还可以在反复沟通中完善建议和要求,并在进一步的沟通中变得更加聪明和高效。
二、美国出版业人工智能应用的局限与挑战
虽然人工智能为美国出版业提供了一个更好获取读者注意力的机会,但并不能就此说明人工智能与出版业的融合是尽善尽美的,甚至存在诸多问题。已有很多智者提出建议,督促美国出版业对人工智能保持警惕,探索机器生成的出版内容的局限与挑战,注意解决人工智能对美国出版业的负面影响和潜在风险,并最终为人工智能在出版业中的应用提供一种可靠的发展框架。
首先是出版过程的非人化因素需要警惕。人工智能最大的缺陷之一是机器生成的内容可能被认为比人类创造的内容更可靠。与其他新兴技术类似,基于人工智能的内容质量很可能在一开始就不能与人类创造的内容相媲美,出版商与读者应该考虑到这一点。统计评论家总裁查德威克•德沃斯指出对待人工智能要谨慎,人工智能可以允许学术岀版过程的完全自动化,包括文章审查和发表决策,然而无人监督的人工智能确定科学研究方向的观点是我们必须警惕的一点。真正的发现应该是一个完全人类的想法,人类编辑和审稿人应提供什么是“重要研究”的想法,并确保基于人工智能的研究噪音被过滤掉。[10]人工智能还不能产生类似于涵盖全部范围的有意义的研究文章,作者或研究人员撰写的图书和论文将继续在美国出版业中发挥最重要的作用。未来的出版内容将以多种不同的方式创建,从完全由人工创建的内容到各种混合的人机文本生成,再到完全由机器生成的文本。可以肯定的是,人工智能技术能够帮助作者从头开始创建文本或部分文本,或者生成给定区域的数据驱动范围,然后人类可以对其进行重新编辑,最终成为作者的宝贵资产与成果。
再次是情感元素需要关注。人工智能工具可以帮助美国出版业更好地了解受众、市场和竞争对手,但他们不能在作者和读者之间产生情感纽带,这是机器无法生成的东西。有媒体对以后机器写小说的可能进行了嘲讽,认为机器感兴趣的是股票市场而不是人类的表情。尤其是如果每个人都依靠人工智能拥有了罗琳的写作风格,那么作者可能就需要重新考虑自己作品的差异性了。出版人麦克•谢智肯认为仅从一本书的内容来预测是否畅销,而不考量受众、品牌和营销等因素,实在有些荒谬。[11]为了获得真正的成功,美国出版商须合理利用智能工具的强大功能来做出更好的决策并贴近读者。人工智能不会把人类的工作带走,而是把人类变成了半人马。基于人工智能的内容创作或将激发人们的想象力,并激励作者写出更好、更有创意的故事。
对于美国出版业来说,最大的挑战是不要对人工智能过度兴奋,而应对人工智能的当前发展阶段保持透明,并解决潜在的局限和缺点,进一步改进技术以不断提高机器生成内容的质量水平。
三、美国出版业对中国出版业的启示
人工智能的开发与应用已对美国出版业造成巨大变化,而中国出版业对人工智能的应用尚处于比较初级的阶段。国务院《新一代人工智能发展规划》明确提出发展人工智能新兴产业,推进产业智能化升级。中国出版业应正视人工智能技术为出版业转型升级带来的机遇,迎接智能出版时代的到来,积极发展与构建人工智能的生态结构。
中国出版业与相关技术运营商应着力研发人工智能的关键技术,科学处理数据,让出版业与人工智能共舞。美国出版业对人工智能的使用基础是海量的相关数据,中国出版业应紧跟人工智能发展的潮流,做好数据储备,并将人工智能与数据科学处理结合起来。国内很多出版企业和技术企业都希望将数据处理转变为人工智能的发展机会,也进行了数字化转型升级,但是因为技术手段不足,尚未将人工智能与出版流程进行有效结合。观察人工智能在美国出版业中的应用可以发现,其技术研发者和出版商总是能找到准确的着手点,将人工智能应用于与书刊岀版的各个流程与环节,最后达到整体融合式发展。中国出版业亦应找到准确的发展方向,在将人工智能与出版业进行融合发展的过程中,将人工智能具体应用于书刊策划、编辑和营销等出版流程。国内目前的状况是人工智能技术主要掌握在技术运营商手中,传统出版企业大多仍在进行着传统的内容策划与出版,尚未将人工智能引入出版流程。中国出版业应注意和加强与人工智能技术运营商的有效结合,跟上人工智能发展的步伐。
同时,中国出版业与人工智能技术运营商亦应警惕人工智能泡沫,避免陷入浮夸怪圈,不能过分夸大人工智能对出版业的影响和对人类的替代。当前对人工智能的发展出现了很多惊人的说法,大多来自技术研发公司,其中往往有哗众取宠之嫌。即便美国IBM旗下的人工智能“沃森”也曾受到这样的质疑。中国出版业应从中获取教训,注意人工智能所产生的各种负效应问题并进行合理应对。
参考文献
[1][11]曾梦龙.有两个人用算法解开了畅销书的密码,据说能有八成准[EB/OL].(2016-10-04).http://www.qdaily.com/articles/32919.html?source=feed.
[2]魏雅雯.社交媒体环境下美国大众图书运营策略研究[D].保定:河北大学新闻传播学院,2017.
[3][6]Zsofia Macho.How publishers can utilise artificial intelligence(Al)[EB/OL].(2017-11-08).https://bookmachine,org/2017/11/08/publishers-can-utilize-artificial-intelligence-ai/.
[4][9]Molly Flatt.StoryFit offers AI insights to driv epublishers'decisions about books[EB/OL].(2019-04-17).https://www.thebookseller.com/futurebook/storyfit-offer-ai-insights-drive-publishers-decisions-about-books-992766.
[5]Chadwick C.DeVoss.Artificial intelligence applications in scientific publishing[EB/OL].(2017-05-03).https://blogs,biomedcentral.com/bmcblog/2017/05/03/artificial-intelligence-applications-in-scientific-publishing/.
[7]Steven Piersanti.The 10 Awful Truths about Book Publishing[EB/OL].(2016-09-26).https://www.bkconnection.com/the-10-awful-truths-about-book-publishing.
[8]Ali Albazaz.Artificial intelligence and the art of reader-drivenpublishing[EB/OL].(2016-07-25).https://www.thebookseller.com/futurebook/artificial-intelligence-next-great-publishing-tool-364226.
[10]Philippa Flemming.Is artificial intelligence the future of scientific publishing?[EB/OL].(2017-05-31).https://thepublicationplan.com/2017/05/31/is-artificialintelligence-the-future-of-scientific-publishing/.