业内信息

17国233位出版人前瞻 国际出版AI应用发展新象

2019-11-19 来源:中国出版传媒商报 渠竞帆
  关键词 人工智能 应用场景 语言模型

  近日,德国管理咨询公司Gould Finch与法兰克福书展在对17个国家的233位出版业人士进行调查后,发布了一份白皮书。受调查人群的平均年龄为41岁、平均工作时间为13年,他们普遍认为,人工智能(AI)将对出版业产生越来越大的影响。有25%的出版社在AI领域有投资,且该比例还呈现增长态势。

  如今,AI已经融入日常生活中,通过嵌入APP或网站的方式,发挥其在数据分析、流媒体内容推介以及个性化购物体验等方面的作用。与此同时,AI也进入出版领域,建立语言模型辅助文学创作,结合大数据进行个性化推荐,并在学术、教育和大众出版领域,呈现出更丰富的应用场景。

  面对众多发展机遇的同时,AI将给出版业带来哪些挑战?能否尊重出版市场文化特性,与出版业更好地融合?如何利用新技术实现出版业务优化从而加强核心业务能力?233位受访者的回答,勾勒出全球出版人对这一系列问题的实践和思考。

  20年后的畅销书将由AI创作?

  1956年,美国学者约翰·麦卡锡(John McCarthy)最早提出了AI的概念。目前AI领域的研究方向包括机器学习、自然语言处理、神经网络、模式识别、智能搜索等。这些技术在出版领域有着丰富的应用场景。

  在大众出版领域,面向作者和出版商开发的基于AI技术的工具,一方面帮助创作者收集资料,开展调研,建立故事情节发展的模型,对读者消费数据进行分析;另一方面,也可以帮助出版商分析收到的投稿哪些有可能成功。

  英国前律师兼投资人拉纳·迪奥里奥(Rana DiOrio)新创立的Creative Mint公司就在帮助出版商进行这样的探索。今年4月,该公司与初创公司StoryFit和技术公司Sourcebooks合作,运用AI技术,推出了一个类似葡萄酒评论家罗伯特·帕克(Robert Parker)为品酒创立的百分制评分体系,来评估图书内容。(下转第8版)

  拉纳表示:“我们想建立一种透明的体系,在评估后,得高分的内容可以进入出版流程并进行IP的培育和开发。”除了帮助新书出版做出决策,他们还对以前出版的图书运用算法进行分析,判断是否值得多媒介版权开发。她说:“我们要让闲置的IP发挥作用,焕发生机,这对作者和品牌持有人都是有益的。”

  为开发多媒介版权,拉纳还将区块链技术运用到业务中,来实现版权、视频和教育技术的授权交易,形成一个全面的产品开发策略。

  在美国,2013年启动的“全国小说生成月”(National Novel Generation Month,简称NaNoGenMo)每年11月举办,一两百位程序员和创新作家接受挑战,写出包含有5万字小说的代码,如电脑程序、专门的AI和数字工具,打通了新技术与写作融合的通道。这项比赛带动了大量小说创作工具的产生,也让作者的创作更加便捷。

  语言模型作为一种新型的AI工具,正在为作者创作提供强大的支撑。今年2月,加州的AI公司OpenAI推出了基于800万个网页制作的GPT-2语言模型,该模型运用机器学习技术,通过阅读和使用大数据模仿人类写作,并预测在一个写作范本里接下来要写什么。作者罗宾·斯隆(Robin Sloan)在该语言模型的基础上,用2年时间,收集100部幻想小说的数据,又制作出1000个幻想故事模板,为幻想小说作家创作提供丰富的素材。

  曾两次参加“全国小说生成月”的珍妮尔·谢恩(Janelle Shane)认为,“AI将作为一种越来越高级的工具被使用,而且用同一个工具,不同的作家会写出不同的作品。”她的作品得到了传统出版商的认可,她的新作《你看起来像个东西,我爱你》(You Look Like a Thing and I Love You)11月初刚在利特尔·布朗出版。

  专家认为,随着AI的发展,讲故事的人不仅能够触达一些新媒介,也能通过新技术与人们建立起情感的交流。这可以让出版社预估读者对故事的反应,给故事配以声音、背景和对话,让故事更加丰富。一项对300多位AI研究人员的调查更是给出了让人振奋的讯息:“20年后的畅销小说将由AI写出来,从‘全国小说生成月’这样的活动提前看到未来的雏形。”

  绘制画像 进行个性化推介

  在教育出版领域,出版商运用AI和大数据,可以对学生掌握知识点的情况、学习历程以及学习路径等作出画像,从而为学生提供个性化的推荐。

  目前,培生已开发出AI支持的数学导师、写作指南等教育产品APP。今年5月麦格劳-希尔与圣智合并后成立的麦格劳希尔,也提出未来3年将投资3亿美元用于自适应学习、AI、游戏化技术和学习测量工具等教育技术领域,为师生提供更有价值的内容。

  在学术出版领域,AI技术也有更丰富的应用。威立公司通过收购出版软件公司Atypon,运用AI技术,根据用户的使用行为和用户形象绘制用户画像,再对出版的内容进行实时整理,然后向用户个性化推介,并提供个性化的搜索结果。

  AI在学术出版领域的应用体现在以下几个方面。一是在内容生产环节,为作者提供更丰富的线上资源,辅助作者写作文章;出版商使用自然语言处理和机器学习技术实现校对流程的自动化,使用认知分析和智能测试技术分析资源的质量和适用性,建立编辑和作者对排版和写作喜好的数据集。流程自动化既可以让编辑专注于语言编辑,还可以降低出版社进行碎片化的成本,提取和组织有价值的信息,便于研究人员更准确地进行图片检索、对比和推介。目前AI已经可以自动生成摘要和元数据,有人在探索使用AI技术将科研数据直接生成一篇可读的文章。

  二是在同行评议环节,出版社运用AI和自然语言处理技术,提取原创性和关系图谱的关键术语,检查语言质量,识别剽窃,让论文与期刊和评审要求相匹配。AI可以帮助出版商检查作者投稿的完整性,评估是否适合在目标期刊上发表,减少人为偏见,找到适合的同行评审人,审核是否有利益冲突,处理作者、编辑和评审人之间的流程。

  三是智能算法可以帮助研究人员发现研究机构、趋势性的话题、该领域的合作者及评审,并对高影响因子的研究和新兴领域做出预测,还可以帮助出版商迅速发现一篇好文章,更好地做预算规划并减少从厘清版权到出版环节的成本。

  四是与欺诈性行为作斗争。通过基于AI开发的软件,可以用来进行文本分析、监测剽窃或错误的统计数据、找到新的同行评审以及进行内容和语义的搜索。AI可以比传统软件更精确地监测剽窃,还可发现数据或图像被恶意篡改、复制。

  五是增强内容的可见性和使用率,提供个性化的用户体验。如通过理解文件间的关系,增强推荐服务,提供个性化的内容提示,自动创建定制化内容集,与科研作者互动回答问题以及提供阅读书目。在增加可见性方面,智能机器学习算法能够让文章标签制作者准确地标注并识别错误的标识,从而让出版商进行合理分类,再使用NLP从内容中提取关键词组,改善内容的类别管理并进一步提高可见性。

  版权等问题引发隐忧

  AI在流通环节也在展现更重要的应用场景。欧洲电子书及有声书发行商Bookwire 2018年推出一系列基于AI的工具,实现图书的自动定价和书内营销。具体讲,就是对不同时段的销售数据进行比较,给出不同促销期的建议零售价,并在电子书中根据图书相似性和用户喜好自动嵌入相关推介,让销售及营销环节更加优化,图书销售实现大幅增长。

  在机器学习技术的支持下,越来越多的公司开始使用聊天机器人,在消费者浏览网站时,同时与数千位消费者互动。回答消费者经常提出的问题,并根据消费者反馈进行产品推荐和个性化资讯推送。还有很多人在使用AI为Z世代(又称网络世代、互联网世代,统指受到互联网、即时通讯、短讯、MP3、智能手机和平板电脑等科技产物影响很大的一代人)创建碎片化内容和新故事,就像音乐流媒体平台Spotify那样,通过互动问答及消费者跟踪技术分析用户听歌的行为,为用户提供个性化歌单。

  但AI也引发了不少担忧:它会带来一些岗位员工失业现象。另外,根据AI语言模型写作的AI小说,谁将拥有版权,也没有定论。专家预测,未来出版社的机遇在于,在更大的文本基础上训练AI,生成语言模型,那时出版社会需要程序员和百万计的大数据。

  总体来看,出版企业在与AI融合的过程中若想成为受益者,离不开以下几方面:首先要找到值得信赖的商家进行合作,在公司自上而下的整个层面应用AI技术;二是培训或招聘懂AI技术的人才,形成一支由高级数据科学家带领的队伍;三是将所有的新旧数据进行储存和分析,从而扩大数据数量,提高数据分析的精准度。毋庸置疑,AI在改善用户关系、提升工作流程和服务以及创建新的商业机会方面,将展现出广阔的发展空间。

国家广播电视总局 | 湖北省人民政府 | 中国邮政集团公司 | 武汉市人民政府 | 中国期刊协会 | 中国图书进出口(集团)总公司 | 中国邮政集团公司报刊发行局 | 湖北省广播电视局 | 湖北日报传媒集团 | 长江广电传媒集团 | 长江日报报业集团 | 知音传媒集团 | | 湖北中图长江文化传媒有限公司 | 决策信息网 | 湖北新闻出版广电传媒周

copyright(c) 2013 湖北省新闻出版局 版权所有 技术支持

鄂ICP备19004605号-4  鄂公网安备 42010602004016号