【作 者】杨鸿瑞:中央财经大学;万岩:北京邮电大学
【摘 要】当前,我国出版业正向数字化、网络化、智能化出版转型,传统出版与新兴出版融合发展的新生态正在重构。文章从智能化引领角度出发,结合出版工作特点,分析人工智能与我国出版业融合的现状,研究人工智能在创作编审、出版制作以及知识服务等方面的融合应用,指出出版融合新生态建设过程中的主要问题,并提出相应的对策。
【关键词】智能化;出版;融合;新生态;
2019年3月16日出版的《求是》 杂志, 发表了习总书记题为《加快推动媒体融合发展构建全媒体传播格局》 的重要文章, 文章强调要推动媒体融合向纵深发展, 运用信息革命成果, 加快构建融为一体、 合而为一的全媒体传播格局。2019年5月16日, 国际人工智能与教育大会在北京召开, 习总书记在致大会的贺信中指出, 人工智能是引领新一轮科技革命和产业变革的重要驱动力。 2015年4月, 国家新闻出版广电总局和中华人民共和国财政部联合发布的《关于推动传统出版和新兴出版融合发展的指导意见》 指出: 坚持以先进技术为支撑、 内容建设为根本, 充分运用新技术创新出版方式、 提高出版效能。 有了顶层设计, 出版业就能充分利用新兴技术推动传统出版转型升级, 重构出版融合新生态,为我国由出版大国向出版强国加速迈进注入强大动能。
一、 人工智能与我国出版业融合现状
现阶段我国人工智能与出版业的融合, 主要体现在出版教育、 出版物生产等领域, 已取得了较好的社会效益和经济效益 [1] 。
一是在出版教育上, 人工智能不仅打造了数字化教育模式, 扩充了数字化教育资源, 解决了传统教育资源不足、教学时空受限和反馈不及时等问题, 还可以提供陪伴式教学。 例如, 中国大地出版社于2018年初启动了智能教育人工智能研发工作, 同年6月 在第二届中国新闻出版智库高峰论坛上发布了第一款科普人工智能“小悠” 并进行路演。
二是在出版生产上, 人工智能可以基于数据分析结果自 动生成内容文本, 实现新闻、 网络小说和舆情分析报告等出版产品的写作, 提高内容生产效率 [2] , 如腾讯的 Dream Writer、 新华社的“快笔小新” 和今日头条的“张小明” 等。
三是在知识服务方面, 人工智能加速推进专业化知识服务平台建设, 有效聚集了专业领域数字内容资源, 推动国家知识服务体系建设。 从2015年开始, 原国家新闻出版广电总局就启动了专业数字内容资源知识服务模式试点工作, 确定部分新闻出版单位、 大学和科研院所作为专业数字内容资源知识服务模式试点单位。
总体来看, 人工智能在我国出版业的应用还处于探索和试点阶段, 出版过程中的选题策划、 内容创作、 编辑加工、 出版发行等环节主要还是以传统方式为主。 当前我国出版主要面临以下问题: 一是随着出版资源的不断堆积, 从海量资源中人工选择出版主题和内容越来越难; 二是随着互联网时代的来临, 读者对知识的时效性和出版周期的要求越来越高, 传统的人工创作模式无法适应新的要求; 三是编校流程烦琐, 编校是保证出版质量的重要环节, 传统编校过程需要人工反复仔细阅读勘误。
二、 以智能化引领出版融合新生态
人工智能与大数据、 移动互联、 5G等技术的深度融合,不但改变了出版工作方式、 工作内容和生产流程, 还极大地推动移动阅读、 在线教育、 知识服务、 电子商务等新业态的发展, 从而改变了出版生态。
1. 人工智能引领未来采编模式
(1) 文稿自动编写
随着自然语言处理技术的发展, 计算机对文字的处理能力也达到了一个新的层次, 文稿的自动生成就是其中之一。 通过对重要法规、 著作、 标准、 年报等进行语义分析和快速摘要, 人工智能可以实现自动编写和辅助编写, 从而提高文稿编写效率。
目前文稿生成技术主要通过机器学习实现: 一是通过生成对抗网络中的生成器网络与强化学习技术相结合, 构建基础文稿生成模型, 设计“相似度得分” 指标来衡量文稿生成的质量 [3] ; 二是利用循环神经网络自动学习重要法规、 著作、 标准、 年报等语义表示, 并依据“评分函数”自动计算上下文的关联性 [4] 。
国际上, 美联社已经实现了 季度财报出 版自 动化。此前, 美联社新闻记者每季度只能人工创作约300篇财报稿件, 数以千计的上市公司财报无法及时撰写。 引 入Wordsmith自动化写稿程序之后, 美联社的财报类新闻报道便实现了自动规模化生产, 每季度生产的财报稿件数量在3700篇以上, 约为原来的12倍 [5] 。
(2) 智能翻译
为了尽快抢占市场, 出版企业对翻译的时效性需求迫切, 而智能翻译为图书多语言同步出版提供了可能。 谷歌推出的AutoML Translate测试版, 允许用户利用自己的文字或语言数据在谷歌的神经网络机器翻译系统训练定制化机器翻译模型, 实现了个性化的用户需求; 并且随着训练次数的增加, 翻译效果会逐步提高 [6] 。 2017年, 韩国政府办公厅表示, 基于神经网络翻译技术, 可将韩国历史上著名的朝鲜王朝机密记录《承政院日记》 中的中文翻译成韩文。 这一目标如果实现, 将成为世界上首个利用人工智能技术实现中文古典文献翻译的实例 [7] 。
当前, 智能翻译正朝着人与人的沟通方向发展, 目标是从“语调+声音” 里听懂人的语言。 智能翻译技术的成熟, 将为出版机构与读者、 客户之间的沟通互动提供更好的支持平台。
(3) 评审助理
目前, 出版业主要依靠人工进行编辑审核, 不仅效率较低, 而且容易漏审。 运用人工智能技术, 可以基于海量词汇和机器学习构建自动纠错系统, 自动发现和识别稿件中存在的质量问题, 从而提高编审效率。
计算机辅助评审已经在不少发达国家得到普遍应用。丹麦的论文及专利在线搜索平台UNSILO在2018年法兰克福书展上展示了一套自动检查系统, 该系统能与信息数据分析机构Clarivate Analytics旗下的同行评审平台Scholar One一起, 帮助编辑或作者实时评估新提交的作品内容 [8] 。UNSILO还具有自动寻找同行评审员的功能, 通过人工智能技术分析新的手稿, 与PubMed Central 学术数据库中提供的超过2900万篇文章作者进行比较, 确定5位最合适的潜在同行评审员 。
一般来说, 基于人工智能的文稿评审辅助系统应具备三种功能。 一是启发性。 在文稿评审过程中, 系统应能依据基本的规则事实进行推理, 对文稿中的错误与疏漏进行判断, 决定是否通过。 二是透明性。 通过文稿评审的结果了解规则的内容和推理思路, 从而与系统进行交互。 三是灵活性。 在文稿评审过程中, 新的审核过程、 审核结论等能扩充到现有的知识库, 进而不断提高文稿评审效率。
(4) 敏感信息智能化识别与排查
公开出版的文稿资料可能会涉及国家秘密、 商业秘密、 第三方权益和个人隐私等敏感信息, 因此, 加强敏感信息管理是新闻出版工作的重要任务。 基于人工智能的敏感信息排查系统一般具有智能语义分析功能, 以及根据监管需要进行实时词库更新和自定义规则等功能。
国内外已有较为成熟的敏感信息排查系统, 如美国纽约Text IQ公司的产品使用深度学习技术将自 然语言处理和图模型结合起来, 能提高识别文本数据中敏感信息的准确率 [9] ; 华为云旗下EI企业智能模块提供的Moderation(Text) 可以基于深度学习和内容审核模型, 能自 动识别文本中出现的涉政、 涉黄、 广告、 辱骂、 灌水等内容, 帮助新闻出版企业降低业务违规风险, 净化网络环境, 提升用户体验 [10] 。
2. 人工智能引领未来出版新形态
(1) 智能插图和文稿多维展示
将内容丰富的图书以图文并茂的形式展示给读者, 也是满足人们更高的文化消费需求。 在文稿展示上, 人工智能技术主要应用于两个方面。
一是文档信息可视化。 利用人工智能技术可以从海量数据库中快速找到相关数据, 在短时间内生成可视化图表。 2016年, 路透社宣布与语义技术公司Graphiq合作,将一些报告从新闻稿的形式转化为图像化数据。 Graphiq公司拥有财经、 体育、 娱乐等领域的海量数据, 可以利用人工智能技术抓取数据并生成与报道内容相匹配的可视化图表, 以增强报道的吸引力。
二是感官体验直观化。 人工智能与VR技术的结合, 使得传播空间由三维扩展到四维, 从而给受众带来更加直观的感受, 也使得文稿的可信度大大提升 [11] 。 受众可以利用VR/AR技术, 在电脑、 手机上真实还原新闻现场, 取代单调地阅读文稿的过程。
(2) 智能排版
为了带给读者更好的阅读体验, 出版物不仅要有良好的可读性和较强的信息表达力, 还要有美观的版面。 人工智能在这一领域有显著的优势。 人工智能根据需要展示的内容, 可以从已有数据中学习各个版块的大小、 形状, 进而推断整体排版以及各个版块的内容布局。 智能排版大大减轻了人工排版的工作量, 特别是对时效性要求较强的新闻出版单位而言, 智能排版的作用更加突出。
目前, 一些自动化图文排版系统已经在市场出现, 如WPS墨斗AI办公系统可以通过软件自 动排版和美化版面,还可以生成整齐优雅的幻灯片, 实现智能插入图片、 图表等功能 [12] 。
3. 智能化文字、 语音及图像处理助力数字多媒体产品制作
计算机文字、 语音与图像处理等是人工智能应用较为成熟的领域, 目前已有大量商业化产品, 其在数字出版中也将发挥越来越重要的作用。
(1) 计算机文字识别
在出版工作中, 随着数字出版的普及, 大部分文稿都是以电子形式存在, 但需要对各种手稿、 古籍进行重新编纂出版时, 计算机文字识别技术将发挥重要作用。 2015年,富士通研究所利用人工智能技术, 在世界范围内首次开发出识别率达96.7%的手写文字识别技术 [13] 。
(2) 计算机语音处理
计算机语音处理技术不仅可以将创作作品以文字、 语音等形式展现, 实现新闻采访录音向文字稿件快速转化,还可以用于智能客服等领域。 目前, 计算机通过学习, 已经能非常熟练地听懂不同国家的语言甚至方言, 在模仿人类发音方面几乎能达到以假乱真的水平。
(3) 计算机图形图像处理
在新闻出版中, 计算机可以利用人工智能技术对大量图片、 视频进行分类及特征提取等处理, 对图片或视频中的人物、 物体、 场景等进行识别, 并协助采编人员进行后期加工。
人类认识了解世界的信息绝大多数来自视觉, 目前人工智能技术的重要分支— 计算机视觉在文字识别、 图像处理、 生物识别等方面取得了较大进展。 计算机视觉技术通过对三维世界中所感知的二维图像进行处理, 形成三维实体的特征, 其终极目标是像人类一样识别现实世界中的视觉信息。 届时, 人工智能技术将引领出版业给广大读者带来更加丰富多彩的产品和感受。
4. 人工智能引领知识出版向知识服务转变
知识服务是充分利用人工智能、 大数据、 移动互联等现代信息技术, 以用户为目标驱动的服务。 传统的知识出版只关注是否向用户提供他们所需的知识信息, 而知识服务则关注和强调利用出版业独特的知识和能力, 对现成文献进行加工形成新的具有独特价值的信息产品, 进而为用户解决问题。 因此, 借助人工智能、 大数据、 移动互联等新兴技术手段, 可以实现按需出版、 高效传播、 精准服务以及提供多样化的产品。
(1) 按需定制
运用人工智能分析市场上已有的出版数据、 读者阅读数据等, 结合当下热点和出版目标, 不仅可挖掘和发现市场潜在需求, 并形成初步方案给编辑构思选题做参考, 还可以对出版题材和内容做精准选择, 构建出版单位的素材库等储备资源 [13] 。 同时, 人工智能通过大数据挖掘和智能客服系统, 可分析目标客户的知识需求、 消费需求和阅读偏好, 制定合理、 差异化的出版品种, 实现出版物或用户需求的按需制作。
(2) 高效传播
满足用户阅读喜好和差异、 实现高效传播, 是出版业传播知识的一个着力点。 一是运用大数据、 人工智能等先进技术手段, 收集读者阅读时间、 内容、 时长、 渠道、 偏好和习惯等多种信息, 以实现出版内容多渠道分发, 达到高效的传播效果; 二是通过智能客服与用户互动, 了解用户个性化需求, 实现点对点传播。
(3) 精准服务
在知识服务模式下, 出版业的广告式营销将变为服务式营销。 一是人工智能与移动互联、 区块链等技术结合,能在知识服务消费、 结算管理和出版供应链管理等方面发挥更安全、 快捷的作用; 二是人工智能技术与移动互联和5G技术结合, 使出版企业从广告式营销变为点对点精准营销, 既能让出版企业深入了解用户和用户需求, 也能让用户深入了解出版企业及其提供的知识服务内容。
5. 人工智能造就复合型编辑
出版企业由知识出版向知识服务转变的关键在于角色的转变, 其中编辑角色的转变是核心。 现代编辑要以用户需求为中心, 既懂内容创作又懂互联网产品设计, 具有内容生产能力、 技术应用能力和客户服务能力。由于内容生产与传播、 服务紧密结合, 出版融合不再是传统高度分工下的单兵作战, 而是高度协同的团队化运作。 新型组织架构将打破传统出版在内容、 技术、 市场等方面的壁垒, 融合出版人才被赋予产品经理的角色, 兼具内容生产力、 技术应用力以及市场运营力, 以产品视角对出版物的全生命周期负责 [14] 。
三、 智能化在出版融合过程中存在的问题及应对策略
1. 对新兴科技带来的行业变革认识不足
人工智能等新兴科技的普及应用, 给出版业的创作模式、 传播方式以及经营策略、 管理流程等带来巨大影响,出版业面对的客户、 市场、 风险、 供应链、 监管环境等都将发生改变。 出版业要想在竞争激烈的市场中立于不败之地, 必须适应新技术带来的变革, 积极调整组织架构, 深化管理机制改革。
2. 版权形态复杂涉及伦理和法律问题
人工智能已经可以创作诗歌、 新闻等作品, 但这些创作需要利用人类的大量作品数据进行学习, 创作过程也可能会存在抄袭、 模仿, 以及涉及他人隐私、 侵犯他人权益等问题。 目前, 人工智能创作作品的著作权归属在我国法律法规中仍处于空白状态, 写作机器人虽是作者, 但并非自然人, 不享有著作权。
此外, 许多优质作品出版后容易遭到网络自媒体“拆书”“洗稿”, 进行非法传播, 严重损害作者和出版机构利益。 而出版单位缺乏有效的版权保护路径和方法, 维权成本极高。
3. 缺乏复合型出版人才
为了适应人工智能等新兴科技带来的行业变化, 出版企业必须拥有一大批既懂出版专业知识, 又熟悉新兴科技的复合型人才。 出版业属于知识密集型产业, 要积极利用人工智能等新兴科技, 发挥其在选题策划、 创作编辑、 知识服务、 吸引读者等方面的巨大作用。 当前, 国内不少出版企业存在出版融合团队建设不专业、 复合型人才储备不足, 甚至人才被其他行业挖走等问题。
4. 应对策略
一是加强体制机制创新, 建立出版技术创新联盟。 出版企业要联合金融机构、 科研院所等相关行业, 建立以市场为导向、 产学研相结合的技术创新体系, 引导和支持创新要素向出版业聚集。 人工智能等新兴科技是极富挑战性的学科, 出版企业要往有利于掌握核心技术和自主知识产权、 有利于形成产业技术创新链的方向重点突破。
二是完善制度体系。 当前, 人工智能技术落地和成熟尚需时日, 牵涉的法律规范还有待完善。 出版企业要注重知识产权的界定和梳理, 合理合法使用新兴科技, 为新兴科技的普及推广提供制度保障。
三是积极发挥政府协调引 导作用和企业的主观能动性。 政府要进一步加大对包括出版业在内的新兴产业的政策扶持, 支持出版业顺利完成在新兴科技条件下的战略转型, 为我国出版企业走向世界奠定基础。 同时, 出版企业不仅要顺应包括人工智能技术在内的新兴科技带来的变革, 积极转变发展理念; 还要重点培养既懂出版业务又懂新兴科技的复合型人才, 为出版业的数字化、 智能化转型提供强有力的智力保障。
四、 结语
虽然人工智能具备一定的逻辑、 演绎、 推理、 事务分析等理性抽象思维能力, 在数据处理、 复杂计算、 办事效率等方面具有巨大优势, 但是涉及情感、 灵感、 审美等方面的能力还远远无法与人类相比。
出版工作中, 人工智能技术运用于外文翻译或文学创作时, 对复杂的语言处理往往会存在偏误, 难以处理文字背后的思想、 情感等相关内容。 因此, 人工智能目前只是协助人类做一些简单的工作, 使人类可以抽出精力从事更复杂和高难度的工作。
出版业的发展对社会进步起着极其重要的作用, 出版物凝结了人类的思想和智慧, 出版的历史就是人类文明的历史。 出版业的发展始终离不开先进技术的支撑, 从古代的活字印刷到现代的数字出版, 科技与出版的融合是出版人探索的永恒主题。 近年来, 包括人工智能技术在内的新兴科技的迅猛发展, 正深刻改变人们的生活和生产方式。出版业作为典型的知识密集型产业, 人工智能技术也将对其发挥重要的作用。
参考文献
[1]姜春辉.人工智能技术与出版的融合探析[J].出版广角,2018(3):59-61.
[2]武菲菲.人工智能技术与出版行业的融合应用[J].出版广角,2018(1):26-28.
[3]孙博.基于生成对抗网络的文本自动生成方法研究[D].哈尔滨工业大学硕士学位论文,2018.
[4]梁健楠,孙茂松,矣晓沅,等.基于神经网络的集句诗自动生成[J].中文信息学报,2019(3):126-135.
[5]余旻佳.AI如何为媒体赋能——美联社的人工智能创新探索带来的启示[J].传媒评论,2018(11):54-56.
[6]舜禹环球通.谷歌发布AutoML,机器翻译系统可以定制了[EB/OL].(2018-08-10)[2019-07-20].http://www.sohu.com/a/246367268_488431.
[7]马钰荟.国外档案新闻集萃[J].中国档案,2017(4):70-73.
[8]Douglas Heaven.AI Peer Reviewers Unleashed to Ease Publishing Grind [J].Nature,2018,563(7733):609-610.
[9]Text IQ.A Machine Learning Platform for Parsing Sensitive Corporate Data[EB/OL].(2019-06-12)[2019-07-20].https://www.textiq.com/.
[10]华为云.内容审核-文本Moderation(Text)[EB/OL].https://www.huaweicloud.com/product/textmoderation.html.
[11]栾轶玫.人工智能在固态传播中的媒体赋能——以2018年全国两会报道为例[J].新闻与写作,2018(4):36-39.
[12]马荣.人工智能加持WPS全面升级文档办公体验[EB/OL].(2018-07-04)[2019-07-20].http://news.zol.com.cn/692/6927653.html.
[13]36大数据.通过利用模仿人类大脑工作原理的人工智能技术,汉字手写文字识别率达到96.7%[EB/OL].(2015-10-20)[2019-07-20].http://www.cbdio.com/BigData/2015-10/20/content_3994080.htm.
[14]田杰.按需出版的发展路径探析[J].科技与出版,2013(10):95-97.
[15]向安玲,沈阳.基于大数据的出版流程变革[J].出版广角,2014(14):54-57.